当前位置:首页 > 编程开发 > Python > 正文内容

dataframe踩坑笔记(2):表格合并、拼接

Codefans1年前 (2023-02-06)Python805

1. 表格简单合并

1.1按行合并(上下合并):


import numpy as np
df1= pd.DataFrame(np.random.randn(4),columns=["a"])  
df2= pd.DataFrame(np.random.randn(4),columns=["b"])

df3=pd.concat([df1,df2],axis=0)

fc58eee6df6149fdb5b3160cf7d37e14.png

df4=pd.concat([df1,df2],axis=1)

91b9730f359c44909a7ebef30ded9953.png

如果两个dataframe长度不一致,缺少的部分用nan补齐:

df2= pd.DataFrame(np.random.randn(6),columns=["a"])

a5444c4fe49e472e804ce9843ccdf282.png

df4=pd.concat([df1,df2],axis=1)

d7dae0bad7b14dd29f41738ed0eb0c13.png


2. 按某一列作为索引拼接:

方法1为简单粗暴的合并,两个表格之间没有共性,如果两个表格存在相同部分,需要根据某一列作为索引进行合并,需要用到pd.merge()函数,内容比较多,参考这篇文章。

代码格式如下:


pd.merge(left, right, how='inner',on=None, left_on=None, right_on=None,left_index=False, right_index=False, 
  sort=False, suffixes=('_x', '_y'), copy=True, 
  indicator=False, validate=None,)

一般用到left, right, how='inner',on=None, left_on=None, right_on=None,left_index=False, right_index=False, suffixes=('_x', '_y')比较多,需要指出的一点是:括号里面的left也可以拿出来,变成left.merge(right)


扫描二维码推送至手机访问。

版权声明:本文由图慧网发布,如需转载请注明出处。

本文链接:http://www.tuh8.com/index.php?mod=mall&act=view&id=54

分享给朋友:

“dataframe踩坑笔记(2):表格合并、拼接” 的相关文章

pandas 利用to_excel一次生成多个sheet到一个文件中

在 Pandas 的 to_excel 方法中,可以通过传递参数 sheet_name 来指定生成的 Excel 中的工作表的名称。如果需要生成多个工作表,可以在 sheet_name 中传递一个列表,其中的每个元素即为每个工作表的名称。例如,以下代码生成了一个包含两个工作表的 Excel 文件:i...

Python中 pandas 数据处理常用函数与方法的详细介绍

数据读取和写入pandas.read_csv(filepath_or_buffer, sep=',', header='infer', names=None): 从 csv 文件中读取数据,返回一个 DataFrame 对象。其中 filepath_or_buffer...

Python requests库中几个常用方法的使用示例

GET请求GET请求是requests库中最常用的请求方法,它用于获取指定URL的资源。以下是一个GET请求的示例:import requests url = 'https://www.baidu.com' response = ...

python requests库使用详细教程

Python 中的 requests 库是一个简单易用的 HTTP 请求库,支持多种请求方法、多种参数设置、并且使用广泛。本文将详细介绍如何使用 requests 库发送 HTTP 请求。安装使用 pip 命令进行安装:pip install requests导入在编写 Pyth...

Python pandas库159个常用方法使用说明

Pandas库专为数据分析而设计,它是使Python成为强大而高效的数据分析环境的重要因素。一、Pandas数据结构1、import pandas as pdimport numpy as npimport matplotlib.pyplot as plt2、S1=pd.Series([‘a’,’b...

Python调用JS的四种方法

Python调用JS的四种方法1、PyExecJS 方法1)、安装PyExecJS2)、 `PyExecJS 示例`2、PyV8 方法1)、安装PyV82)、 `PyV8 示例`3、js2py 方法1)、安装js2py2)、 `js2py 示例`4、selenium 方法1)、安装selenium2...