python进行数据合并concat/merge

目录

前言:

两个表中的数据,要根据关键字段,进行合并。
在Excel中可以使用vlookup的方式,在python中可以使用concat或者是merge的方法。

1、pd.concat

pd.concat 函数:

  • 拼接的对象可以是series,还可以是dataframe
  • 拼接对象的个数不受限axis 控制拼接方向(既支持上下拼接,也支持左右拼接)
  • 左右拼接 axis=1,左右拼接的依据是行索引;上下拼接 axis =0 ,拼接依据是列名,默认是上下拼接
  • join 指定拼接方法
    • join=“inner” 内联,表示保留两个表共有的行索引
    • join=“outer” 外联,表示保留两个表所有的行索引,默认外联
#导入需要的包
import pandas as pd
#创建需要的数据集:产品表
dict1={\"产品编号\":[\"CP13\",\"CP14\",\"CP15\",\"CP16\",\"CP17\"],\"产品名称\":[\"产品A003\",\"产品A004\",\"产品A005\",\"产品A006\",\"产品A007\"]}
df1 = pd.DataFrame(dict1)
df1

python进行数据合并concat/merge

#创建需要的数据集:详情表
dict2={\"订单编号\":[\"20220913\",\"20220914\",\"20220915\",\"20220915\"],
       \"产品编号\":[\"CP13\",\"CP14\",\"CP15\",\"CP16\"],
       \"产品销量\":[13,24,45,32],
       \"负责人\":[\"张三\",\"赵六\",\"李八\",\"李八\"]}
df2 = pd.DataFrame(dict2)
df2

python进行数据合并concat/merge

pd.concat([df1,df2])#默认上下拼接,拼接依据是列名;默认外联,保留两个表都有的索引信息

python进行数据合并concat/merge

pd.concat([df1,df2],ignore_index=True)#重置行索引

python进行数据合并concat/merge

#左右拼接的依据是行索引  axis默认是0上下拼接,1为左右拼接;默认外联(join = \'outer\')
pd.concat([df1,df2],axis=1) 

python进行数据合并concat/merge

#join指定了拼接方法,内联,表示保留两个表共有的行索引
pd.concat([df1,df2],axis=1,join=\"inner\") 

python进行数据合并concat/merge

2、 df.append

和concat上下拼接的结果类似

df1.append(df2) 

python进行数据合并concat/merge

3、 pd.merge()

  • 拼接对象是dataframe或者series,左表必须是datafram
  • 拼接的数量只能是两个
  • 拼接方向只能左右拼
#left_on写左表进行拼接的字段,right_on写右表要进行拼接的字段
pd.merge(df1,df2,left_on=\"产品编号\",right_on=\"产品编号\",how = \'right\')
#若两表拼接字段名完全一样,可写一个on
pd.merge(df1,df2,on=\"产品编号\")

python进行数据合并concat/merge

4、 df.join

和concat左右拼接的结果类似

df1.join(df2, lsuffix=\'_b\', rsuffix=\'_a\')

python进行数据合并concat/merge

总结

python进行数据合并concat/merge

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容