从《Python数据分析案例教程》中_领悟数据和Python的魅力

从《Python数据分析案例教程》中_领悟数据和Python的魅力_6.2.2 数据的级联

admin 295 2023-10-25

【摘要】本书摘自《Python数据分析案例教程》一书中第6章，第2节，由万念斌、肖伟东、叶丰标编著。

6.2.2 数据的级联

Pandas提供了concat()方法，它可以沿着某个轴将多个对象堆叠在一起(即将 Pandas 对象沿指定轴连接),concat()函数原型为：

pandas.concat(objs,axis=0,join='outer',join axes =None,ignore index=False, keys=None,levels =None,names =None, verify integrity = False,sort = None, copy = True)

常见参数的作用如下：

从《Python数据分析案例教程》中_领悟数据和Python的魅力_6.2.2 数据的级联

(1)objs:对象，可以是Series、DataFrame对象或 Series的映射。如果传递了dict,则排序的键将用作 keys参数，除非它被传递，在这种情况下，将选择值。任何无对象将被静默删除，除非它们都是 None, 在这种情况下将引发一个 ValueError。

(2)axis:要连接的轴，值为{0,1,…},默认为0。

(3)join:连接类型，值为{'inner','outer'},默认为'outer',即如何处理其他轴上的索引。

(4)join axes:连接轴，值为索引对象列表。

(5)ignore index:忽略索引，布尔值，默认 False。如果为 True,则不使用连接轴上的索

引值。生成的轴将被标记为0, …,n-1。

(6)keys:键，值为 Series,默认值为 None。使用传递的键作为最外层构建层次索引，如果设为多索引，应该使用元组。

(7)levels:用于构造多索引的级别，值为序列列表，默认值为 None。

(8)names: 层次索引中级别的名称，值为 list,默认值为 None。

(9)verify integrity:验证完整性，布尔值，默认值为 False,检查新连接的轴是否包含重

复项。

(10)sort:是否排序，布尔值，默认值为 None。

(11)copy:是否复制，布尔值，默认值为 True。如果为 False,不复制数据。

【案例6-5】将两个 DataFrame 数据堆叠在一起，级联成一个 DataFrame 。代码如下： # coding:utf-8

import pandas as pd

def main():

left=pd.DataFrame({

'id':[1,2,3,4,5],

'Name':['Wang','Zhang','Chen','Wu','Liu'],

'subject id':['stul','stu2','stu4','stu6','stu5']})

right =pd.DataFrame(

{'id':[1,2,3,4,5],

'Name':['Zhao','Li','Huang','Fang','Zheng'],

'subject id':['stu2','stu4','stu3','stu6','stu5']})

print("左边的数据帧".center(40,'='),"\n")

print(left)print("右边的数据帧".center(40,'='),"\n")

print(right)

print("数据级联".center(20,'='),"\n")

rjoin=pd.concat([left,right],ignore index=True)

print(rjoin)

if name ==" main ":

__ __ __ __

main()

,程序运行结果如下：

D:\anaconda\python.cxc C:/Uscrs/dcll/PycharmProjccts/My01/教学设计5--Pandas合并与级联/ 数据级联 casel.py

左边的数据帧=

0 1

1 2

2. 3

3 4

4 5

Name

Wang

Zhang

Chen

Liu

subject id

stul

stu2

stu4

stu6

stu5

右边的数据帧=

Name

Zhao

Huang

Fang

Zheng

subject id

stu2

stu4

stu3

stu6

stu5

数据级联=

id Name subject id

Wang

Zhang

Chen

Liu

Zhao

Huang

Fang

Zheng

stul

stu2

stu4

stu6

stu5

stu2

stu4

stu3

stu6

stu5

Process finished with exit code 0

【案例6-6】现有某公司2013年仓库的出/入库数据文件 company.xls (图6-1),需要按领用部门分类汇总统计第四季度(即10—12月)出库总量。代码如下：

import pandas as pd

def main():

excel 如何创建数据透视表-英雄云拓展知识分享

295 2023-10-25

从《Python数据分析案例教程》中_领悟数据和Python的魅力_6.2.2 数据的级联

Excel中把表格数据一列分为多行多列的操作方法-英雄云拓展知识分享

excel 如何创建数据透视表-英雄云拓展知识分享

Excel表格中数据透视功能处理重复数据的方法-英雄云拓展知识分享

最近发表

热评文章

CRM系统很重要吗？-企业客户关系管理中的重要性及其

WPS2012版本中为何看不到之前用的插件-英雄云拓

客户关系管理的核心是什么？-以客户为中心，提升企业竞

excel剪切、复制和粘贴操作，使它们不会破坏已设置

ChM格式文档处理利器：5款免费软件-英雄云拓展知识

WPS怎样制作文字打字机效果的动画?-英雄云拓展知识

热门标签