ad

打开《Python 可视化数据分析》_学会挖掘大数据的价值_4.4.2 Excel 格式数据读取

网友投稿 143 2023-11-13

【摘要】 本书摘自《Python网络爬虫 从入门到精通》一书中第4章,第4节,李迎著。

4.4.2 Excel 格式数据读取

1. 用 xlrd 库读取 Excel 文件

Python 是怎么操作 Excel文件的呢?与Word 文件的操作库 Python-docx 类似, Python也有专门的库为Excel 文件的操作提供支持,这些库包括 xlrd 、xlwt 、xlutils、 openpyxl、xlsxwriter 几种,这几个库都不是已安装好的,都需要像安装 Numpy一样 使用pip 进行安装,安装成功后,使用 import 进行导入就可以使用。

打开《Python 可视化数据分析》_学会挖掘大数据的价值_4.4.2 Excel 格式数据读取

1 import xlrd

2 workbook=xlrd.open_workbook('test1.xlsx')

3 sheet_name=workbook.sheet_names()

4 print(sheet_name)

6 print(sheet.cell_value(1,2))

7 rows=sheet.row_values(1)

8 cols=sheet.col_values(2)

9 print(sheet.name,sheet.nrows,sheet.ncols)

10 print(rows)

11 print(cols)

首先需要导入库,这里就是xlrd, 第2行是在xlrd 中打开名为 testl.xlsx 同级目 录中 Excel文件,第3行是获取所有此 Excel文件中的所有 sheet 名字,可以在 sheet 后的()后加索引,获取指定表,即可以通过workbook.sheet_names()[0]获取第一张 表的信息,第5行是通过索引读取第一张表,索引为0,命名为 sheet,第6行呈现 第一张表中读取的具体单元格的数据,通过cell_value(1,2)进行,括号中是行和列, 这里指第1行第2列的值。第7~8行分别是获取具体行和列的数据,这里是第2 行和第3列。第9行是展示所打开的sheet 的名称,行数,列数。第10~11行和第9行的效果相同。

2.xlwt 库写入 Excel 文件

通过下面这几行简单的代码可以实现把数据写入 Excel 的需要,代码第1行导 入需要的库,第2行是利用写入库 xlwt 创建 Excel 工作簿,这个工作簿是个新的工 作簿,第3行添加名为test1 的 Excel工作表。第4行是向testl 的工作表中写入内容,

代码中 worksheet.write(0,0,11111)的括号中参数(0,0)表示在 Excel 中的第1行第1 列 即A1 中写入'11111', worksheet.write(1,0,'11111') 表示向第2行第1列即 A2 中 写入'11111'。worksheet.write(1,1,'11111) 表 示 向 第 2 行 第 2 列 即 B2 中写入'11111', worksheet.write(5,3,'11111) 表示向第6行第4列即 D6 中写入'11111'。从示例代码中很快就可以总结出利用xlwt 包写入 Excel 文件的函数中的前两个数字参数的用意,即第1个数字表示列标,第2个数字表示行标,第5行是把所写 Excel 文件存成

excelwrite.xls。但这个存储有个弊端,就是不支持 Excel 2007的 xlsx 格式。

3. 使用 openpyxl 库读写 Excel

xlrd 和 xlwt 处理的是xls 文件,单个 Sheet 最大行数是65535,如果有更大需要 的,建议使用 openpyxl()函数,最大行数达到1048576。如果数据量超过65535 就会遇到 “ValueError:row index was 65536,not allowed by .xls format” 错误提示。 这里需要说明的是openpyxl 只能操作xlsx 文件而不能操作 xls 文件。对于 openpyxl, 在 Python 中也是需要安装的,通过pip 3 install openpyxl可以实现安装。

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们 18664393530@aliyun.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:学习《Python网络爬虫 从入门到精通》_掌握爬虫的精髓_11.1.2 地址转换成经纬度
下一篇:学习《Python网络爬虫 从入门到精通》_掌握爬虫的精髓_2.6 使用API
相关文章
×