ad

打开《Python 可视化数据分析》_学会挖掘大数据的价值_4.4 存储数据文件读写详解

网友投稿 95 2023-11-13

【摘要】 本书摘自《Python网络爬虫 从入门到精通》一书中第4章,第4节,李迎著。

4.4 存储数据文件读写详解

我们需要把数据保存到文件或数据库中,这些数据可以是在互联网中爬取的一 手数据,也可以是外界获得二手数据,可以存成文本文件、 csv 文件、Excel 文件或 数据库类型文件,只要我们对这些文件的访问和读写数据语法有所了解,就可以熟 悉操作数据,然后再使用Python 等工具进行数据处理、分析,从中深刻体会到 Python数据分析的乐趣。

csv 、Excel 格式的数据,是我们做数据分析或绘图时经常要用的数据格式,在 前面 Python 基本知识的章节中,也有数据存储的内容,比如通过read\write 等方法 完成这部分工作,为了快捷、省时,这里可以通过 with 语句打开需要访问的数据 文件,完成文件读取工作。那么下面针对不同格式的存储数据进行有针对性的读取讲解。

具有一定的Python 知识基础,同时了解扩展库的相应功能后,就可以较通畅地 看懂脚本,就可以逐步建构自己的任务脚本,完成数据分析和构图的任务。关于格式转换的想法在代码示例中进行演示说明。

4.4.1 csv 格式数据读取

csv 是纯文本格式数据,使用广泛,因为很多程序都可以存储、转化、处理纯文 本格式,比 Excel 要方便广泛。对于 Excel 电子表格数据,可以把内容转化成 csv 纯 文本,数据库数据存储成 csv,Python 内置了 csv 模块,在 Python中可以直接读取。

打开《Python 可视化数据分析》_学会挖掘大数据的价值_4.4 存储数据文件读写详解

不需要另行导入。

1.csv 文件中读取数据原始方式

1 filename='births.csv'

2 with open(filename) as f:

3 rl=csv.reader(f)

4 print(list(r1))

5 for row in rl:

6 I print(rl.line_num,row)

这6条语句很简单,第1、2行是用with 模式打开已有的csv 文件: “births.csv”, 第3行表示读取整个文件,第4行打印呈现文件内容。但是此处把呈现的内容转化 成 list, 呈现结果就是放到列表中的csv 内容,如果不用list 就会出现:<_csv.reader

object at Ox0000000000AF8590>,也可添加第6行的呈现方法,利用 for 语句遍历csv文件中的每一行内容。

3. 利用 Numpy 库读写 csv 数据

根据前面对 Numpy这个 Python的基础扩展库的认识,知道它是一个存放多维数 据的容器,因为在我们分析的时候,大多都需要Numpy 、pandas 、Matplotlib 这三个 扩展库,所以也了解一下Numpy 和 pandas 这两个数据相关的库读取文件时的情况。

Numpy主要通过三个函数实现文件读写,分别是: savetxt 、loadixt 、genfromtxt。

1)np.savetxt(frame',array,fmt='%d',delimiter=None)

savetxt()中默认使用科学计数的形式保存数据,如果想改变,可以通过括号中的 参数实现。其中,参数frame 表示存储的文件,array 表示存入文件的数组,fmt 表示写入文件的格式,如%d 、%f、%e,delimiter 表示分割字符串,默认为空格。

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们 18664393530@aliyun.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:打开《OpenStack 云平台-部署与高可用实战》_1.2.4 通过Dashboard体验OpenStack功能
下一篇:打开《Python 编程与应用实践》_成为Python大佬_1.1 Python 概述
相关文章

 发表评论

暂时没有评论,来抢沙发吧~

×