ad

打开《Python 可视化数据分析》_学会挖掘大数据的价值_5.4 绘制直方图

网友投稿 137 2023-11-13

【摘要】 本书摘自《Python网络爬虫 从入门到精通》一书中第5章,第4节,李迎著。

5.4 绘制直方图

直方图是一种统计报告图,又称质量分布图,形式上是一个个的长条形。直方 图用长条形的面积表示频数,高度表示频数组距,宽度表示组距,其长度和宽度均有意义。当宽度相同时, 一般就用长条形长度表示频数。

直方图一般用来描述等距数据,柱状图一般用来描述名称(类别)数据或顺序 数据。直观上,直方图各个长条形是衔接在一起的,表示数据间的数学关系,即直 方图通过绘制连续性的数据展示一组或者多组数据的分布状况。很多初学者会把直方图和条形图混淆。

条形图各长条形之间留有空隙,区分不同的类,所以在做数据分析中常常表示 频率分布、频率密度分布、概率分布和概率密度分布。条形图主要用于展示分类数 据,而直方图则主要用于展示数据型数据,由于分组数据具有连续性,直方图的各 矩形通常是连续排列,而条形图则是分开排列。通过直方图还可以观察和估计哪些 数据比较集中,异常或者孤立的数据分布在何处。例如展示用户年龄分布,商品价格分布等。下面我们通过示例进行讲解。

打开《Python 可视化数据分析》_学会挖掘大数据的价值_5.4 绘制直方图

示例:

1 import matplotlib.pyplot as plt

2 import numpy as np

3 matplotlib.rcParams['font.sans-serif']=['SimHei'] 4 data=np.random.randn(10000)

5 plt.hist(data,bins=40,normed=0,facecolor="blue", edgecolor="black",alpha=0.7)

6 plt.xlabel("区间")

7 plt.ylabel(" 频数/频率")

8 plt.title(" 频数/频率分布直方图")

9 plt.show()

示例中第1~2行是基础库的导入,第3行是字体说明,第4行是利用 Numpy 随机生成服从正态分布的数据,第5行是直方图生成的函数,括号内的参数只写出 6个常用必用的,data 是所用的数据,接第4行, bins=40是直方图的长条形数目, 可选项,默认为10。normed 表示是否将得到的直方图向量归一化,可选项,默认为 0,代表不归一化,显示频数。normed=1, 表示归一化,显示频率。facecolor 表示长条形的颜色 edgecolor 表示长条形边框的颜色。alpha 是透明度。第6~7行是横纵轴标签。第8行是显示图的标题。第9行是图形展示函数。图形如5-15所示。

在下面的6行代码中重点体会读取固定格式的数据,这里以 Excel 数据为例, 这里使用了 pandas 读取的数据,大家也可以直接读取Excel 数据,仿照散点图的示例进行。

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们 18664393530@aliyun.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:实战之路《Excel 数据处理与分析实战宝典_第2版》_4.10 使用数据模型
下一篇:打开《OpenStack 云平台-部署与高可用实战》_离成功更进一步_1.2.5 创建云主机
相关文章

 发表评论

暂时没有评论,来抢沙发吧~

×