Excel中怎样计算面积? Excel制作计算圆面积工具的教程-英雄云拓展知识分享
115
2023-11-13
【摘要】 本书摘自《Python网络爬虫 从入门到精通》一书中第6章,第6节,李迎著。
6.6.4 箱形图
箱型图是显示一组数据分散情况的统计图,它里面有个很常用的功能就是检测 这组数据是否存在异常值,具体统计名词在这里就不一一介绍,有兴趣的读者认真学习一下统计学,补充学习自己需要的知识。
在 pandans 中,箱型图绘制是调用 Series.box.plot() 、DataFrame.box.plot()或 DataFrame.boxplot)来可视化数据中每列值的分布情况。下面还是通过两个示例进行
说明,第一个示例的数据和前面的图形数据相同,就是随机数,这里是一个箱形图,表示对[0,1]上的统一随机变量的12次观察的4次试验。
1 import pandas as pd
2 import numpy as np
3 import matplotlib.pyplot as plt
4 df=pd.DataFrame(np.random.rand(12,4),columns=['A','B','C',
D'])
5 df.plot.box()
6 plt.show()
在这段代码中就重点说明在第3~5行,其中第三行是需要解释一下,就是在 pandas 中还是需要借助 matplotlib.pyplot 来呈现图像,这个和第6行就呼应了。第4行是所用 数据,借助 DataFrame中的随机正态分布函数 random.rand 生成四组数据,每组12个随 机数。第6行就是生成箱体图的函数。绘制的图形如图6-12所示。其实这个示例比较 简单容易,是因为我们采取的是随机数,画出的图也很显著,但现实中需要分析的真实 数据,是会有特出情况的出现的,除了利用生成的随机数,下面的示例是用已有数据来 体验一下,这个数据就是我们前面 pandas 中访问 Excel 中的学生成绩数据。
示例3:
本地有一份学生的学习成绩,图6-13中是学生成绩的一部分数据截图,这个成 绩是四门功课的汇总,需要用箱体图对这四门成绩进行分析描述。在实现代码中, 第4~5行是对读取数据中的中文字体和数字前的“-”的设置,以防乱码。第6行 数利用 pandas 读取 Excel 数据中名为“成绩”的工作簿,第7行是读取数据中的前 5行数据,第8行是格式化输出前5行数据,以方便查看数据状态。第9行是绘箱 体图的函数,没有设置参数,均默认。第10~11行是设置箱体图的 X 、Y 轴的标 签。最终分析图如图6-14所示。在图中可以看到实用英语课程有一个离心值,其 他科目的成绩都很相仿, “计算机数学基础”的成绩差异相对较小, “计算机应用基础”差异最大。
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们 18664393530@aliyun.com 处理,核实后本网站将在24小时内删除侵权内容。
发表评论
暂时没有评论,来抢沙发吧~