如何实现两个EXCEL表格相互查找并填充相应的内容--英雄云拓展知识分享
115
2023-10-25
【摘要】 本书摘自《Python数据分析案例教程》一书中第1章,第6节,由万念斌、肖伟东、叶丰标编著。
1.6 Python 数据分析
Python语言是一种面向对象的解释型计算机程序设计语言,它具有丰富和强大的数据 分析和处理库,并且具有语言简洁性、易读性和可扩展性等特点。比起 R 和 Matlab 等其他 主要用于数据分析的编程语言,Python 不仅提供数据处理平台,而且还有其他语言和专业 应用所没有的特点,因此,在国内外,很多数据分析师使用Python语言编程来分析数据。
1.6.1 NumPy
NumPy 是 Python语言的一个扩展程序库,主要用于数学和科学计算,特别是数组计 算。它是一个提供多维数组对象、多种派生对象(如矩阵)以及用于快速操作数组的函数和 API,包括数学、逻辑、数组形状变换、排序、选择、I/O、离散傅立叶变换、基本线性代数、基本 统计运算、随机模拟等。 NumPy 的核心是n 维数组对象 ndarray,它是一系列同类型数据 的集合。
1.6.2 Pandas
Pandas是基于 NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。 Pandas 提供了高级数据结构和函数,这些数据结构和函数的设计使得利用结构化、表格化 数据的工作更快速、简单。 Pandas纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具,它的出现使Python 成为强大、高效的数据分析环境。
1.6.3 Matplotlib
Matplotlib 是一个Python 2D绘图库,它提供一套表示和操作图形对象及内部对象的 函数和工具。它不仅可以处理图形,还提供事件处理工具,具有为图形添加动画效果的能 力。 Matplotlib的架构由 Scripting(脚本)层、Artist(表现)层和 Backend (后端)层组成,各 层之间单向通信,即每一层只能与它的下一层通信,而下层无法与上层通信。 Matplotlib架 构的最低层是 Backend 层,Matplotlib API是用来在该层实现图形元素的类。 Matplotlib 架构的中间层是 Artist层,图形中所有能看到的元素都属于 Artist 对象,如标题 title、轴标 签 axes、刻度 ticks、图形 figure等,这些元素都是 Artist对象的实例。 Matplotlib 架构的最 上层是Scripting(脚本)层,系统提供了相关 Matplotlib API 函数供开发者使用,比较适合 数据分析和可视化。
1.7 数据分析经典案例
【案例1-1】沃尔玛经典营销案例:啤酒与尿布。
"啤酒与尿布"的故事产生于20世纪90年代的美国沃尔玛超市中,沃尔玛的超市管理 人员分析销售数据时发现了一个令人难以理解的现象:在某些特定的情况下,“啤酒"与“尿 布”两件看上去毫无关系的商品会经常出现在同一个购物篮中,这种独特的销售现象引起了 管理人员的注意,经过后续调查发现,这种现象出现在年轻的父亲身上。
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们 18664393530@aliyun.com 处理,核实后本网站将在24小时内删除侵权内容。
发表评论
暂时没有评论,来抢沙发吧~