打开《Python 可视化数据分析》_学会挖掘大数据的价值

打开《Python 可视化数据分析》_学会挖掘大数据的价值_1.5.3 Python 科学计算库

【摘要】本书摘自《Python网络爬虫从入门到精通》一书中第1章，第5节，李迎著。

1.5.3 Python 科学计算库

Python 在数据科学行业扮演着越来越重要的角色， Python中的库是非常重要，在科学计算方面Numpy 、SciPy、pandas 三者就可以创建一个非常牢固的用于数据挖掘与分析的基础框架，再结合可视化的Matplotlib库，可以完全实现我们良好的学习

分析过程。

NumPy 库，是最基本的包，它代表“Numeric Python”。它为 Python中的 n 维数组和矩阵的操作提供了大量有用的功能。该库提供了Numpy数组类型的数学运算向量化，可以改善性能，从而加快执行速度。Numeric 是 Numpy的前身，它是由Jim Hugunin 开发的。Jim Hugunin还开发了另一个包 Numarray。2005年，Travis Oliphant 通过将 Numarray的功能集成到 Numeric 包中来创建 Numpy 包。读者可以从 Python 官网下载到 Numpy库，或者使用Python的 pip 辅助安装功能下载并升级最新版本。

打开《Python 可视化数据分析》_学会挖掘大数据的价值_1.5.3 Python 科学计算库

Numpy 库可以完成的工作大致有以下三种情况：①一个强大的 N 维数组对象 Array;② 比较成熟的(广播)函数库；③用于整合C/C++和 Fortran代码的工具包； ④实用的线性代数、傅里叶变换和随机数生成函数。在后面的章节中会讲解 Numpy

包的数据结构。

pandas 是一个提供快速、灵活和表达性数据结构的 Python库，在通过“标记” 和“关系”进行数据分析工作，简单直观。pandas 的数据整理真的很实用，是本书的重点使用库。它可以快速简单地进行数据操作、聚合和可视化。pandas 是基于 Numpy 构建的，为时间序列分析提供了很好的支持。pandas 中有两个主要的数据结构：一个是Series, 另一个是 DataFrame。这个我们在第6章会详细介绍。pandas 适合许多不同类型的数据，分别是：

·具有非均匀类型列的表格数据，如在 SQL表或 Excel 电子表格中。

●有序和无序(不一定是固定频率)的时间序列数据。

●带有行和列标签的任意矩阵数据(均匀类型或异质)。

●任何其他形式的观测/统计数据集。数据实际上不需要被标记就可以被放置到 pandas 的数据结构中。

Scipy 库含线性代数、优化、集成和统计的模块。Scipy 库的主要功能是建立在 Numpy上，从而它的数组大量的使用了Numpy 包。它通过其特定子模块提供有效的数值例程，并作为数字积分、优化和其他例程， Scipy的所有子模块中的功能都有详细的说明。

Excel中怎样计算面积? Excel制作计算圆面积工具的教程-英雄云拓展知识分享

251 2023-11-13

打开《Python 可视化数据分析》_学会挖掘大数据的价值_1.5.3 Python 科学计算库

Excel中怎样计算面积? Excel制作计算圆面积工具的教程-英雄云拓展知识分享

excel中怎样在窗体中绘制iPhone4模型?-英雄云拓展知识分享

excel vba编程在窗体上画一个8边形-英雄云拓展知识分享

最近发表

热评文章

CRM系统很重要吗？-企业客户关系管理中的重要性及其

WPS2012版本中为何看不到之前用的插件-英雄云拓

客户关系管理的核心是什么？-以客户为中心，提升企业竞

excel剪切、复制和粘贴操作，使它们不会破坏已设置

ChM格式文档处理利器：5款免费软件-英雄云拓展知识

WPS怎样制作文字打字机效果的动画?-英雄云拓展知识

热门标签