ad

学会《大数据可视化技术》_轻松读懂你的数据_7.1.1 空间映射法

admin 174 2023-10-25

【摘要】 本书摘自《大数据可视化技术》一书中第7章,第1节,杨尚森、许桂秋主编。

7.1.1 空间映射法

(2)表格透镜。

表格透镜(Table Lens)是对传统使用表格呈现多元数据(如Excel等软 件)方法的扩展。该方法并不直接列出数据在每个维度上的值,而是将这些数值用水平 横条或者点表示。表格透镜允许用户对行(数据对象)和列(属性)进行排序,用户也 可以选择某一个数据对象的实际数值。如图7-4所示,表格透镜清晰地呈现数据在每个 属性上的分布和属性之间的相互关系。

(3)平行坐标。

平行坐标能够在二维空间中显示更高维度的数据,它以平行坐标 取代了垂直坐标,是一种重要的多元数据可视化分析工具。平行坐标不仅能够揭示数 据在每个属性上的分布,还可描述相邻两个属性之间的关系。但是,平行坐标比较难 同时表现多个维度间的关系,是因为其坐标轴是顺序排列的,对于非相邻属性之间关 系的表现相对较弱。交互地选取部分感兴趣的数据对象,并用高亮显示是一种常见的 解决方法

另外,便于用户理解各数据维度间的关系,也可对坐标轴的排列顺序进行改变。如图7-5将散点图技术与平行坐标综合使用,以及图7-6采用自由摆放的坐标轴,即灵活 轴线法等。

学会《大数据可视化技术》_轻松读懂你的数据_7.1.1 空间映射法

(4)降维。

当数据维度非常高时(如超过50维),各类可视方法都无法将所有 数据细节清晰地呈现出来。通过线性(包括主元分析 (Principal Component Analysis, PCA) 和多维尺度分析 (Multidimensional Scaling,MDS)) 和非线性变换(局部线性 嵌入 (Locally Linear Embedding,LLE) 和Isomap) 将多元数据投影 (project) 或嵌入 (embed) 至低维空间(通常为二维或三维),并保持数据在多元空间中的特征,这种 方法被称为降维 (Dimension Reduction)。

本节主要介绍PCA线性降维方法。 PCA的基本计算过程如下:

①对数据重组。将给定的N个多元数据组合成一个大小为M×N 的矩阵X,X 每一列 和每一行分别代表多元数据和数据的维度。

②计算每个数据属性的均值,得到一个大小为M×1的均值向量

③对矩阵X的每个元素减去对应行的均值得到一个新矩阵A=X-rd, 其中, d 是一个大小为1×N的行向量,其每个元素都为1。

④计算A的协方差矩阵B= N ZAAT。

⑤特征分解: B=QPQ⁻',Q 是由特征向量组成的方阵, P是对角矩阵。选择最大的n 个特征值,将其对应的n个特征向量分别作为列向量,组成特征向量大小为M×n 的矩阵 W。n 是目标低维空间的维数,通常为2或3。

⑥把多元数据点投影到选取的特征向量上,得到低维空间中的投影X'=W“A。

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们 18664393530@aliyun.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:从《Python数据分析案例教程》中_领悟数据和Python的魅力_5.4 Pandas 读写HTML文件中的数据
下一篇:打开《Python入门与实战》_一步步学会Python_4.6 变量的作用域
相关文章

 发表评论

暂时没有评论,来抢沙发吧~

×