工厂数据可视化管理系统:提高生产效率和决策质量的关键
174
2023-10-25
【摘要】 本书摘自《大数据可视化技术》一书中第7章,第1节,杨尚森、许桂秋主编。
7.1.1 空间映射法
(2)表格透镜。
表格透镜(Table Lens)是对传统使用表格呈现多元数据(如Excel等软 件)方法的扩展。该方法并不直接列出数据在每个维度上的值,而是将这些数值用水平 横条或者点表示。表格透镜允许用户对行(数据对象)和列(属性)进行排序,用户也 可以选择某一个数据对象的实际数值。如图7-4所示,表格透镜清晰地呈现数据在每个 属性上的分布和属性之间的相互关系。
(3)平行坐标。
平行坐标能够在二维空间中显示更高维度的数据,它以平行坐标 取代了垂直坐标,是一种重要的多元数据可视化分析工具。平行坐标不仅能够揭示数 据在每个属性上的分布,还可描述相邻两个属性之间的关系。但是,平行坐标比较难 同时表现多个维度间的关系,是因为其坐标轴是顺序排列的,对于非相邻属性之间关 系的表现相对较弱。交互地选取部分感兴趣的数据对象,并用高亮显示是一种常见的 解决方法
另外,便于用户理解各数据维度间的关系,也可对坐标轴的排列顺序进行改变。如图7-5将散点图技术与平行坐标综合使用,以及图7-6采用自由摆放的坐标轴,即灵活 轴线法等。
(4)降维。
当数据维度非常高时(如超过50维),各类可视方法都无法将所有 数据细节清晰地呈现出来。通过线性(包括主元分析 (Principal Component Analysis, PCA) 和多维尺度分析 (Multidimensional Scaling,MDS)) 和非线性变换(局部线性 嵌入 (Locally Linear Embedding,LLE) 和Isomap) 将多元数据投影 (project) 或嵌入 (embed) 至低维空间(通常为二维或三维),并保持数据在多元空间中的特征,这种 方法被称为降维 (Dimension Reduction)。
本节主要介绍PCA线性降维方法。 PCA的基本计算过程如下:
①对数据重组。将给定的N个多元数据组合成一个大小为M×N 的矩阵X,X 每一列 和每一行分别代表多元数据和数据的维度。
②计算每个数据属性的均值,得到一个大小为M×1的均值向量
③对矩阵X的每个元素减去对应行的均值得到一个新矩阵A=X-rd, 其中, d 是一个大小为1×N的行向量,其每个元素都为1。
④计算A的协方差矩阵B= N ZAAT。
⑤特征分解: B=QPQ⁻',Q 是由特征向量组成的方阵, P是对角矩阵。选择最大的n 个特征值,将其对应的n个特征向量分别作为列向量,组成特征向量大小为M×n 的矩阵 W。n 是目标低维空间的维数,通常为2或3。
⑥把多元数据点投影到选取的特征向量上,得到低维空间中的投影X'=W“A。
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们 18664393530@aliyun.com 处理,核实后本网站将在24小时内删除侵权内容。
发表评论
暂时没有评论,来抢沙发吧~