工厂数据可视化管理系统:提高生产效率和决策质量的关键
120
2023-10-25
【摘要】 本书摘自《大数据可视化技术》一书中第7章,第2节,杨尚森、许桂秋主编。
7.2 非结构化数据可视化
7.2.1 基于并行的大尺度数据高分辨率可视化
复杂数据并不只有高维度数据,还有异构数据等。所谓异构数据,是指在同一个数 据集中存在的如结构或者属性不同的数据情况。存在多个不同种类节点和连接的网络被 称为异构网络。异构数据通常可采用网络结构进行表达,在图7-13中,基于异构社交网 络的本体拓扑结构表达了某组织网络中的多种不同类别的节点。
由于数据量大并且复杂 度高,将所有数据直接用网络电线图的方法可视化并没有效(见图7- 14左图),可以采 用从异构网络中提炼出本体拓扑结构的策略(见图7- 13右图),其中的节点是原来网络 内的节点类型,连接各存在关联的类别。以这个拓扑结构作为可视分析的辅助导航,用 户可以在可视化图中加入特定类别的节点和连接,从而起到过滤的效果。数据的异构性大部分产生于数据源的获取方式的不同。
比如微信用户数据集中不仅 包括软件的点对点的聊天记录、 GPS 位置数据,也包括了用户的部分个人信息。这些来 自不同数据源的数据通常具有不同的数据模型、数据类型和命名方法等,所以对底层的 数据进行合理整合至关重要。数据整合为可视化模块,为众多独立和异构的数据源获取 数据提供透明且统一的访问接口,使得原本无法被多种类型的数据源支持的查询表达获 得支持。
全方位显示大尺度数据的所有细节是一个计算密集型的过程,处理大尺度数据的基 本技术路线就是大规模计算集群。例如,美国马里兰州大学构建了一个GPU 和CPU 混合 式高性能计算和可视化集群,如图7-14所示。
另一方面,大规模数据的高清可视化需要高分辨率的显示设备和显示方法,高精度 的大屏投影拼接面向的是专业级用户,普通的个人用户实现大尺度数据的高精度可视化 则需要另外的方案。大尺度数据可视化一般有两类方法: 一种是采用层次结构来对大尺 度数据进行重新组织,另外一种就是将高精度的数据采样成分辨率较低的数据,在既定 分辨率的视图里实现预览式的可视化。 Cleverland等人提出了可视化数据库的思想—— 复杂大尺度数据集的可视化导致了大量超高分辨率的可视图需要多窗口多页面的存储,
其中单视图对应于数据集的某子集,所以可使用数据库的方法生成、管理、解析和显示 数据可视化结果的集合。概括地说,形成并使用多窗口的高效多视图来可视化数据库的 主要任务如下:
(1)根据不同的需求,将大尺度复杂数据划分数据子集。
(2)对每个数据子集,得到符合用户感知的可视化结果。
(3)对形成的各个不同角度的可视化视图采取数据库的架构进行存储与管理。
(4)针对不同可视化视图来提供敏捷的用户交互工具,并且实现无缝多视图同步 更新。
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们 18664393530@aliyun.com 处理,核实后本网站将在24小时内删除侵权内容。
发表评论
暂时没有评论,来抢沙发吧~