ad

阅读《时空大数据与云平台 理论篇》_走进云的世界_5.1 时空大数据库构建

admin 156 2023-10-25

【摘要】 本书摘自《时空大数据与云平台 理论篇》一书中第5章,第1节,作者是吴信才。

第 5 章 云环境下时空大数据平台构建

第4章阐述了时空大数据中心的体系架构,可以看出,建设时空大数据中心的重点 在于时空大数据库的构建及对库中大数据资源的分布式管理技术,本章将介绍时空大数 据库的构建流程和时空大数据的管理、分析挖掘、可视化等关键技术。

5.1 时空大数据库构建

由第4章可知,大数据技术系统的处理流程大致可分为汇聚、存储、处理、可视化、 大数据应用五个阶段,因此,时空大数据库的构建也应该包括时空大数据汇聚、时空大 数据存储、时空大数据处理三个阶段,时空大数据库构建完成后,可以在其上进一步开 展时空大数据挖掘分析、时空大数据可视化、时空大数据应用等。

5.1.1 时空大数据汇聚

时空大数据中心可以管理海量多源异构数据,包括空间数据和其他数据。空间数据 用来表示空间实体的位置、形状、大小及其分布特征诸多方面信息,它可以用来描述来 自现实世界的目标,具有定位、定性、时间和空间关系等特性。其他数据则包括属性数 据、目录数据、文本数据、图像数据、多媒体数据等多种格式的数据。

阅读《时空大数据与云平台 理论篇》_走进云的世界_5.1 时空大数据库构建

1. 多源数据汇聚集成

1)大数据汇聚需要解决的问题

大数据汇聚与传统数据采集的核心意义是一致的,传统采集的数据具备一定的结构 性,生成频率具有规律性,处理规则相对简单。但是大数据汇聚要面对体态更庞大的数 据集,需要解决数据的全量接入、数据的融合计算、群集的高效管理这三方面的问题, 才能确保大数据汇聚的成功。

2)大数据汇聚的建设目标

大数据的发展改变了 IT 系统的建设方式,从以数据用于计算的传统方式,向以提 高计算能力服务于数据的方式转变。为顺应这个发展趋势,提出以“数据的全量汇聚为 基础,数据的融合计算为核心”的系统模型来建设大数据汇聚中心,以其高效的数据汇 聚能力与数据计算能力,为企业的运营提供服务与支撑(夏文忠,2015)。

从物理层面看,大数据汇聚中心可以采用异构的组网模式。数据的计算,由廉价的 刀片式服务器或者虚拟主机作为计算节点,以此构建数据计算群集;数据的存储,可由

计算节点的本地磁盘、存储阵列、分布式文件系统(如 HDFS、CFS、GLUSTERFS 等)、

网络附属存储 (network attached storage,NAS) 等组成,以此构成数据存储群集。从系统层面看,大数据汇聚中心在物理层面的数据计算群集和数据存储群集需要统 一管理,从功能上可划分为中枢管理群集和枢纽服务群集。中枢管理群集,起到中枢神 经的作用,管理着群集中所有类型的节点;枢纽服务群集,作为服务的提供者,接受中 枢管理群集的管理,需要与数据、应用交互,提供数据的接入服务、数据的处理服务、 数据的交付服务。

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们 18664393530@aliyun.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:《智能制造服务云平台初探》_让你更懂智能制造_1.2.3 智慧园区规划思路
下一篇:《零基础Python 从入门到精通》_让你学得轻松_19.1.5 Pyramid
相关文章

 发表评论

暂时没有评论,来抢沙发吧~

×