如何在云计算基础架构平台中创建云主机
152
2023-10-25
【摘要】 本书摘自《认知计算与深度学习》一书中第1章,第1节,为陈敏、黄铠所著。
1.1 数据科学简介
在大数据、云平台以及物联网广泛应用于各个领域的今天,人们迫切需要智慧云 计算平台来应对越来越多的计算存储需求。目前,大部分云计算平台的主要功能集中在对 数据进行统一的存储处理和管理,而在认知和模拟人类感知智能方面的发展尚处于初级阶 段。并且,它们在物联网感知、机器学习、数据挖掘和分析能力上有很大的发展空间。本 章简要介绍了大数据理论基础、云服务模型、社交网络、移动与无线通信、物联网以及认 知能力。我们用SMACT 代表5个前沿技术:社交网络 (Social)、 移动通信 (Mobile)、 分析 (Analytics)、 云计算 (Cloud) 以及物联网(IoT)。 同时,我们针对智慧城市、健康监护、社 交媒体以及商业智能等领域,分别给出了应用案例,详细介绍了移动云和物联网资源的大数据采集、挖掘、处理和分析等方法。
1.1 数据科学简介
在过去的30年中,计算学科和通信学科逐渐融合,网络技术不断地改造着物理世界, 人们也从中大大获益。互联网平台架构、基础设施部署、网络连接和面向应用等方面不断取 得进展,相比台式机或个人电脑,云平台能够更有效地在大型数据库上执行搜索、存储和计算操作。
本节介绍了数据科学的基本概念及其关键技术,其终极目标是在几年之内将传感器网 络、 RFID (射频识别)标签、 GPS 服务、社交网络、智能手机、平板电脑、云平台和混搭应 用程序、 WiFi、 蓝牙、互联网+、物联网和新兴的认知科学这些技术结合起来,建设一个推动特定行业发展的大数据产业链。本章将重点对 SMACT 技术进行介绍。
1.1.1 数据科学与相关学科
数据科学有着悠久的历史,当今人们越来越多地使用云计算技术和物联网技术来建设智慧世界,因而数据科学变得越来越热门。如 图1-1所示,大数据具有三个重要的特点:数据容 量超大 (volume), 数据的高速处理(velocity), 数 据类型的多样化 (variety)。 这三个特点通常被称 为大数据的3个V。 其他人还在此基础上增加了大 数据的另外两个V: 一个是真实性(veracity), 即 跟踪或预测数据的困难;另一个是数据价值的变化 性 (values), 即数据价值会随着数据处理方式的不同而发生变化。
按照今天的标准,大数据一般指规模在1TB 以上的数据量。 IDC 预测,2030年将有40ZB 的数据需要处理,这意味着每个人将有5.2TB 的数据需要处理。如此巨大的数据量要求足够的存储能力和分析能力,这样才能够对海量数据进行处 理。数据的多样性意味着数据格式的多样性,这导致数据的精确管理是非常困难和昂贵的。 高速率处理数据意味着实时处理大数据并从中提取有意义的信息或知识。数据的真实性意味 着验证数据的准确性是非常困难的。以上所有V 导致我们很难使用现有的硬件和软件基础
设施去捕捉、管理和处理数据,这也使得人们对智慧云与物联网等技术的需求更加迫切。
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们 18664393530@aliyun.com 处理,核实后本网站将在24小时内删除侵权内容。
发表评论
暂时没有评论,来抢沙发吧~