手机浏览器扫描二维码访问
““互联网+”医疗健康的应用与发展研究(..)”!
第二节
核心技术
一、技术起源
1.Google的三驾马车
Google在2003年到2004年公布了关于GFS、MapReduce和BigTable三篇技术论文,这三项技术成为后来云计算和大数据发展的重要基石,它们也被业界称为Google的三驾马车:
GFS(Google文件系统)是一个面向大规模数据密集型应用的、可伸缩的分布式文件系统。它运行于廉价的普通硬件上,并且提供容错功能。
MapReduce是一个编程模型,MapReduce架构的程序能够在大量普通配置的计算机上实现并行化处理。
Bigtable是一个分布式的结构化数据存储系统,被用来处理海量数据,这些数据通常是分布在数千台普通服务器上的PB级的数据。
2.Hadoop
从2005年开始至今,Yahoo资助的Hadoop团队按照Google公布的GFS、MapReduce和BigTable这三篇论文分别实现了它们的开源版本:HDFS(Hadoop分布式文件系统)对应GFS、HadoopMapReduce对应GoogleMapReduce、HBase对应GoogleBigtable。经过几年发展,目前Hadoop已经成为Apache开源组织的独立项目,并形成了由许多子项目组成的Hadoop族群。随着各个领域数据量的迅速增长,存储和处理大规模数据已成为迫切需求。Hadoop作为目前大数据处理的主流标准和关键平台,引起了学术界和企业的普遍兴趣。在学术界,Hadoop得到了各科研院所的广泛关注,许多著名的大学都加入到Hadoop集群的研究中来。在商业界,IBM、Oracle、华为、百度、淘宝等大公司也都有独立的团队开展Hadoop平台的应用及产品化。
二、技术框架
从数据管理和处理的生命周期来划分,大数据的管理和处理体系可以自下而上大致分为四层:数据存储层、数据处理层、数据整合层和数据挖掘层,如图5-1所示。
图5-1大数据的数据管理和处理体系
三、关键技术
1.大数据存储技术
大数据的出现以及结构数据的改变使常规技术的数据存储和管理面临新的挑战。在大数据环境下,存储解决方案主要包括分布式文件系统和数据库。
(1)分布式文件系统:
Google的GFS以及Hadoop族群中的HDFS都属于分布式文件系统,它们所管理的数据存储在分散的物理设备或节点上,存储资源通过网络连接。
(2)数据库:
目前,数据库系统主要的类型有满足传统信息化系统的数据规模的关系型数据库、满足计算机集群并行处理要求的非关系型(NoSQL)数据库以及满足医疗场景中实时性要求较高的实时数据库。
对照图5-1的数据管理和处理体系,关系型数据库属于结构化数据库,NoSQL数据库和实时数据库属于其中的灵活存储范畴。医疗大数据并不能采用单一的存储方式,而是需要根据数据特点及应用的需要综合运用关系型数据库、NoSQL数据库、实时数据库、分布式文件存储等多种存储技术。
最强练气师 重生火影的修道者 唐宋词鉴赏课 元降 都市逍遥医神 双宝驾到:冷傲爹地太能撩 人民日报70年文艺评论选 中药传说 天上掉下朵白莲花 高清日本战国史(套装全4册) 灵枢解难 不说也罢 都市最强狂婿 管遵惠针余笔谈 主动脉及周围血管介入治疗学 西游太小了 近世欧洲史 贵女楹门 山野汉子旺夫妻 人民日报70年消息选
李燃刀带着几十年的修行经验,与精湛奇妙的灵药术重生回少年这一世,他要将前世所有遗憾统统弥补这一世,他要快意恩仇,纵剑天下!...
重生之花都魔尊盛夏,江城内外阴雨绵绵。市郊的一个山沟里,磅礴的雨水不断冲刷着一堆沙泥,渐渐露出了一具被藏在下面的年轻的尸体天空闪过一道惊雷,一股紫色的闪电从天而降,生生的劈在了这具尸体上面。这道闪电直透地下,不断在山间爆闪出一连串的恐怖电光,连通了九幽冥域,引来了地府的冥雷降世...
超级佣兵身怀古武绝技重回都市,虽想优哉游哉休闲度日,怎奈各种麻烦接踵而至。...
作者血色军刀的经典小说天降赘婿最新章节全文阅读服务本站更新及时无弹窗广告小说作为暗黑世界的皇帝,狂暴嗜血是他的代名词,如今重回都市,他只想做个模仿好丈夫。秦枫打架?我不会!杀人?我不干!追妹子?对不起,我的老婆是美女总裁!...
书海阁小说网免费提供作者罗生的经典小说烈血狂罗最新章节全文阅读服务本站更新及时无弹窗广告欢迎光临wwwshgtw观看小说血气方刚少年人,一曲离歌走半生。忽见战场千万魂,不悔当年强者尊。天下如鹿在谁手,命元大陆谁绸缪。度尽劫波兄弟在,相逢一笑泯恩仇。烈皇刀,修罗耀,千古狂怒藏于鞘!红龙血,魅妖月,万里长歌化魔决!...
公元3018年,在人体冷冻舱中沉睡了一千年的韩唐,被解冻释放。于是,他在一瞬间来到波澜壮阔的大宇宙时代,身份证上的年龄,也从二十一岁,变成了一千零二十一岁。...