`

《大数据挑战与NoSQL数据库技术》 试读

阅读更多

       虽然一直知道大数据,但是没有真正研究使用过,这次算是总结学习了。

 

       最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。” “大数据”在物理学、生物学、环境生态学等领域以及军事、金融、通讯等行业存在已有时日,却因为近年来互联网和信息行业的发展而引起人们关注。

 

       数据正在迅速膨胀并变大,它决定着企业的未来发展,虽然现在企业可能并没有意识到数据爆炸性增长带来问题的隐患,但是随着时间的推移,人们将越来越多的意识到数据对企业的重要性。

 

       大数据时代已经来临,传统的关系型数据库已经不能很好的解决海量数据带来的问题,单机的统计和可视化工具亦变得力不从心。一些新的数据管理系统如并行数据库、网格数据库、分布式数据库、云平台、可扩展数据库等孕育而生,它们为解决海量数据提供了多种选择。

 

        并行数据库,顾名思义就是把一个查询分成若干个子查询,并行的去执行子查询以提高运行速度。其目标是高性能和高可用性,但它有两个缺点,伸缩性和容错性较差。

 

       NoSQL指的是“Not only SQL”,即对关系型数据库的补充。NoSQL普遍采用的一些技术有:

       简单数据模型

       元数据与应用数据的分离

       弱一致性

       避免不必要的复杂性

       高吞吐量

       高水平扩展能力和低端硬件集群

       避免昂贵的对象-关系映射

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics