三个皮匠微信公众号每天给您带来最全最新各类数据研究报告
大数据的特征1(量大)
政府以及企业数据的开放使得社会获取传统的海量数据成为可能,而互联网、智能终端的发展则以前所未有的速度为人类数据库不断增加着新的数据。
谷歌每天处理的搜索量超过30亿次,每秒响应3.4万次搜索。
在数据产生的地区分布方面,新兴经济体(如中国、印度等)将产生并持有越来越多的数据。到了2012年,新兴市场的数据份额达到36%,在2020年这一比例将会达到62%,其中我国所占比例将达到21%。
大数据的特征2(种类多)
数据来源多
• 互联网企业:SNS、微博、视频网站、电子商务网站。
• 物联网、移动设备、终端中的商品、个人位置、传感器采集的数据。
• 联通、移动、电信等通信和互联网运营商。
• 天文望远镜拍摄的图像、视频数据、气象学里面的卫星云图数据等。
• 社会组织各部门统计数据,如人口抽样调查、交通数据、卫生统计数据等。
数据格式多
结构化数据:传统数据库所处理的数据,即存储在数据表中的行数据。
半结构化数据:是结构化的数据,但是不同数据的字段和数据长度差异很大。
非结构化数据:不能直接用数据库中的二维逻辑表来表现的数据,它包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频、视频信息等。
大数据的特征3-价值密度低
数据良莠不齐,价值密度低,但是通过挖掘可以从数据中可以获得大量的价值。
• 在《爆发》一书中,复杂网络研究领域的权威巴拉巴斯指出,人类的活动是有迹可循的,其中93%的人类行为都是可以预测的。
• 一旦掌握了足够多的历史信息,就可以从其中得到规律,并对未来即将发生事件进行准确的预判。而大数据的出现无疑是给了人们一把打开未来之锁的钥匙。
• 通过收集、分析海量数据,并快速地从数据模型中分析未来的趋势,人们可以提前实现对未来的预判或是准备。
大数据的特征4-处理速度快
在实际的应用中,从数据的采集到运算分析得到结果之间的时间要求可能是秒、甚至是毫秒级的。
对搜索的时间要求
• 如果网页加载时间超过4秒, 25%的用户会放弃该网页
• 如果网页加载时间超过10秒, 50%的用户会放弃该网页
云计算
• 云计算概念和应用发展迅速:所谓“云”是指互联网,所以云计算是一种基于互联网的计算,它是一种能够将动态伸缩的虚拟化资源(硬件、平台、软件)通过互联网以服务的提供给用户的计算模式。
• 云计算是一种共享的网络交付信息服务的模式。
• 提供资源的网络被称为“云”,“云”中的资源在使用者看来是可以无限扩展的,并且可以随时获取,这种特性经常被比喻为像水电一样使用软硬件资源,按需购买和使用。
• 世界需要5台计算机。谷歌、微软、IBM、亚马逊和中国电信。(关注公众号“三个皮匠”,获取最新行业报告资讯)





















点击下载全文