“微软公司生产了一款数据驱动的软件,主要是为工程建设节约资源提高效率。在这个过程里可以为世界节约40%的能源。抛开这个软件的前景不看,从微软团队致力于研究开始,可以看他们的目标不仅是为了节约了能源,更加关注智能化运营。通过跟踪取暖器、空调、风扇以及灯光等积累下来的超大量数据,捕捉如何杜绝能源浪费。
而且随着全球范围内个人电脑、智能手机等设备的普及和新兴市场内不断增长的互联网访问量,以及监控摄像机或智能电表等设备产生的数据爆增,使数字宇宙的规模在2012到2013两年间翻了一番,达到惊人的2.8ZB。IDC预计,到2020年,数字宇宙规模将超出预期,达到40ZB,人均数据量将达5,247GB。
你能想象如此巨大的数据就仅有0.4%得到了分析。为什么这么低?因为这些数据来源分散。
网络日志,RFID,传感器网络,社会网络,社会数据,互联网文本和文件;互联网搜索索引;呼叫详细记录,天文学,大气科学,基因组学,生物地球化学,生物,和其他复杂和/或跨学科的科研,军事侦察,医疗记录;摄影档案馆视频档案;和大规模的电子商务。
同时物联网、云计算、移动互联网、车联网、手机、平板电脑、PC以及遍布地球各个角落的各种各样的传感器,也无一不是数据来源或者承载的方式。
那么大家有没有想过这样一个未来情况:我们手机、平板电脑、PC、车载电脑、数码相机、mp4、mp3以及监控摄像、公司资料、实验数据,甚至于是军事机密,一切数据都被放入到数据库,没有了储存设备。不用携带,不会丢失,随时可以查阅,网络资源的下载也像是复制和粘贴一样方便。
整个大数据库就像是一个大的社区。每个人在大数据库都一个自己的储存空间,就像是你在社区里有一套房子一般。为了保密,你可以将自己的房子打造成铜墙铁壁,或者有大数据库为您提供隔离式的储存空间,又或者您直接指定可以访问数据的设备。
黑客将像小偷一样被您拒之门外。
有人会说,我的电脑杀个毒,扫描个盘都要一个多小时。你如何保证我在用大数据库时不是卡的想睡个觉先?(哈哈!)
我敢保证的是未来20年时间里,制约大数据库发展的只会是网络速度。
我为什么敢保证?因为我们已经完成了大数据库的技术积累。在未来1年内,千度即将投资1000个亿美元的资金用于大数据库的建设。”
发布会上的记者喧哗了起来。没有人想到在全世界还在努力推动着大数据库这辆牛车时,千度已经坐上了法拉利。
“李总!您能详细的说明一下您所说的技术积累吗?是什么样的技术能够让大数据提前来临?”
“就在一个月,我们千度收到三份技术设计,一份为大数据库仿大脑神经三维存储设计。大家都知道人类大脑能够储存10万亿位的信息量。这样的存贮能力可与1万台计算机的存贮容量相媲美。而这份天才般的设计就是仿真的大脑,他是利用三维空间的关联式储存,并不是单纯意义上的数据,理论上他的存储空间是目前全球网络数据总量的10倍。
另一份是关于大数据库存储扫描程序的,将像是我刚刚说的,如硬盘文件扫描,称之为‘神经网络扫描模块’,是通过联想式关键词链接方式进行的。打个比方,画一个圆,你能想到什么?太阳?烧饼?披萨?圆规?
光有‘神经网络扫描模块’还不行,还需要智能识别分析,初级的人工智能,帮助你找出任何你需要的东西。”
“李总,您刚刚也说的,网速是限制你大数据库运行的一个方面。我想现时代,怕会有很多人因为网速跟不上,而拒绝使用大数据吧。你怎么看待这个问题?”
“我的未来设想是没有个人储存设备的,人人都用大数据,用大数据帮助我们更准确的定位我们的生活。而现下,使用大数据的时代才刚刚开始。千度的大数据库欢迎任何人使用,我们目前定位的对象多是高校,集团企业和政府、科研部门等,在个人服务上会向后延长3到5年时间。”
“李总,大数据库需要多久就能投入使用?”
“千度已经就元件,设备和Internet等国际性硬件厂商企业进行了初步的洽谈。在合同商定之后,就开始基础建设。到时我们千度就建造一栋标志性的建筑用于存放大数据库。这栋建筑也就是我们千度公司的明星片。”