8*8的棋盘,在每个格子里面放米粒,第一个格子放一粒米,后面的格子总是前面格子的两倍,如果把整个棋盘放满需要多少米粒?
它的推演是 1+2+4+…+263=264-1
把棋盘分成上下两半,上一半总共需要米粒 232,这个数并不大,前几年计算机的32位就这么大,但下一半就完全不一样了,这是平方级别的规模。
计算机时代有个著名的摩尔定律,就是说同样成本每个18个月晶体管数量就会翻倍,反过来同样数量晶体管成本会减半。这个定律可以衍生到很多类似领域:存储、功耗、带宽、像素。
冯·诺依曼提出的“奇点理论”:技术会逼近人类历史上某种本质的奇点,在那后全部人类行为都不可能以我们熟悉的面貌继续存在。 未来学家 Ray Kurzweil 称:人类能在2045年实现数字化永生,他自己创办奇点大学,相信随着信息技术、无线网、生物、物理等领域的指数级增长,将在2029年实现人工智能,人的寿命也将会在未来15年得到大幅延长。
地球上至今的数据量从GB、TB、PB、EB、到达 ZB。之前说的 264 就是16EB大小。
大数据领域在各行业都可以应用,如Linkedin的CEO提出“经济图谱”概念:希望整合用户、公司、工作机会、技能、学校、帖子变成一个复杂而又蕴含无限可能的数字化社会。
又如找对象:有一个国外Geek,他抓取约会网站的数据,根据一些指标如地理、年龄、兴趣建立了3D模型找到真爱;再比如阿里巴巴通过数据魔方(大数据产品)提炼出消费跟女生胸部成正比的结论。
移动App上,今日头条通过个人社会化信息建立兴趣图谱推荐文章并随你的使用越来越聪明;在线教育领域:MOOC中的M就是大规模的意思;其他如互联网金融人人贷,通过大数据积累信用,释放一些传统金融体系下未被满足而又广泛存在的巨大需求;Wealthfront做大数据理财;23andMe提供个人基因组的大数据等等。
最紧密的就是云计算,主要是 Amazon Web Service 和 Google Cloud Platform ,国内还有阿里云、金山云、百度云、腾讯云、小米云、360云、七牛。。。每个里面都是大量技术文档和标准,从计算到存储,从数据库到消息,从监控到部署管理,从虚拟网络到CDN,把所有一切用软件重新定义了一遍。
亚马逊的云 AWS 总体上成熟度很高,有大量创业公司都是基于上面开发,比如有名的 Netflix、Pinterest、Coursera。亚马逊不断创新,每年召开 relnvent 大会推广新的云产品和分享成功案例,像 S3 是简单面向对象的存储,DynamoDB是对关系型数据库的补充,Glacier 对冷数据做归档处理,Elastic MapReduce 直接对 MapReduce 做打包提供计算服务,EC2就是基础的虚拟主机,Data Pipeline 会提供图形化界面直接串联工作内容。