“生活本不是你想象的那个样子。”大学时一个教知识产权法的老师曾经以这样一个“冷幽默”式的标志性名言而在我们中间广为讨论,直到最近看完了这本在各大书店及网站销量飘红的由电子科大的天才型教授周涛翻译的英国作家维克托﹒迈尔-舍恩伯格和肯尼斯﹒库克耶合著的《大数据时代》后,才更深刻领悟了这句话的深层意义。
关于“大数据”最初的兴趣源于一个流传很广的故事:2012年初,一个男人冲进一家位于明尼苏达州阿波利斯市郊的塔吉特(Target)超市兴师问罪:为什么超市不停地向他的还是高中生的女儿邮寄婴儿尿布样品和配方奶粉的折扣券?“你们是在鼓励她怀孕吗?”愤怒的父亲质问超市经理。几天过后,超市经理打电话向这位父亲致歉,这位父亲的语气变得平和起来,他反过来道歉说,他的女儿确实怀孕了,预产期在8月份。
这便是“大数据”的神奇,并非超市的销售部门能预测未来,而是“大数据”通过收集顾客的消费记录,理性地“预测”了即将到来的事实。
对于一本前沿科学读物,身为文科生的我最初阅读时难免担心理解困难,但是很快打消了顾虑。这本书轻快的行文风格和大量详实形象的案例,使我读起来竟兴味盎然,手不释卷。不到一周时间,一本200多页的科学书籍竟在不知不觉中看完了。
此外,本书对我启发更大的是作者关于“大数据”总结出的三个原则:1、要全体不要抽样;2、要效率不要绝对精确;3、要相关不要因果。
这些原则几乎是对我从小树立起认识事物的规律的颠覆性的改变。“要全体不要抽样”,不仅体现了数据采集的全面性,从另一种维度来说,也是在强调要全方位了解事物。“要效率不要绝对精确”虽然是指在采集数据过程中的数据量之大,以至于难以也不再追求精确性,但是我却私自把它看作是对于如我般完美主义强迫症倾向人群的治愈良方:效率与精确是两种不易同时获得的评价,正如鱼和熊掌,必须有所取舍;在如今高速发展的信息社会中,效率无疑是普遍层面上优先追求的。“要相关不要因果”,是大数据中很普遍的一个原则——“我们不必知道现象背后的原因,我们只要让数据自己说话”,对于好奇心很强的水瓶女而言,这简直是个噩耗,但是从法学专业的角度审视,这符合典型的“无罪推定”和“证据裁判原则”。
所以,无论是超市能够运用大数据准确地预测出龙卷风后人们最喜爱的披萨口味,还是某网站而不是政府通过大数据分析准确预测了流感的爆发,都印证了本文开始时老师的那句话:生活本不是你想像的那个样子。
原以为无聊枯燥的科普读物《大数据时代》其实颇为有趣,而对于大数据及其原则而言,也非我们想象的那个样子,不是么?
生活本不是你想象的那个样子——一个非纯粹文科女眼中的《大数据时代》
所有评论(1)