数据之巅

数据之巅读书笔记

《数据之巅》这本书是公司 VP 在一次开会的时候推荐我们看的,当时各种原因一直没看。最近突然想起,用了不到一周的时间看完了。

《数据之巅》的作者涂子沛,现任阿里巴巴副总裁。2012 年写过一本《大数据》,社会对《大数据》这本书的评价很高,国务院副总理汪洋在广东省财政厅调研时,向全体干部推荐《大数据》一书,并在讲话中说:「我希望大家能认真读一读这本书,带着问题读,带着想法读。」

《数据之巅》以美国历史历史为纵线,包括美国第一个百年的三个时代:初数时代、内战时代、镀金时代,以及 20 世纪后数据成熟期的量化时代、抽样时代、开放时代、大数据时代。记述美国建国初期民主分权到两党之争过程中对数据的态度和应用,通过人口普查平息难忘战争和解放黑奴等历史…

也正是因为美国从上(总统)至下对数据的强烈关注(詹姆斯.加菲尔德总统发表过数学论文)和需求,到镀金时代出现了一些伟大的发明家和「产品」。(1860~1890年,国美一共授出 50 万项专利)

1、西顿,1870 年发明西顿制表器(Seaton Device)

2、沃克,1874 年出版美国《统计地图集》(Statistical Atlas),54 份手绘图表

3、霍尔瑞斯,1890 年打孔卡片制表机,把普查数据处理时间从八九年缩短到两年半。1896 年成立的公司 Tabulating Machine Company 是 IBM 的前身

……

尽管中国的数据可视化落后于美国,但依然诞生了一位被国际界称为「中国地理第一人」的陈正祥。陈正祥是中国数据可视化的先驱,一生致力于绘图,主张地图说话,他的作品《中国文化地理》引入大量各朝代人口数据,政治领袖籍贯分布数据进行绘图,堪称用数据和地图谱写的中国文化史。为了绘制出中国蝗虫灾害分布,他共翻阅了 3000 多种方志,中台湾大学到南岗历史语言研究所,又到东京、京都和天理。不过遗憾的是陈正祥的著作只有少数在中国大陆出版。

抽样时代的到来,《文学文摘》(Literary Digest)杂志成功预测了连续四届总统大选的结果。盖洛普将数据带进美国电影业,其对《乱世佳人》(Gone With the Wind)预测 5650 万观众与最终 5997 万观众相距不到 6%。更为传奇的是盖洛普的朋友——爱德华兹.戴明,他被后世誉为「质量管理之父」。

二战后的美国,经济繁荣,淹没了戴明主张的在生产中进行质量控制做法。带着他的理论,戴明去了让他驰名世界的国家——二战后一片废区的日本。战争给日本造成了严重的破坏,物资匮乏、粮食紧张,但日本社会去异常镇定、到处干净整洁;日本人对新知识非常渴求、对工作非常投入。戴明认为,在日本,他见到了最好的、最认真的学生。也是因为这样的「学生」,使得戴明的一套运用统计来提高产品质量的方法快速执行。

戴明向 21 位日本行业巨头承诺:「如果按照我倡导的原则去做,你们就可以生产出高质量的产品。5 年内,日本的产品将占领整个国际市场。」看似痴人说梦的的发言 10 年后成真了,美国大众几乎都没听过的丰田品牌成功击败了所有的美国对手,横扫美国市场,摘取了世界汽车生产质量第一、数量第一的双重桂冠。1981 年,日本称为全球最大的汽车出口商,期出口量是美、德、法三国叫车之和;1983 年,丰田推出的佳美车型的 10 年后,9 年都是美国市场最畅销的车型,唯一一年第二,输给的还是日本品牌——日本雅阁。2008 年,丰田超越美国通用,成为全球汽车产量最大的公司。

一个如此杰出的人物,在美国默默无闻,在日本被设有戴明奖,获得过二等珍宝勋章并受过天皇接见,被日本誉为质量控制之神。巧合下被美国一位制片人发现,拍摄完纪录片后在美国才一夜成名,然后相继成为通用、宝洁、福特、亨氏等一系列美国大公司的座上宾,并得到里根总统授予的国家技术奖章和类似日本戴明奖的国家质量奖。

大数据时代的到来,数据公开,数据创新都将改变我们的社会。正如本书作者所说:数据文化是尊重事实、强调精确、推崇理性和逻辑的文化。数据文化是匮乏,是中国之所以落后的一个重要的原因;建设这种文化,中华文明的面貌将焕然一新。国与国之间的竞争,表面上是科技的竞争、经济的竞争,但归根结底,还是国民素质的和文化的竞争。改变,并不一定代表进步,但进步,一定需要改变。

不论是否从事数据相关工作的同学,都推荐看此书。

评论