女士品茶:统计学如何变革了科学和生活
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

“法西斯主义者”费希尔

在费希尔的这些早期论文中,有些论文数学性很强。他论述相关性的文章,也就是皮尔逊最终同意发表的那篇,使用了大量数学符号,一个标准页里一多半都是数学公式。他也有一些论文没有任何数学成分。在其中一篇论文中,费希尔讨论了如何用达尔文的随机适应理论圆满地解释最为复杂的生物解剖结构。在另一篇论文中,他对性取向的进化进行了推测。他参与了优生学运动,并于1917年在《优生学评论》上发表了一篇文章,号召统一国家政策,“提高专业阶层和高级工匠阶层的生育率”,压制下层社会的生育率。在这篇文章中,他认为向穷人提供福利的国家政策起到了鼓励他们繁衍后代、将基因传给下一代的作用,而中产阶级对经济安全的担忧导致他们推迟婚期,少生儿女。费希尔忧心忡忡地指出,这一趋势的最终结果就是国家为子孙后代选择了“最差”的基因,剔除了“更好”的基因。通过选择性生育提高人类整体基因状况的优生学理论主导了费希尔的政治观点。“二战”期间,他被人们错误地当成了法西斯主义者,无法参与任何与战争有关的工作。

卡尔·皮尔逊的政治观点与费希尔不同。皮尔逊曾经热衷于社会主义和马克思主义,他同情受压迫的人民,喜欢挑战稳定的“上流”社会。皮尔逊的政治观点看起来对他的科学工作几乎没有影响,但费希尔对优生学的关注却导致他在优生学的数学问题上投入了极大的精力。当时人们已经知道,植物或动物的特定性状可以归因于单一基因,这一基因可以通过两种形式中的一种表现出来。从这一新思想出发,费希尔突破了格雷戈尔·孟德尔的工作,提出了估计相邻基因相互影响程度的方法。

存在着控制生命性质的基因,这一观念是科学中广义统计革命的一个部分。我们可以观察到植物和动物的性状,它们被称为“表型”,但我们认为这些表型是各基因以不同概率相互作用的结果。我们希望描述这些看不见的生物内部基因的表型分布。在20世纪后期,生物学家识别出这些基因,以确定它们让细胞制造什么样的蛋白质。我们说起这类事就像真的一样,但我们所观察到的还只是概率的分布。我们所说的基因,即 DNA 链,正是来自于这些分布。

本书介绍的是统计革命的全貌,费希尔在其中扮演了重要角色。他对他在遗传学上取得的成就感到非常自豪,而且他几乎一半的工作成果都与遗传学有关。不过,现在让我们暂且放下遗传学家费希尔不表,看看费希尔在一般性统计方法和统计思想上的成果。他的早期论文已经显现出了这些思想的萌芽,不过这些思想真正成熟则是在20世纪20年代和30年代早期他在洛桑工作的时候。