北京时间2023年9月1日,国际学术期刊Science在线发表了中国科学院上海营养与健康研究所李海鹏研究组与华东师范大学脑功能基因组学研究所潘逸萱研究组合作的题为“Genomic inference of a severe human bottleneck during the Early to Middle Pleistocene transition”的最新研究成果。该研究创建了快速极小时间溯祖(FitCoal)新理论,并发现人类在早、中更新世过渡期由于气候环境的急剧变化经历了严重的群体瓶颈,人类祖先近乎灭绝。
史前人口数量的变化,综合反映了该时期气候环境的变迁,所以通过群体遗传学的研究方法进行回溯,可以更深入地了解现代人类的形成。已有化石记录表明,最近100万年是人类进化的关键时期,但人类群体历史的研究多局限于最近的30~10万年内。虽然近年来古DNA测序技术迅猛发展,但由于炎热条件不利于DNA的保存,无法从30万年前非洲人类祖先化石中提取古DNA。所以该研究通过群体遗传学新理论分析现代人群基因组,研究百万年前的群体历史。
史前虽然没有文字记载群体数量,但有效群体大小会影响每个世代的溯祖率,也就是两个谱系在上一世代来自同一祖先的概率。因此人类祖先曾在群体基因组中留下印记,反映当时的群体大小。群体历史越久远,留存至今的印记信号越微弱。为准确解读这些信号,进而准确估算百万年前人类群体历史,研究人员创建了群体遗传学和计算生物学新理论,快速极小时间溯祖FitCoal。遵循这一理论进行数学推导,获得在任意群体模型下各突变类型(即突变频谱)对应溯祖树枝长期望值的解析解,并获得精确的似然值,即在群体历史条件下观察到样本突变频谱的概率。因此无需事先获得群体历史的先验知识,FitCoal即可自动快速搜寻出极大似然值,从而估算群体历史,对古人类群体进行“人口普查”。
研究人员通过设定群体历史模型(true model)并分析模拟产生的DNA多态数据,衡量估计群体历史的无偏性和95%置信区间,即可评判一个分析方法的准确程度。图1显示了两个群体历史模型的分析结果,可以看出FitCoal估计的群体历史不但是无偏的,而且其置信区间也小于目前领域内常用的PSMC,Stairway Plot和SMC++三种方法。研究人员进一步通过大量的计算机模拟,分析不同条件下的群体历史,包括群体交融和自然选择,所有结果均表明FitCoal可以精准地估计百万年内的人类群体历史。
FitCoal,PSMC,Stairway Plot和SMC++估计的群体历史
基于FitCoal,研究人员进一步分析了来自千人基因组计划和HGDP-CEPH基因组计划产生的、共50个现代人类群体的基因组数据,首次发现在距今93.0万年前,人类祖先由于早、中更新世过渡期的气候剧烈变化,在短期内丧失了约98.7%的成员个体,几乎灭绝。在长达11.7万年的时间里平均成年个体数仅为1,280,并且从千人基因组和HGDP-CEPH两组独立数据获得这一群体大小的估值几乎完全一致,分别为1,270和1,300。考虑到群体数量的自然波动,这一平均估值代表了远古群体瓶颈期间最小群体数量的上限。研究人员采用HGDP-CEPH数据集的两个南部非洲群体作了进一步验证,虽然样本量仅为6个和8个个体,但FitCoal依然检测到了远古群体瓶颈。对非洲群体样本重抽样的研究结果表明,仅需3个非洲个体的基因组,FitCoal即可检测到这一远古群体瓶颈,进一步表明计算生物学创新成就了这一发现。
这一严重的远古群体瓶颈,恰好与非洲人类祖先化石的缺失环节、非洲直立人(Homo erectus)化石的消失、新的古人类物种(LCA)的形成、两条古人类2号染色体的融合阶段相对应(图2)。进一步说明早、中更新世过渡期严重的群体瓶颈对人类进化具有关键影响,可能决定了现代人类许多关键表型的形成。并且这一远古时期群体数量的衰减,降低了65.85%现代人群的遗传多样性,对人类生命和健康产生了深远的影响。
人类祖先在早、中更新世过渡期经历的严重群体瓶颈(图片右侧对应非洲古人类化石缺失环节和不同的化石分类、2号染色体的融合时间,其中LCA指现代人类、尼安德特人和丹尼索瓦人的共同祖先)
这一人类进化史上的重大发现,是国际合作研究成果,由中国科学家主导,联合了意大利罗马大学(Giorgio Manzi博士)、佛罗伦萨大学(Fabio Di Vincenzo博士)和美国德克萨斯大学(Yun-Xin Fu博士)共同完成。中国科学院上海营养与健康研究所博士毕业生、华东师范大学原实习生胡王杰博士和中国科学院上海营养与健康研究所博士毕业生、山东第一医科大学助理研究员郝子谦博士为该发现的共同第一作者,中国科学院上海营养与健康研究所李海鹏博士和华东师范大学脑功能基因组学研究所潘逸萱博士为该发现的共同通讯作者。该项工作得到了国家自然科学基金、中国科学院先导专项、科技部国家重点研发计划、美国国立卫生研究院、山东省自然科学基金、中国博士后科学基金、中国科学院上海营养与健康研究所和华东师范大学、以及济南市市校融合发展战略工程项目经费的资助。
专家点评
吴仲义教授(中山大学生命科学学院教授、博士生导师;中国台湾“中研院”院士;美国科学促进会会士(AAAS Fellow);进化生物学与遗传学家,长期从事分子进化、群体遗传学和进化基因组学方面的研究):
李海鹏团队和潘逸萱团队在Science的合作论文“Genomic inference of a severe human bottleneck during the Early to Middle Pleistocene transition”必定会引起很多关注。论文的结论是在90万年前左右,人类祖先的群体数目下降到一千多人。这个群体瓶颈维持了至少10万年。这个结论的人类学意义,会有非常多的讨论。演化学者关注的是这个结论是怎么来的。(毕竟大多数动植物都有起起落落的时候,十多万年前大型动物还经历了一场浩劫。)李海鹏团队和潘逸萱团队在这个题目做的重大贡献是提出了理论框架,基于基因变异频谱倒溯上百万年才看到这个现象。目前的理论框架里,大概可以回看三四十万年。这篇论文,理论架构全部在附件里。正文只是刊登了上述的结论。所以这是个买椟藏珠的故事。也是近年CNS期刊上少数凤毛麟角的理论论文。
刘晓明教授(美国南佛罗里达大学(University of South Florida)教授;群体遗传学和人类遗传学家、长期从事群体遗传学和进化基因组学方面的研究):
李海鹏、潘逸萱团队的工作同时在方法学和科学发现上都取得了重要进展。方法学上他们发展了FitCoal方法。这是目前为止最为准确的估计有效群体规模历史的方法。而且这个方法是基于突变频谱的数据,具有数据形式适应性强,计算速度快等一系列优点,有非常广泛的应用前景。在科学发现方面他们第一次展示人类在约一百万年前所经历的一次严重群体规模瓶颈基因组证据。这一推断与一系列人类学,古气候学的证据在时间上吻合,进一步增强了这一发现的可靠性。回顾之前的人类有效群体规模历史的研究,其实这一瓶颈事件也并非无迹可寻。比如stairway plot方法在2015年研究千人基因组计划数据的时候就显示非洲群体在50万至100万年间有一个严重瓶颈,谷底在60万年左右。在非洲之外的群体观察不到这个瓶颈。由于stairway plot这个方法在近尾端存在一个伪瓶颈和远古历史分辨率比较低的局限性,所以无法对这个瓶颈做进一步的研究。正是由于FitCoal这个方法首先在方法学上取得了重大进展,才使得这一发现得以合理的解释和验证。这是一个非常好的方法学推动科学发展的例子。李海鹏、潘逸萱合作十年终于取得这一重大科学进展和发现,可喜可贺!
杨剑教授(西湖大学统计遗传学实验室负责人、生命科学学院教授;致力于统计遗传学、基因组学研究,以及人类遗传、复杂性状和疾病的大数据分析):
人类的起源问题极其重要且引人入胜,而人群数量的变化历史,为研究人类起源提供了关键信息。最近100万年是现代人类进化的关键时期,在这个背景下,中国科学院上海营养与健康研究所的李海鹏团队与华东师范大学的潘逸萱团队合作,创立了快速极小时间溯祖FitCoal新理论,这一理论在百万年这一大时间尺度上,实现了高精度的时间回溯,能够同时准确地估计近期和远古的群体历史。通过分析50个现代人群的全基因组序列,他们首次发现人类祖先在早、中更新世过渡期经历了严重的群体瓶颈,几乎濒临灭绝。这一里程碑事件,对于人类进化具有重要影响,可能决定了人类许多关键表型的形成。
我曾有幸在西湖大学组织的一次学术会议上听过李海鹏老师关于这项研究的报告,非常高兴看到这一重要成果得以发表在Science上。这是一个“新理论带来新发现”的研究典范,不仅展示了计算生物学对相关领域的促进和推动作用,也为进一步研究和确定所有人类的出生地提供了关键的线索。
来源:上海科技