研究团队主要成员合影。  受访者供图

研究团队主要成员合影。  受访者供图

  来源:南方日报

  近日,华大在国际顶级学术期刊《细胞》上发表了迄今为止最大规模的中国人基因组学大数据研究成果。这是由中国科学家主导,历时两年,对14余万中国人无创产前基因检测数据进行深入研究的成果。

  填补大规模中国人基因组学研究空白

  基因是生命的密码,国家级人群基因组学研究以及对遗传资源的保护与应用是精准医学的基础。大型研究项目的完成需要较长周期,项目设计、样本采集及基因测序需要花费大量的时间与资金,合理利用已有的数据将大大加速这一进程。

  鉴于此,在严格遵从《人类遗传资源管理暂行办法》和生命伦理原则的规范,以及充分重视知情同意和隐私保护的前提下,华大研究团队选取了14余万无创产前基因检测数据展开了群体水平的研究,开发了一系列适用于此类数据的分析方法,揭示了包括31个省、36个少数民族在内的中国人群精细遗传结构,实现了多种表型的全基因组关联分析,揭示了中国人群中病毒序列分布特征,构建了包含约900万个多态性位点的中国人群基因频率数据库(CMDB),其中包括约20万个新发现的多态性位点。

  该文章通讯作者、华大生命科学研究院院长徐讯表示,这一成果填补了大规模中国人基因组学研究领域的众多空白,揭示了一系列中国人群特有的遗传特征,有助于推动我国精准医学事业的发展,加速基因科技在出生缺陷、癌症、感染等领域的应用。

  中国有能力管理自己的遗传资源

  据相关负责人介绍,这是高水平国际学术期刊第一次认同在其上发表基因组学文章所使用的数据仅须保存于深圳国家基因库,而无须向海外数据库进行备份,这意味着国际学术期刊对我国遗传资源保护法规政策的充分尊重与认同,也代表着中国已经完全有能力与实力管理与保护我国重要的遗传资源,这对于我国的基因数据自主权具有重要的战略意义。

  此次研究揭示了中国汉族与少数民族群体的遗传特点,并发现当今中国人群的遗传特征分布同时受到丝绸之路等历史因素与近代人口大规模迁徙的影响。

  据悉,目前全球已检测的无创产前基因检测(简称NIPT)已超过1200万例,仅华大基因一家机构已完成逾350万例。发表于《细胞》的这次成果,是华大研究团队在大规模人群队列研究的一次尝试。研究小组开发了适用于此类数据的分析方法和算法,并希望由此建立一套基于超低深度测序数据进行组学大数据研究的方法和策略,进一步发挥NIPT数据的价值,最终在《细胞》发表了题为《无创产前基因组学研究揭示多种复杂性状的遗传关联、病毒感染模式以及中国人群体历史》的研究成果。

  文章共同通讯作者金鑫博士指出,该成果首次证明了NIPT数据在基因组学和群体遗传学研究中有着巨大的价值和潜力,此次研究建立的分析策略、算法和数据库,对于今后类似研究的开展有着重要的示范和借鉴意义。

  10月10日,关于此次科研成果的新闻发布会将在深圳国家基因库召开,正式对外发布这一项科研成果。

  ■链接

  甘肃省和青海省的汉族人有更多欧洲血统

  华大的研究小组主要从中国人群体遗传学、复杂性状的全基因组关联分析、中国人病毒感染图谱三个方面揭示中国人群体中的生物大发现。

  其中,通过本次研究,科研人员发现,甘肃省和青海省的汉族人群体中所含有的欧洲人成分明显高于其他省份。这个地区在古代恰巧是丝绸之路的必经之地——河西走廊,是中西方人群汇聚的地方,很可能由此导致该地区汉族人有较高的欧洲血统。