西媒: 遗传多样性图谱揭示个体独特性
参考消息网8月13日报道据西班牙《国家报》网站7月23日报道,如今,对人类基因组变异的最大规模的图谱正式发布。该研究揭示了遗传密码中一个新层次的多样性,这种多样性使得每个个体更加独特,与其他人之间的差异比之前认为的还要大。这一研究突破建立在对五个大洲26组人群的1019人的全基因组的分析之上,在广度和多样性方面创下了纪录,因为早期的基因组研究仅使用了西方白人的脱氧核糖核酸(DNA)。另一项研究则以前所未有的深度分析了65人的全基因组。这两项研究成果7月下旬发表在《自然》杂志上。
其中一项研究的共同作者、西班牙巴塞罗那基因组调控中心的计算生物学家贝尔纳多·罗德里格斯-马丁指出,“研究为理解每个个体从父母那里继承的遗传变异提供了前所未有的参考”,这样的变异决定了我们的外貌、智力和个性。这些数据是“诊断和理解罕见病方面迈出的重大一步”,对癌症和其他更为常见的疾病的诊断和治疗也具有重要意义。
几年前的技术仅允许读取基因组的短片段,也就是大约50个DNA化学字母,而全基因组由30亿个字母组成。新的研究应用了长读长测序技术,以便分析“结构变异”,每个变异包含数万个字母。通过研究发现了16.7万个结构变异,其中一半此前完全未知。在已发现的结构变异中,约有3/5是罕见变异,即仅在少数人群中出现,但它们可能对健康至关重要。
一个人与另一个人在大约2.5万个结构变异上存在差异,这相当于约750万个DNA化学字母的差异。这是已知变异数量的3倍。总体而言,至少有1100万个化学字母决定了每个个体在遗传上的独一无二。
全基因组序列中的单碱基变异是数千种已知罕见疾病的常见病因,这些疾病影响着全球数百万人。罗德里格斯-马丁认为,研究个体之间的结构变异可以揭示其他罕见疾病的隐藏病因。他的团队设计了一种新工具,用于筛查数万种特异性变异,并将潜在致病因素缩小到大约200个,从而简化了诊断过程。巴塞罗那的一家医院已经在使用此类分析技术。
人类基因组充满了高度重复的序列,这些序列占整个遗传密码的60%。造成DNA片段高度重复的“肇事者”是所谓的“跳跃基因”,它们像永不离开基因组的病毒一样,一次又一次地自我复制,有时甚至复制数千次。新研究表明,其中一些“跳跃基因”片段,如L1片段能够从自身利益出发调控基因的运作。罗德里格斯-马丁指出:“在结肠、肺部或食道肿瘤中已经发现了这些片段的数千个副本。”其中一些“跳跃基因”可能会使抑制癌症的必需基因失效。直到几年前,这些重复的片段还被认为是“垃圾DNA”,无人关注。
第二项研究由德国欧洲分子生物学实验室的研究人员主导,以前所未有的详细程度读取了65人的接近完整的基因组。这意味着参与者的99%的遗传密码被读取,同时也覆盖了92%的之前未读取的“空白”区域。该研究的共同作者扬·科贝尔强调:“迄今为止获得的大多数人类基因组存在空白区域,因为无法读取其遗传序列,原因是其中包含许多重复序列、结构复杂以及技术限制。”新的研究中一个里程碑式的成果是成功读取了最难读取的片段,如着丝粒,即连接两条染色体单体的“颈部”,这里发生错误可能会引发自身免疫疾病和癌症。
西班牙国家癌症研究中心的生物学家芭芭拉·埃尔南多对新公布的两项研究表示欢迎,特别是它们对理解癌症的潜在应用。她指出,结构变异占儿童实体瘤病因的6%,因此这样的研究突破具有重要意义,“此外,我们还有许多遗传性癌症病例,其原因尚不清楚。许多可能归因于这种结构变异,而目前在临床上广泛使用的短读长测序技术无法检测到它们”。
埃尔南多还强调了纳入更多样化人群的重要性。她说:“种族背景对癌症的易感性和预后至关重要。例如,非洲裔人群往往患有更具侵袭性的前列腺肿瘤,这些肿瘤是由遗传变异引起的。将这些结构变异的分析纳入临床,可以显著改善癌症治疗,尤其是在迄今为止被忽视的非欧洲人群中。”(编译/王萌)

美国国家人类基因组研究所展示的DNA测序仪的输出结果(美联社)

