写于 2017-01-08 08:12:35| 优发娱乐| 公司

当科学家们首次决定对人类基因组进行测序时,这似乎是一项不可能的大而复杂的挑战

自实现这一目标以来的十年,科学家面临着同样巨大的挑战:了解人类,整个基因数据折叠成一个微小的细胞核

在今天发表在Nature Genetics上的一项研究中,我和来自悉尼的John Mattick以及来自西雅图华盛顿大学的Garvan医学研究所和John Stamatoyannopoulos表明,基因组的折叠不仅会影响哪些基因被转录,还有基因本身的内部布线

人类基因组由脱氧核糖核酸(DNA)组成,脱氧核糖核酸是所有生物体的遗传物质

每个人,基因组都存在于一个细胞核中,是一个由大约30亿个氨基酸字母或核苷酸组成的序列(包括鸟嘌呤,腺嘌呤,胸腺嘧啶和胞嘧啶),它们编码大约57,281个基因,这些基因决定了创建和维持人

延伸出来,DNA分子长约3米,必须小心地折叠并压缩成复杂的三维结构,这种结构不会束缚在结中,并且适合细胞的细胞核

这是一项令人难以置信的壮举,因为哺乳动物细胞核的直径仅约为6微米,约为人类头发宽度的十分之一

为了表达我们的基因指令,将基因序列复制或转录到核糖核酸(RNA)分子中,该核酸核酸(RNA)分子从细胞核中进入细胞内的液体(细胞质),并被“转化”成最终的序列

蛋白质产品

科学家们开始意识到基因组,三维结构如何帮助决定哪些基因表达,哪些不表达

细胞核被划分为繁忙和活跃的区域以及许多基因被转录的区域,以及基因沉默的其他压缩区域

通过将基因呈现在活性区域中,基因组结构可以影响转录哪些基因

人类基因由称为外显子的小部分组成,它们由长的非编码DNA序列分隔,称为内含子

当基因被转录时,介入的内含子被切割或“剪切”出来,外显子被重新组合在一起形成序列,然后被翻译成蛋白质

通过包含或去除不同的外显子,可以将不同组合的相同基因拼接在一起,然后将其翻译成不同的蛋白质产物

我们分析了ENCODE项目产生的大量数据,该项目是一项大型国际合作,旨在识别人类基因组的所有功能元素

从这个分析,我们可以推断出具有非常高分辨率的三维基因组结构,在序列中显示甚至很少的折叠和扭结

令人惊讶的是,我们发现在一个基因中,外显子序列经常折叠在一起(与转录机器组装的基因的起点一起),而介入的内含子被圈出

这种折叠可能有助于确定哪些外显子串在一起形成转化为蛋白质的最终序列

自人类基因组出版以来,科学家们将其序列表示为一个30亿字母的字母

然而,这项研究增加了人们越来越多的认识,即不仅重要的是基因组序列,而且这个序列的折叠方式也是如此

对科学家而言,下一个不可能的重大挑战似乎是将基因组序列确定并表示为巨大的,动态的和复杂的结构,就像它在细胞核内折叠一样

作者:刁塑