给览网 行情 实验室常用设备

转录组测序解析癌症mRNA

发布日期:2013-10-17 浏览次数 :879

转录组测序解析癌症mRNA 真核生物的 mRNA 包括2 种形式的转录本, 根据它们3′端是否存在poly(A)尾巴, 可以分为带 poly(A)的 mRNA(简写成 poly(A)+mRNA)和不带 poly(A)的mRNA(简写成poly(A)mRNA)。Poly(A)+ mRNA的主要功能是促进蛋白质的编码, 但是对poly(A)mRNA的功能却知之甚少。

来自中科院计算技术研究所生物信息学研究组,生物物理研究所等处的研究人员通过建立一个综合性的数据分析流程,比较了poly(A)+及 poly(A)mRNA 在正常细胞系和对应的癌症细胞系中的表达差异,指出poly(A)mRNA 也可能在癌症的发生和发展中发挥着重要的作用。
poly(A)mRNA 或者双态 mRNA 是人类细胞系转录产物中非常重要的组成部分。虽然如此, 科学家们对它们功能的研究却比较少, 尤其是对那些在正常细胞系和癌症细胞系中差异表达的 mRNA功能知之甚少。近的一篇文献发现锌指因子蛋白家族的一员 ZNF 具有不带 poly(A)尾巴的非组蛋白mRNA, znf460 和 sesn3。因此, 为了能够更好地了解这些不带poly(A)的mRNA在癌症的发生发展中所起的作用, 很有必要对这些在正常细胞系和癌症细胞系中差异表达的 poly(A)或者双态 mRNA 进行功能的研究。
在这篇文章中,研究人员共使用了8个链特异性的RNA-seq测序数据集,总共来自4个细胞系: 正常人类乳腺上皮细胞系(human mammary epithelial cell line HMEC)、人类乳腺癌细胞系(breast cancer cell line MCF-7)、 人类正常肺纤维母细胞(human lung fibroblast cell line NHLF)及人类肺癌细胞系(lung cancer cell line A549). 每个细胞系包含带poly(A)及不带poly(A)尾巴
的mRNA两种RNA-seq测序。
这8个RNA-seq测序数据集是ENCODE(the Encyclopedia of DNA Elements)计划的一部分, 由美国冷泉港实验室使用 Illumina GAIIx 测试平台测序得到。测序数据共包含 808.7 百万读段(read)的双末端(paired end)测序数据, 每端的长度为 76 bp. 所有这些数据访问编号为 GSE30567, 可以通过美国国立生物技术信息中心基因表达综合网站下载。
研究人员先从这些不同细胞系中鉴定出这些不同形式的 mRNA, 然后比较这些 poly(A)+及 poly(A)mRNA 在正常细胞系和对应的癌症细胞系中的表达差异, 从而确定这些 RNA 转录物的潜在功能。
生物信息学的分析表明, 在正常和肿瘤细胞系中确实存在差异表达的 poly(A)+和 poly(A)mRNA. 对差异表达的基因进行功能富集, 结果表明, 这 2 类 mRNA 都富集了包括细胞周期、细胞凋亡及细胞死亡相关的功能, 而这些功能已经被证明和癌症的发生和发展是密不可分的. 此外, 还有一类差异表达的 poly(A)mRNA 富集了和翻译及翻译延长相关的功能。
这项研究表明(ⅰ) 一些已经注释的编码基因表现为 poly(A)的形态; 
(ⅱ) 根据基因的转录本在poly(A)+和poly(A)测序样本中的表达差异, 转录本被分为 3 种形态: poly(A)+, poly(A)及双态; 
(ⅲ) 平均所有表达的基因转录本中有一半是 poly(A)+, 另外一半是 poly(A)(10%)或者双态(40%); (ⅳ) GO 富集分析发现, 一些差异表达的poly(A)+和 poly(A)的基因富集的功能和细胞周期、DNA 损坏及细胞凋亡相关, 还有一些差异表达的poly(A)基因富集的功能与基因的翻译延长及翻译相关, 这些表明一些poly(A)+和poly(A)的基因在癌症的发展过程中发挥着重要的作用。