因数和人的差不多,但是绝大多数基因属于沉眠状态,如果生物的基因全部觉醒,人类的能力甚至比不了苍蝇。
早在上世纪九十年代初,科学家们就开始着手绘制人类基因组的整个dna序列,这项研究被称作“人类基因组工程”。
其目的是为了探究基因与疾病的联系,并了解基因组各种元素的功能与结构,例如哪些基因编码蛋白质、哪些因素调节基因表达等。
该工程初步预测人类有40,000个基因可以给蛋白质编码,而蛋白质这种大分子对身体组织和器官的良好运作起着至关重要的作用。
然而,当这一项目在2003年接近尾声时,对编码蛋白质的基因数量的估计已被降至约20,000~25,000个。
从那时起,科学家们就开始努力确认最终的蛋白质组——即可以由基因表达的蛋白质总数——并且一直致力于了解这些蛋白质的基因表达如何在几种疾病中发生突变。
研究发现,被列出的总数为22,210的蛋白质编码基因中,只有19,446个真正起作用,还有2,764都是非编码基因,或叫做伪基因,不能编码蛋白质。
研究还发现,还有另外1,470个基因没有蛋白质编码基因的功能特征或典型演化,但在三个数据库中却同时都被列为蛋白质编码基因。
这三个参考数据库目前对人类编码基因数量的估算比实际至少多出了2000个,这也使大规模生物医学实验变得复杂。
本章还未完,请点击下一页继续阅读>>>