人類基因約有兩萬多個(gè)人類基因編碼蛋白質(zhì)和多肽。
這是對(duì)整個(gè)基因組序列的估計(jì),遠(yuǎn)低于初期的生化分子生物學(xué)估計(jì)的近十萬個(gè)。結(jié)果表明由于突變導(dǎo)致閱讀模式的改變,同一基因可能編碼多個(gè)蛋白質(zhì),人類基因組由三億對(duì)核苷酸組成。除了編碼蛋白質(zhì)和表達(dá)調(diào)控元件外,還有大約90%的非編碼區(qū),被稱為垃圾DNA。然而,后來發(fā)現(xiàn),這些區(qū)域可以轉(zhuǎn)錄成多種小RNA,例如微RNA基因。雖然不編碼肽,但在基因表達(dá)中起著必要的調(diào)節(jié)作用,并與身體的生理和病理學(xué)密切相關(guān)。