UniProt數(shù)據(jù)庫由歐洲生物信息學(xué)研究所、瑞士生物信息學(xué)研究所和美國喬治城大學(xué)醫(yī)學(xué)中心合作建立,主要由UniProtKB知識庫、UniParc歸檔庫和UniRef參考序列集三部分組成。
其中UniProtKB由人工審核過的Swiss-Prot蛋白數(shù)據(jù)庫和未人工審核過的TrEMBL組成,前者有56萬條記錄,后者有1800萬條記錄。該數(shù)據(jù)庫可供查閱蛋白質(zhì)的功能描述、分類信息、亞細胞定位、相關(guān)的疾病、翻譯后修飾、表達、結(jié)構(gòu)、反應(yīng)、蛋白家族和序列等信息,網(wǎng)站也提供在線的序列相似性搜索BLAST、序列比對Align和系統(tǒng)發(fā)育樹構(gòu)建等工具。
2002年,獲美國國立衛(wèi)生研究院(National Institutes of Health)和美國科學(xué)基金會(National Science Foundation)、歐盟(European Union),以及瑞士聯(lián)邦政府教育和科研聯(lián)合辦公室等機構(gòu)資助,Swiss-Prot、TrEMBL和PIR三個國際上主要蛋白質(zhì)序列數(shù)據(jù)庫合并,建立了通用蛋白質(zhì)資源(Universal Protein Resource, UniProt)。