據(jù)最新一期《科學(xué)》雜志報(bào)道,西班牙巴塞羅那基因組調(diào)控中心和英國(guó)威康桑格研究所的研究人員發(fā)現(xiàn),蛋白質(zhì)的核心區(qū)域比此前認(rèn)為的更穩(wěn)定、更具容錯(cuò)性,顛覆了蛋白質(zhì)如多米諾骨牌一般,具有“牽一發(fā)而動(dòng)全身”的脆弱結(jié)構(gòu)的認(rèn)知。該成果有望顯著提升蛋白質(zhì)設(shè)計(jì)效率,加速新藥、新酶等生物產(chǎn)品的開發(fā)進(jìn)程。
蛋白質(zhì)由20種氨基酸組成,其可能組合數(shù)量極其龐大。即便一個(gè)僅含60個(gè)氨基酸的小蛋白,其排列組合方式也高達(dá)10的78次方,幾乎與宇宙中原子數(shù)量相當(dāng)。面對(duì)如此復(fù)雜的組合可能性,科學(xué)界長(zhǎng)期不解,為何進(jìn)化能從中篩選出少數(shù)結(jié)構(gòu)穩(wěn)定、功能可靠的組合?
過去主流觀點(diǎn)認(rèn)為,蛋白質(zhì)核心區(qū)域的氨基酸堆疊緊密,任意改動(dòng)都可能導(dǎo)致整體結(jié)構(gòu)失穩(wěn)。但最新研究顯示,這一傳統(tǒng)觀念并不準(zhǔn)確。
研究人員選擇了一種叫SH3的小型蛋白結(jié)構(gòu)作為研究對(duì)象,它廣泛存在于各種生物體內(nèi)。接著,他們制造了數(shù)十萬(wàn)個(gè)略有不同的SH3版本,并測(cè)試它們是否還能正常折疊和發(fā)揮功能。結(jié)果顯示,絕大多數(shù)變體均能維持穩(wěn)定結(jié)構(gòu)。真正不可改動(dòng)的“關(guān)鍵氨基酸”僅占少數(shù)。這意味著,蛋白質(zhì)的折疊規(guī)則比過去認(rèn)為的要“寬容”得多。
研究人員還基于實(shí)驗(yàn)數(shù)據(jù)建立了機(jī)器學(xué)習(xí)模型,用于預(yù)測(cè)蛋白質(zhì)序列的穩(wěn)定性。該模型在對(duì)比超過5萬(wàn)個(gè)來自細(xì)菌、植物、昆蟲和人類的自然SH3序列時(shí),準(zhǔn)確率極高,即使某些序列與人類版本的相似度低于25%。
這項(xiàng)成果為蛋白質(zhì)工程帶來重要啟示。當(dāng)前,研究人員在設(shè)計(jì)酶類藥物時(shí),往往需要通過大量實(shí)驗(yàn)逐一篩選略有不同的變體,過程緩慢且成本高昂。借助新模型,他們可在計(jì)算機(jī)中同時(shí)測(cè)試多個(gè)設(shè)計(jì)方案,極大提升研發(fā)效率。