Cell Genom | 基于微擾轉(zhuǎn)錄組知識圖譜嵌入的化合物-蛋白質(zhì)相互作用預(yù)測
文章來源:上海藥物研究所 | 發(fā)布時間:2024-09-24 | 【打印】 【關(guān)閉】
2024年9月19日,中國科學(xué)院上海藥物研究所鄭明月課題組在Cell Genomics期刊發(fā)表題為“Identifying compound-protein interactions with knowledge graph embedding of perturbation transcriptomics”的研究論文。該研究提出基于知識圖譜的計算模型PertKGE,以數(shù)據(jù)驅(qū)動的形式從微擾轉(zhuǎn)錄組數(shù)據(jù)中解耦出化合物-蛋白質(zhì)相互作用(CPI)。
化合物和蛋白質(zhì)是藥物發(fā)現(xiàn)中兩個最基本的實體,對它們之間相互作用的建模是藥物發(fā)現(xiàn)的基礎(chǔ)。盡管目前仍然沒有一種通用的計算方法可以預(yù)測和解釋所有的化合物-蛋白質(zhì)相互作用,但是研究人員們可以利用不同的生物數(shù)據(jù)、從多種研究視角構(gòu)建化合物-蛋白質(zhì)相互作圖譜。
在藥物發(fā)現(xiàn)領(lǐng)域,微擾轉(zhuǎn)錄組學(xué)聯(lián)系起了藥物發(fā)現(xiàn)中最重要的實體(化合物)和組學(xué)數(shù)據(jù)之間的聯(lián)系,提供了化合物微擾受試體(單細(xì)胞、細(xì)胞系、病人)后產(chǎn)生的直觀微擾結(jié)果,為解耦化合物-蛋白質(zhì)相互作用(CPI)提供了全新的視角。然而由于生物數(shù)據(jù)的噪聲、細(xì)胞穩(wěn)態(tài)以及轉(zhuǎn)錄組表達(dá)的動態(tài)變化等原因,CPI通常不會直接反應(yīng)在差異表達(dá)基因上,這為微擾轉(zhuǎn)錄組數(shù)據(jù)的分析帶來了挑戰(zhàn)。

圖1. PertKGE的工作流
在該項研究中,研究人員提出了基于知識圖譜的PertKGE模型(圖1)。PertKGE模型受啟發(fā)于微擾組學(xué)分析中的因果推斷模型以及知識圖譜在藥物發(fā)現(xiàn)中的廣泛應(yīng)用,從因果視角來構(gòu)建新型的生物知識圖譜,其中包含三個組成部分:(1)原因部分(Cause):化合物與受試體中的特定靶標(biāo)發(fā)生CPI;(2)過程部分(Process):生物系統(tǒng)中多層級的調(diào)控事件(蛋白、RNA、DNA級別調(diào)控)對CPI信號進(jìn)行放大;(3)結(jié)果部分(Effect):微擾結(jié)果以差異表達(dá)基因的形式被觀測。在此基礎(chǔ)上,結(jié)合知識圖譜嵌入技術(shù)來建模因果鏈接,從而達(dá)到從差異表達(dá)基因中解耦CPI的目的。廣泛的計算實驗表明PertKGE在化合物冷啟動和靶標(biāo)冷啟動場景中均取得了最好的CPI預(yù)測性能,并且其通過因果策略引入的多級調(diào)控事件緩解了CPI數(shù)據(jù)集中代表性偏差對模型學(xué)習(xí)的影響,從而大幅提高了預(yù)測的可靠性。

圖2.基于PertKGE的K-756作用靶標(biāo)研究
此外,研究團(tuán)隊將PertKGE整合進(jìn)基于表型和基于靶標(biāo)的藥物發(fā)現(xiàn)流程中,發(fā)現(xiàn)了TNKS抑制劑K-756的新靶標(biāo)ENPP1,為其獨特的抗腫瘤免疫效應(yīng)提供了分子層面的機(jī)制解釋(圖2);以10.8%的高命中率為治療結(jié)直腸癌和胰腺癌的新型靶標(biāo)ALDH1B1篩選到了5個具有全新骨架的苗頭化合物。
在這項研究中,研究團(tuán)隊將CPI預(yù)測任務(wù)對應(yīng)到藥物發(fā)現(xiàn)的真實場景中,從計算模擬和實驗驗證兩方面證明了PertKGE在藥物發(fā)現(xiàn)流程中的作用,為CPI圖譜的構(gòu)建和推理提供了一種全新的策略。
上海藥物所碩士倪圣焜、孔祥泰、陳正陽和中國科學(xué)技術(shù)大學(xué)聯(lián)培博士生張瑩瑩為本文的共同第一作者。上海藥物所鄭明月研究員、張素林副研究員與李敘潼副研究員為論文通訊作者。本研究得到了中國科學(xué)院基礎(chǔ)與交叉前沿科研先導(dǎo)專項、國家自然科學(xué)基金、國家重點研發(fā)計劃、上海藥物所與上海中醫(yī)藥大學(xué)中醫(yī)藥創(chuàng)新團(tuán)隊聯(lián)合研究項目、中國科學(xué)院青年創(chuàng)新促進(jìn)會會員項目、中國科協(xié)青年托舉人才工程以及上海市科技重大專項資助。感謝國家蛋白質(zhì)科學(xué)研究(上海)設(shè)施規(guī)?;鞍踪|(zhì)制備系統(tǒng)工作人員提供的技術(shù)支持和幫助。
