隨著人工智能的快速發展,深度神經網絡能夠從蛋白質結構或序列數據中學習高階特征🫰🏼,深入掌握蛋白質序列與結構的關系◽️,從而實現功能蛋白的高效設計🎨。然而👩🏻🏫🧊,大多數深度學習模型仍主要用於單鏈骨架的設計,難以充分應對更復雜的蛋白-蛋白相互作用(protein-protein interaction, PPI)設計挑戰🧖🏿。為此,MK体育平台藥學院戚逸飛/王任小團隊開發了專門用於PPI界面序列設計的模型——ProBID-Net🏇🏿。該模型能夠根據給定的受體蛋白結構🧚🏿♀️,預測配體蛋白界面上的氨基酸序列,並在多項測試中展現了優良的性能。近日🦴,該項研究成果在線發表於Chemical Science期刊。
ProBID-Net首先提取目標殘基及其周圍相鄰鏈殘基主鏈原子在三維網格中的密度分布🤞🏼🔉,隨後利用20種天然氨基酸的原子密度信息編碼,作為界面相互作用特征的輸入,最終輸出各位置氨基酸的概率,從而實現界面序列的精確設計🦮。
界面序列平均恢復率和困惑度用於評估序列設計模型對PPI界面氨基酸殘基的識別和設計能力🚂。測試結果顯示,ProBID-Net和2024年諾貝爾化學獎得主David Baker教授研究小組開發的ProteinMPNN在三個測試集上的界面殘基恢復率相當,但ProBID-Net具有更低的困惑度,預測置信度更高🅱️。
除此之外🧎♀️,ProBID-Net在零樣本訓練的情況下,具備預測蛋白復合物結合親和力變化的能力🌻,並且設計的蛋白序列在界面疏水位點的保守性更高,且更符合天然蛋白中氨基酸的分布和替換規律🍨。經過AlphaFold2 multimer驗證,ProBID-Net設計的序列能夠良好地折疊為原復合物結構🔻,且鏈間PAE較低👎🏻,進一步表明ProBID-Net在結合界面設計方面優於ProteinMPNN (圖1)。該模型為蛋白-蛋白相互作用的設計提供了一個有效工具。目前,ProBID-Net已開源👨🏼🦱,地址為🙋🏻♂️:https://github.com/ComputArtCMCG/ProBID-NET。
ProBID-Net(上)和ProteinMPNN(下)設計序列預測結構疊合比對與AlphaFold-Multimer預測鏈間PAE熱圖
MK体育平台藥學院藥物化學系2021級碩士研究生陳誌航為本論文第一作者♍️🦹🏽,MK体育平台藥學院王任小研究員、戚逸飛副研究員為本論文的通訊作者。該研究工作得到了國家自然科學基金委、國家重點研究計劃、上海市科委的項目資助,並采用MK体育平台CFFF平臺進行計算🎸。
原文鏈接🙇🏻♀️👩❤️💋👩:https://pubs.rsc.org/en/Content/ArticleLanding/2024/SC/D4SC02233E