9 月 25 日消息,科技媒體 9to5Mac 昨日(9 月 24 日)發(fā)布博文,報道稱蘋果研究團隊發(fā)布了輕量級蛋白質(zhì)折疊預(yù)測 AI 模型 SimpleFold,采用流匹配(Flow Matching)方法替代多序列比對(MSA)等復(fù)雜模塊,大幅降低計算成本。

該媒體指出 AlphaFold2(Google DeepMind 的突破性 AI 模型)、RoseTTAFold 等傳統(tǒng)模型雖然具備更高的精度,但由于依賴多序列比對、三角更新等計算密集的特定架構(gòu),訓練與推理成本高昂。蘋果團隊希望通過簡化結(jié)構(gòu),降低硬件門檻,讓更多科研團隊受益。

SimpleFold 核心采用 2023 年提出的流匹配(Flow Matching)方法,這種技術(shù)源自擴散模型,但在生成過程中不逐步去噪,而是直接從隨機噪聲一次生成目標結(jié)構(gòu)。相比逐步迭代的擴散模型,這種方式跳過多個去噪環(huán)節(jié),計算量更低、生成速度更快,已在文本生成圖像和 3D 建模領(lǐng)域獲得成功。
在實驗中,研究人員分別訓練了從 100M 到 3B 參數(shù)的多個版本,并在 CAMEO22 和 CASP14 兩大權(quán)威基準上進行評估。
這些測試覆蓋了模型在泛化性、魯棒性(Robustness,一個系統(tǒng)或過程在面臨干擾、不確定性或異常輸入時,仍能維持其功能或穩(wěn)定運行的能力)和原子級精度上的表現(xiàn),結(jié)果顯示,SimpleFold 在性能上穩(wěn)定優(yōu)于同類流匹配模型 ESMFlow,并媲美頂尖模型表現(xiàn)。

具體來看,SimpleFold 無需使用昂貴的多序列比對和三角注意機制,在 CAMEO22 上達到 AlphaFold2、RoseTTAFold2 約 95% 的性能。更小的 SimpleFold-100M 版本在保持高效的同時,性能超過 ESMFold 的 90%,驗證了通用架構(gòu)模塊在蛋白質(zhì)預(yù)測領(lǐng)域的可行性和競爭力。

研究還發(fā)現(xiàn),隨著模型規(guī)模和訓練數(shù)據(jù)增加,性能穩(wěn)定提升,尤其在高難度測試中優(yōu)勢明顯。蘋果團隊強調(diào),SimpleFold 只是起點,希望它能推動社區(qū)構(gòu)建更多高效、強大的蛋白質(zhì)生成模型,進一步加速藥物研發(fā)和新材料探索。

附上參考
Apple researchers develop SimpleFold, a lightweight AI for protein folding prediction
SimpleFold: Folding Proteins is Simpler than You Think
本文鏈接:http://www.yifxia.cn/showinfo-45-28166-0.html科研利器:蘋果發(fā)布輕量 AI 模型 SimpleFold,降低蛋白質(zhì)預(yù)測計算成本
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 京東探索研究院升級,劉強東將親自擔任院長