99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

成功率提高7倍!新方法一句話就能讓AI秒出分子設(shè)計(jì)+合成步驟

0
分享至


(來(lái)源:MIT News)

尋找具備研發(fā)新藥物和新材料所需特性分子的過(guò)程既繁瑣又昂貴,需要耗費(fèi)大量計(jì)算資源,研究人員往往要花費(fèi)數(shù)月時(shí)間,才能在浩如煙海的候選分子中篩選出數(shù)量有限的目標(biāo)分子。

像 ChatGPT 這樣的大語(yǔ)言模型有望簡(jiǎn)化這一流程,然而,讓大語(yǔ)言模型像理解句子中的單詞那樣理解和推理構(gòu)成分子的原子與化學(xué)鍵卻存在技術(shù)壁壘。

近期,麻省理工學(xué)院和 MIT-IBM 沃森人工智能實(shí)驗(yàn)室的研究人員開發(fā)出一種頗具前景的方法,利用基于圖的模型(Graph-based Model)來(lái)增強(qiáng)大語(yǔ)言模型(這些模型專為生成和預(yù)測(cè)分子結(jié)構(gòu)而設(shè)計(jì))。

該方法通過(guò)基礎(chǔ)大語(yǔ)言模型解析用戶自然語(yǔ)言需求后,能在分子設(shè)計(jì)、原理闡釋及合成路線規(guī)劃等環(huán)節(jié)智能切換 AI 模塊。

它將文本、圖形和合成步驟生成交織在一起,把單詞、圖形和反應(yīng)整合為一個(gè)通用詞匯表,供大語(yǔ)言模型使用,實(shí)現(xiàn)多模態(tài)信息無(wú)縫銜接。

與現(xiàn)有的基于大語(yǔ)言模型的方法相比,這種多模態(tài)技術(shù)生成的分子更符合用戶設(shè)定的規(guī)格,有效合成方案成功率從 5% 提升至 35%

該方法的效果優(yōu)于規(guī)模比它大 10 倍以上、僅使用文本表示來(lái)設(shè)計(jì)分子和合成路線的大語(yǔ)言模型,這表明多模態(tài)融合是新系統(tǒng)成功的關(guān)鍵。

“這有望成為一個(gè)‘端到端’的解決方案,能實(shí)現(xiàn)分子設(shè)計(jì)與合成全過(guò)程的自動(dòng)化。如果大語(yǔ)言模型能在幾秒鐘內(nèi)給出答案,將為制藥公司節(jié)省大量時(shí)間。”麻省理工學(xué)院研究生、該技術(shù)論文的合作者 Michael Sun 說(shuō)道。

這項(xiàng)研究成果將在國(guó)際學(xué)習(xí)表征會(huì)議上發(fā)表。論文的合作者還包括圣母大學(xué)研究生 Gang Liu、麻省理工學(xué)院電氣工程與計(jì)算機(jī)科學(xué)教授 Wojciech Matusik,以及 MIT-IBM 沃森人工智能實(shí)驗(yàn)室資深科學(xué)家 Jie Chen。這項(xiàng)研究部分由美國(guó)國(guó)家科學(xué)基金會(huì)、海軍研究辦公室以及 MIT-IBM 沃森人工智能實(shí)驗(yàn)室資助。



優(yōu)勢(shì)互補(bǔ)

大型語(yǔ)言模型并非為理解化學(xué)的微妙之處而設(shè)計(jì),這也是它們難以進(jìn)行逆向分子設(shè)計(jì)的原因之一。逆向分子設(shè)計(jì)是指識(shí)別具有特定功能或特性的分子結(jié)構(gòu)的過(guò)程。

大語(yǔ)言模型將文本轉(zhuǎn)換為一種名為標(biāo)記的表示形式,用于按順序預(yù)測(cè)句子中的下一個(gè)單詞。但分子是由原子和化學(xué)鍵組成的“圖形結(jié)構(gòu)”,不存在特定順序,這使得它們很難編碼為順序文本。

另一方面,基于圖的模型將原子和分子鍵表示為圖形中相互連接的節(jié)點(diǎn)和邊。盡管這些模型在逆向分子設(shè)計(jì)中應(yīng)用廣泛,但它們需要復(fù)雜的輸入,無(wú)法理解自然語(yǔ)言,且生成的結(jié)果可能難以解釋。

麻省理工學(xué)院的研究人員將大語(yǔ)言模型與基于圖的模型整合到一個(gè)統(tǒng)一框架中,實(shí)現(xiàn)了優(yōu)勢(shì)互補(bǔ)。

Llamole(Large Language Model for Molecule Discovery,分子發(fā)現(xiàn)大型語(yǔ)言模型)利用基礎(chǔ)大語(yǔ)言模型作為“智能調(diào)度員”,理解用戶的查詢,即用戶用通俗語(yǔ)言對(duì)具有特定屬性分子的需求。

例如,用戶在尋找一種分子量為 209、具有特定鍵特性,且能穿透血腦屏障并抑制 HIV 的分子。

當(dāng)大語(yǔ)言模型響應(yīng)用戶查詢預(yù)測(cè)文本時(shí),系統(tǒng)會(huì)通過(guò)獨(dú)特的“觸發(fā)令牌”機(jī)制,在三大功能模塊間智能切換:1、結(jié)構(gòu)生成模塊(基于圖擴(kuò)散模型,根據(jù)輸入條件構(gòu)建分子骨架);2、語(yǔ)義轉(zhuǎn)換模塊(通過(guò)圖神經(jīng)網(wǎng)絡(luò)將分子結(jié)構(gòu)重新編碼為大語(yǔ)言模型可理解的詞元);3、合成規(guī)劃模塊(根據(jù)中間體結(jié)構(gòu)預(yù)測(cè)反應(yīng)路徑,逆向推導(dǎo)從基礎(chǔ)原料到目標(biāo)分子的完整合成方案)。

“這樣做的精妙之處在于模塊間的信息閉環(huán),大語(yǔ)言模型在激活特定模塊前生成的所有內(nèi)容,都會(huì)輸入到該模塊中。該模塊會(huì)以與之前一致的方式進(jìn)行工作。”Michael Sun 說(shuō)道,“同樣,每個(gè)模塊的輸出都會(huì)經(jīng)過(guò)編碼,并反饋到大語(yǔ)言模型的生成過(guò)程中,這樣大語(yǔ)言模型就能了解每個(gè)模塊的作用,并繼續(xù)根據(jù)這些數(shù)據(jù)預(yù)測(cè)標(biāo)記。”



更優(yōu)、更簡(jiǎn)單的分子結(jié)構(gòu)

最終,Llamole 會(huì)輸出分子結(jié)構(gòu)圖像、分子文本描述以及分步合成計(jì)劃,該計(jì)劃詳細(xì)說(shuō)明了如何合成分子,包括具體的化學(xué)反應(yīng)。

在設(shè)計(jì)符合用戶規(guī)格分子的實(shí)驗(yàn)中,Llamole 的表現(xiàn)優(yōu)于 10 種標(biāo)準(zhǔn)大語(yǔ)言模型、4 種微調(diào)大語(yǔ)言模型,以及最先進(jìn)的特定領(lǐng)域方法。同時(shí),它通過(guò)生成更高質(zhì)量的分子,將逆合成規(guī)劃成功率從 5% 提升至 35%,這意味著這些分子結(jié)構(gòu)更簡(jiǎn)單,構(gòu)建模塊成本更低。

“大語(yǔ)言模型自身很難確定如何合成分子,因?yàn)檫@需要大量多步驟規(guī)劃。我們的方法能生成更優(yōu)且更易合成的分子結(jié)構(gòu)。”Gang Liu 說(shuō)道。

為了訓(xùn)練和評(píng)估 Llamole,研究人員從頭構(gòu)建了兩個(gè)數(shù)據(jù)集,因?yàn)楝F(xiàn)有的分子結(jié)構(gòu)數(shù)據(jù)集細(xì)節(jié)不足。他們用 AI 生成的自然語(yǔ)言描述和自定義描述模板,對(duì)數(shù)十萬(wàn)個(gè)專利分子進(jìn)行了擴(kuò)充。

他們?yōu)槲⒄{(diào)大語(yǔ)言模型構(gòu)建的數(shù)據(jù)集包含與 10 種分子特性相關(guān)的模板,因此 Llamole 的一個(gè)局限在于,它被訓(xùn)練為僅考慮這 10 種數(shù)值特性來(lái)設(shè)計(jì)分子。

在未來(lái)的研究中,研究人員希望擴(kuò)展 Llamole 的功能,使其能夠考慮任何分子特性。此外,他們還計(jì)劃改進(jìn)圖形模塊,提高 Llamole 的逆合成成功率。

從長(zhǎng)遠(yuǎn)來(lái)看,他們希望利用這種方法拓展應(yīng)用范圍,超越分子領(lǐng)域,創(chuàng)建能處理其他圖基數(shù)據(jù)的多模態(tài)大語(yǔ)言模型,例如電網(wǎng)中的互連傳感器數(shù)據(jù)或金融市場(chǎng)中的交易數(shù)據(jù)。

“Llamole 展示了將大型語(yǔ)言模型用作處理文本描述之外復(fù)雜數(shù)據(jù)的接口的可行性,我們預(yù)計(jì)它們將成為與其他 AI 算法交互以解決各類圖形問(wèn)題的基礎(chǔ)。”Jie Chen 說(shuō)道。

https://news.mit.edu/2025/could-llms-help-design-our-next-medicines-and-materials-0409

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
養(yǎng)老金補(bǔ)發(fā)金額到賬時(shí)間公布!最早這批退休人員本周可查詢

養(yǎng)老金補(bǔ)發(fā)金額到賬時(shí)間公布!最早這批退休人員本周可查詢

新語(yǔ)愛(ài)八卦
2025-04-14 12:45:26
授勛典禮變?cè)岫Y,烏軍官團(tuán)被一窩端,王牌旅長(zhǎng)身亡,白送俄軍助攻

授勛典禮變?cè)岫Y,烏軍官團(tuán)被一窩端,王牌旅長(zhǎng)身亡,白送俄軍助攻

起喜電影
2025-04-15 17:50:49
越野車涉水游玩被沖走!兩名年輕護(hù)士溺亡!一人28歲長(zhǎng)得很漂亮!

越野車涉水游玩被沖走!兩名年輕護(hù)士溺亡!一人28歲長(zhǎng)得很漂亮!

古今小史
2025-04-15 09:45:48
科大訊飛消博會(huì)推動(dòng)AI與價(jià)值消費(fèi)共振

科大訊飛消博會(huì)推動(dòng)AI與價(jià)值消費(fèi)共振

iMobile愛(ài)科技
2025-04-14 14:02:09
馬競(jìng)4-2逆轉(zhuǎn),曼城舊將阿爾瓦雷斯無(wú)敵雙響炮,西蒙尼驚艷破門

馬競(jìng)4-2逆轉(zhuǎn),曼城舊將阿爾瓦雷斯無(wú)敵雙響炮,西蒙尼驚艷破門

側(cè)身凌空斬
2025-04-15 04:59:20
國(guó)內(nèi)油價(jià)或迎近三年最大跌幅!每升降0.4-0.42元

國(guó)內(nèi)油價(jià)或迎近三年最大跌幅!每升降0.4-0.42元

金融界
2025-04-15 17:05:36
克倫克:擁有巔峰約基奇是種責(zé)任 若不問(wèn)他的意見我就是最傻的人

克倫克:擁有巔峰約基奇是種責(zé)任 若不問(wèn)他的意見我就是最傻的人

直播吧
2025-04-15 15:20:31
調(diào)皮!美記:昨天的船勇卡位戰(zhàn),哈登曾詢問(wèn)庫(kù)明加為何拒絕上場(chǎng)

調(diào)皮!美記:昨天的船勇卡位戰(zhàn),哈登曾詢問(wèn)庫(kù)明加為何拒絕上場(chǎng)

雞丁侃球
2025-04-15 12:40:38
真是瘋了:巴塞羅那為拉菲尼亞設(shè)定8000萬(wàn)~9000萬(wàn)歐元要價(jià)

真是瘋了:巴塞羅那為拉菲尼亞設(shè)定8000萬(wàn)~9000萬(wàn)歐元要價(jià)

油潑辣不辣
2025-04-15 17:15:04
越南突然向中國(guó)提出要借錢修鐵路?這可不是小數(shù)目,整整83億美元

越南突然向中國(guó)提出要借錢修鐵路?這可不是小數(shù)目,整整83億美元

南權(quán)先生
2025-04-10 18:01:02
俄國(guó)防部:俄軍對(duì)蘇梅的烏軍指揮人員進(jìn)行導(dǎo)彈打擊

俄國(guó)防部:俄軍對(duì)蘇梅的烏軍指揮人員進(jìn)行導(dǎo)彈打擊

新華社
2025-04-15 01:16:04
窮人的富養(yǎng)是帶娃到處旅游,增長(zhǎng)欲望;富人卻教孩子看透世界規(guī)則

窮人的富養(yǎng)是帶娃到處旅游,增長(zhǎng)欲望;富人卻教孩子看透世界規(guī)則

豆芽媽媽育兒
2025-03-12 15:17:38
大連英博官方:對(duì)河南隊(duì)球票已售罄,本輪暫不開放三層看臺(tái)

大連英博官方:對(duì)河南隊(duì)球票已售罄,本輪暫不開放三層看臺(tái)

直播吧
2025-04-15 16:43:39
半夜 “容易醒”的人,八成是這2處堵住了!照著一排,好處可不少

半夜 “容易醒”的人,八成是這2處堵住了!照著一排,好處可不少

罐兒哥中醫(yī)自媒體
2025-04-13 14:14:43
巧合?三河市委書記曾任固安縣一把手,固安招牌也曾忌諱“紅黑藍(lán)”

巧合?三河市委書記曾任固安縣一把手,固安招牌也曾忌諱“紅黑藍(lán)”

小蘿卜絲
2025-04-12 11:20:39
轉(zhuǎn)播方被迫消音!山西全場(chǎng)高喊晚安,瘋狂嘲諷羞辱徐杰,太霸氣了

轉(zhuǎn)播方被迫消音!山西全場(chǎng)高喊晚安,瘋狂嘲諷羞辱徐杰,太霸氣了

嘴炮體壇
2025-04-14 22:40:19
蘋果死守中國(guó)是因?yàn)榱畠r(jià)勞動(dòng)力?庫(kù)克:在美國(guó)湊不齊的模具工程師,中國(guó)一個(gè)省能填滿幾個(gè)足球場(chǎng)【附智能手機(jī)行業(yè)市場(chǎng)分析】

蘋果死守中國(guó)是因?yàn)榱畠r(jià)勞動(dòng)力?庫(kù)克:在美國(guó)湊不齊的模具工程師,中國(guó)一個(gè)省能填滿幾個(gè)足球場(chǎng)【附智能手機(jī)行業(yè)市場(chǎng)分析】

前瞻網(wǎng)
2025-04-14 17:12:11
美國(guó)關(guān)稅變動(dòng)引發(fā)連鎖反應(yīng),中國(guó)跨境電商爆火!概念股集體大漲

美國(guó)關(guān)稅變動(dòng)引發(fā)連鎖反應(yīng),中國(guó)跨境電商爆火!概念股集體大漲

覽富財(cái)經(jīng)網(wǎng)
2025-04-15 17:46:55
重磅!庫(kù)克直言:選擇中國(guó)制造原因在于技術(shù),蘋果離不開中國(guó)!

重磅!庫(kù)克直言:選擇中國(guó)制造原因在于技術(shù),蘋果離不開中國(guó)!

挖貝網(wǎng)
2025-04-14 19:36:07
俄軍再接收2架蘇-57戰(zhàn)斗機(jī),總數(shù)量終于追平了我國(guó)052D驅(qū)逐艦

俄軍再接收2架蘇-57戰(zhàn)斗機(jī),總數(shù)量終于追平了我國(guó)052D驅(qū)逐艦

科羅廖夫
2025-04-14 08:06:11
2025-04-15 19:04:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評(píng)論獨(dú)家合作
15064文章數(shù) 513545關(guān)注度
往期回顧 全部

科技要聞

對(duì)等關(guān)稅下顯卡被爆炒:黃牛背刺游戲玩家

頭條要聞

1家3口被撞案受害者親屬:肇事者對(duì)著寶寶遺體談笑風(fēng)生

頭條要聞

1家3口被撞案受害者親屬:肇事者對(duì)著寶寶遺體談笑風(fēng)生

體育要聞

父母是臺(tái)灣移民!女林書豪被WNBA球隊(duì)選中

娛樂(lè)要聞

娛樂(lè)圈模范夫妻塌房?私生活曝光!

財(cái)經(jīng)要聞

美國(guó)財(cái)長(zhǎng),突然發(fā)聲!涉及“對(duì)華關(guān)稅”

汽車要聞

轉(zhuǎn)型中的"穩(wěn)健派" 一汽-大眾的智能化突圍路徑

態(tài)度原創(chuàng)

健康
親子
手機(jī)
時(shí)尚
軍事航空

在中國(guó),到底哪些人在吃“偉哥”?

親子要聞

萌娃奇葩睡姿!睡眠質(zhì)量超好的可愛(ài)寶寶們

手機(jī)要聞

三星OneUI 7系統(tǒng)升級(jí)計(jì)劃公布:Galaxy Z Fold6、S24系列本月推送

今年初夏“九分褲”太火了,學(xué)會(huì)這些技巧,輕松變腿精

軍事要聞

烏遭俄導(dǎo)彈襲擊 澤連斯基喊話特朗普訪烏

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 文化| 普安县| 寿阳县| 焦作市| 邯郸县| 丰城市| 湘阴县| 竹北市| 花垣县| 马公市| 开化县| 衡山县| 武山县| 抚州市| 武冈市| 灵山县| 革吉县| 淄博市| 遂宁市| 台北县| 同心县| 平山县| 双鸭山市| 枣阳市| 鄯善县| 台东县| 鸡泽县| 平山县| 榆林市| 鄂温| 楚雄市| 苗栗市| 黄陵县| 伽师县| 壤塘县| 台南县| 白玉县| 柳州市| 广宁县| 湖南省| 仁布县|