AI Agent 也能做量子物理實驗了!
近日,英國牛津大學曹舒翔博士使用基于大模型的 AI Agent,成功地讓真人實驗人員告別了繁瑣重復的實驗工作。具體來說,曹舒翔博士和合作者所搭建的 Agent 能夠理解科研人員使用自然語言所描述的實驗過程和實驗目標,結合它自帶的知識庫,自行完成量子物理實驗的設計、執行和數據分析。
圖 | 曹舒翔(來源:曹舒翔)
他們把這套系統部署在了自己的超導量子計算實驗平臺上,成功實現了單比特和兩比特量子門的自動校準。而且,Agent 可以根據科研需要在量子計算機上生成量子態并進行分析。在這個案例展示之中,最復雜的部分是兩比特門的自動校準。而本次設計的 Agent 在沒有人為干預的情況下,進行了大約 3 個小時的自動實驗,并成功找到多組可以實現兩比特門的參數組合。
(來源:arXiv)
相比其他的工作,曹舒翔博士和合作者所搭建的 Agent 針對實驗物理學研究場景實現了三個功能:
第一,Agent 能夠根據科研人員提出的實驗描述和實驗目標,設計出全部的實驗步驟,并把實驗步驟轉換為一個“狀態機”,即無論是實驗成功還是實驗失敗,Agent 都能知道下一步該做什么。在這種情況下,Agent 自動規劃的工作流程更加可靠,要么能夠工作到實驗成功完成,要么會在進入無法恢復的不得已狀態下向科研人員求助。
第二,Agent 能夠動態分析并理解已經存在的操作儀設備的代碼庫,將每一步實驗通過這些代碼庫實現出來。實驗人員可以隨時向代碼庫中修改或添加新的儀器操作接口增強 Agent 的實驗能力。
第三,在每一個實驗完成之后,Agent 能夠自行分析實驗數據,借此判斷這次實驗是否成功達到預期目的。如果不成功,它會先判斷是否需要重新調整參數;如果需要,它將自行調整參數。與此同時,在這一步的結果會返回給“狀態機”并驅動“狀態機”的運行。
要實現以上的功能,需要讓大模型掌握整個實驗所需的知識。曹舒翔和所在團隊設計的 Agent,相比此前已有系統有著三個重要改進。
首先,Agent 能夠根據知識把實驗步驟轉化為“狀態機”,并讓大模型來決定狀態的更新和跳轉。曹舒翔表示通過本次研究,他們證明使用“狀態機”可以成功穩定的實現復雜實驗流程的自動化。
其次,Agent 能將知識同時從代碼和文檔里提取出來,并能進行結構化的整理和存儲。在進行實驗設計或代碼生成時,Agent 可以進行高效快速的查詢,并能翻譯成實驗腳本代碼。相比直接生成大段的代碼,這一方案更加符合自動化實驗的場景,且具有較好的穩定性。
再次,在曹舒翔等人所打造的知識庫之中,包含了圖片的多模態數據,他們還通過引入小樣本學習,并使用多模態大模型針對實驗數據進行解讀。借此發現,很多實驗很難僅僅通過自然語言來對實驗成功與否進行精確描述。而該團隊先給模型展示一些成功和失敗的案例圖片,再把采集到的數據轉化為圖片并讓模型進行分析,借此極大提升了模型準確率。
總的來說,Agent 可以極大降低超導量子計算平臺的實驗成本,并能把科研人員從技術細節和工程細節中解放出來。同時,曹舒翔認為本次解決方案的適用范圍非常廣泛,不僅能用于量子計算,也能用于其他類型的科學研究,甚至能用于工業和服務業的復雜自動化場景中。
(來源:arXiv)
據了解,曹舒翔本科畢業于浙江大學竺可楨學院,并在畢業后到牛津大學攻讀博士。在此期間,由他聯合創立的量子人工智能公司 Rahko 于 2022 年被美國生物技術公司 Odyssey Therapeutics 收購。曹舒翔目前在牛津大學從事博士后研究,主要研究 AI 在科研領域可能的運用場景。該研究的共同一作張子健來自加拿大多倫多大學的 Alan Aspuru-Guzik 課題組,他的研究專注于 AI Agent 的知識表示和人機交互。
曹舒翔表示,本次研究受到了早期 GPT Agent 工作 AutoGPT 的啟發。最早的 AutoGPT 能在給定一個任務目標之后,一步一步地實現目標,并能使用搜索引擎和文件創建等簡單的工具。
在本次研究之中,曹舒翔等人先是開展了一些預實驗,比如讓一些早期 Agent 直接控制量子計算設備。但是,實驗效果卻是差強人意,主要是因為模型無法了解他們的實驗要求,只能照貓畫虎地進行“看似有用實則無用”的操作。在曹舒翔等人看來,這其實就是模型在沒有知識儲備的情況下進行的“敷衍”。
后來,領域內的其他團隊開始使用更復雜的檢索增強生成(RAG,Retrieval-Augmented Generation)方法,來將具體場景的知識提供給模型,借此來增強模型的能力。
后來,曹舒翔等人調研了很多其他 Agent 的實現方法,借此提出一種適合該團隊研究場景的解決方案。與此同時,他們提出一個針對實驗知識進行整理和存儲的方案,即通過撰寫結構化文檔的方式,不僅能讓大模型進行快速索引并查找到相關內容,還能為人類進行分析和閱讀。
通過以上方案,讓模型擁有了使用量子實驗設備的能力。在接下來的研究中 Agent 首先在模擬構建的量子計算設備測試環境中進行了進行交互,驗證了準確性后在真實量子計算設備上進行了驗證。
期間,該團隊測試了很多方案。例如,在最早的方案之中他們并沒有引入“狀態機”,而是讓模型直接生成長腳本并完成實驗,但是他們發現,目前的模型還不足以直接完成這類復雜任務。
于是,他們通過引入更多的 Agent 并把任務加以細分,借此找到了每個功能的最佳實現方法,并將它們進行整合,進而在真實量子計算機上成功完成測試。
但是,測試中他們發現此前構建的系統穩定性欠佳,原因是大模型很難去解讀實驗數據。由于這些數據是模型完全沒有見過的,因此通過語言描述很難進行準確區分。
為此,他們嘗試了很多方法,包括直接分析文字數據、讓模型自己寫代碼進行數據分析并解讀分析結果等。最后,他們發現最穩定和最實用的方案是:使用小樣本學習配合多模態的方式,來教會模型卻解讀數據。
完成以上步驟之后,他們使用大模型針對量子計算機進行自動校準的復雜實驗,成功校準了單比特門和兩比特門,同時展示了模型根據真人科研人員指令快速構建新實驗的能力。
(來源:arXiv)
日前,相關論文以《應用于量子計算的自動化實驗室智能體》(Agents for self-driving laboratories applied to quantum computing)為題發表在預印本網站arXiv上 [1]。同時,曹舒翔博士在 2025 年美國物理學會全球峰會上(APS Global Summit 2025)以《利用基于知識的 AI 智能體實現實驗自動化:超導量子處理器案例研究》(Automating Experiments with Knowledge-Based AI Agents: A Case Study in Superconducting Quantum Processors)對相關工作進行了匯報 [2]。
圖 | 相關論文(來源:arXiv)
未來,曹舒翔等人將研究如何讓參數更小的模型來驅動他們所搭建的Agent。該團隊目前的 Agent 框架尚未涉及到針對模型的微調,這就要求驅動這個框架的模型的本身能力必須足夠好。比如,目前得使用 GPT-4、Claude-3-Opus 等模型才能產生比較穩定的效果。所以,未來他們將通過微調方式或蒸餾方式來使用參數更小的模型,以及降低框架所需要的推理開銷。
圖 | 美國物理學會全球峰會(來源:曹舒翔)
同時,他們還將增強模型對于科學數據的理解。目前,該團隊將掃描到的結果生成為一張帶有坐標系的二維圖片,盡管模型可以識別出圖片中科研人員感興趣,并希望更進一步進行精細掃描研究的部分,但卻不能準確指出具體的參數范圍。因此,他們將進一步研究能夠處理科學任務的多模態模型。
最后,他們將通過尋找合適的優化方法,來讓模型更高效地部署到邊緣計算設備上,從而讓本次案能夠適用于更多應用場景。
參考資料:
1.https://arxiv.org/pdf/2412.07978
2.https://summit.aps.org/events/MAR-G18/4
運營/排版:何晨龍
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.