導語
當大模型從“數據洪流”邁入“邏輯深水區”,推理能力的范式革命已勢不可擋。傳統模型依賴統計關聯的“淺層推斷”面臨瓶頸:面對復雜因果鏈、跨領域知識整合或自我驗證需求時,大模型如何像人類一樣“想透問題”?
旨在深入探討大模型推理新范式背后的核心技術和基本原理。本期為大模型2.0系列讀書會的收官分享,將于3月22日周六晚19:30進行,涉及對大模型2.0系列讀書會的總結梳理以及圍繞“大模型推理范式的未來方向”主題的圓桌討論。
分享流程
讀書會總結回顧(19:30-19:50)
圓桌討論:肖達 張江 岳玉濤 張杰(19:50-20:35)
分享內容簡介
本次分享首先由張杰對大模型2.0系列讀書會的核心內容進行回顧,內容包括:
推理范式演進
思維鏈內化機制
搜索與驗證策略
強化學習推理
自我改進邊界探索
接著,進入由肖達、張江、岳玉濤、張杰等圓桌嘉賓參與的圓桌討論,深入探討“大模型推理范式的未來方向”。討論涉及大模型的:
深度推理架構革新
模型機制可解釋性突破
內生反思機制構建
私有知識融合新范式
知識精餾存儲范式
形式化驗證架構融合
旨在深入理解大模型推理技術現狀及未來發展,并為未來研究提供新的思路和啟發。
嘉賓介紹
集智科學家社群成員,人工智能公司彩云科技聯合創始人、首席科學家,北京郵電大學網絡空間安全學院副教授,主要負責大模型算法研發,支持彩云天氣、彩云小譯、彩云小夢等C端產品。
研究興趣為:大模型的機制可解釋性分析和架構設計優化,及其在自然語言處理、程序分析、軟件安全等領域的應用;認知科學和人工智能的交叉。在AI頂會ICLR、ICML、AAAI等發表多篇相關論文。
中國科學院信息工程研究所四年級博士生,安遠AI伙伴,上海人工智能實驗室實習生。具有人工智能和網絡安全交叉背景,關注大模型安全與對齊。
研究方向:可信AI、可解釋性
張江,北京師范大學系統科學學院教授,集智俱樂部、集智學園、集智科學研究中心創始人,曾任騰訊研究院、華為戰略研究院等特聘顧問。
研究興趣為因果涌現、復雜系統分析與建模、規模理論等
岳玉濤,香港科技大學(廣州)副教授,江蘇省產業技術研究院深度感知技術研究所創始人,廣東省引進創新科研團隊帶頭人。獲已授權中國發明專利300余項,發表論文60余篇。
研究興趣為多模態感知融合、大模型機理與可解釋AI、通用人工智能、機器意識、大模型應用等
參與信息
時間:
2025年3月22日(本周六)晚上19:30-21:00。
掃碼參與,加入群聊,獲取系列讀書會回看權限,成為人工智能社區的種子用戶,與社區的一線科研工作者與企業實踐者溝通交流,共同推動人工智能社區的發展。
報名成為主講人
讀書會成員均可以在讀書會期間申請成為主講人。主講人作為讀書會成員,均遵循內容共創共享機制,可以獲得報名費退款,并共享本讀書會產生的所有內容資源。詳情請見:
大模型2.0讀書會啟動
o1模型代表大語言模型融合學習與推理的新范式。集智俱樂部聯合北京師范大學系統科學學院教授張江、Google DeepMind研究科學家馮熙棟、阿里巴巴強化學習研究員王維塤和中科院信工所張杰共同發起,本次讀書會將關注大模型推理范式的演進、基于搜索與蒙特卡洛樹的推理優化、基于強化學習的大模型優化、思維鏈方法與內化機制、自我改進與推理驗證。希望通過讀書會探索o1具體實現的技術路徑,幫助我們更好的理解機器推理和人工智能的本質。
從2024年12月7日開始,預計每周六進行一次,持續時間預計 6-8 周左右。歡迎感興趣的朋友報名參加,激發更多的思維火花!
詳情請見:
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.