網易首頁 > 網易號 > 正文申請入駐

追問daily | 不喜歡音樂的人也會跟著搖擺；32B革新AI數學推理能力；善意和惡意創造性觀念生成的腦活動差異

2025-02-13 07:35:36　來源: 追問Nextquestion

上海舉報

分享至

█ 腦科學動態

Cell：DNA修復基因成亨廷頓病治療新希望

新型“卵形細胞”揭示記憶形成的關鍵機制

善意與惡意創造力：腦活動模式的共性與差異

類腦神經網絡模仿人類的關系學習能力

不喜歡音樂的人也會跟著搖擺

在線接觸比面對面更有效？群體間偏見干預的新發現

學習進步驅動深度任務參與和認知控制

█ AI行業動態

蘋果聯手阿里，AI功能即將登陸中國iPhone

AI 可能在 2026-2027 年達到“超級天才國家”水平

僅 32B！ReasonFlux 以小博大，革新 AI 數學推理能力

█ AI研發動態

新算法提升 AI 獨立學習和發現數據模式的能力

未經訓練的佩戴假肢的患者可以通過觸摸區分物體

發現人類和動物行為中的符號認知模型

OpenAI o3：大規模強化學習輕松斬獲IOI金牌

3.5B參數模型用循環策略挑戰50B性能

基于智能體超網絡的MaAS框架實現高性能與低成本的多智能體系統

腦科學動態

Cell：DNA修復基因成亨廷頓病治療新希望

亨廷頓病（Huntington's disease, HD）是一種遺傳性神經退行性疾病，其病因與CAG重復序列的擴張有關。加州大學洛杉磯分校健康中心和Jane and Terry Semel神經科學與人類行為研究所的研究團隊通過基因編輯技術，在亨廷頓病模型小鼠中研究了DNA錯配修復基因的作用，發現Msh3和Pms1基因的缺失顯著改善了小鼠的病理表型。

?圖形摘要。Credit: Cell (2025).

研究團隊使用攜帶140個CAG重復序列的亨廷頓病模型小鼠（Q140模型），通過基因編輯技術敲除或修改了9個與DNA錯配修復相關的基因。研究發現，敲除Msh3和Pms1基因可以顯著減少突變亨廷頓蛋白（mutant Huntingtin, mHtt）的聚集，并糾正紋狀體神經元中的基因表達失調。此外，Msh3基因的缺失還改善了小鼠的運動功能和突觸蛋白水平，并減少了星形膠質細胞的過度反應。研究還發現，紋狀體神經元中的CAG重復序列以每月8.8個重復的線性速率擴張，而Msh3和Pms1基因的缺失可以顯著減緩或阻止這一擴張過程。這些結果表明，Msh3和Pms1基因在亨廷頓病的病理過程中起著關鍵作用，可能成為治療該疾病的新靶點。研究發表在 Cell 上。

#大腦健康 #亨廷頓病 #DNA錯配修復 #基因編輯 #神經元病理

閱讀更多：

Wang, Nan, et al. “Distinct Mismatch-Repair Complex Genes Set Neuronal CAG-Repeat Expansion Rate to Drive Selective Pathogenesis in HD Mice.” Cell, vol. 0, no. 0, Feb. 2025. www.cell.com, https://doi.org/10.1016/j.cell.2025.01.031

新型“卵形細胞”揭示記憶形成的關鍵機制

記憶如何形成是神經科學的核心問題之一。不列顛哥倫比亞大學醫學院的Mark Cembrowski團隊發現了一種新型腦細胞——“卵形細胞”（ovoid cells），這種細胞在記憶和物體識別中起關鍵作用。研究由博士生Adrienne Kinman主導，通過基因操縱和微型單光子顯微鏡技術，團隊揭示了卵形細胞在小鼠記憶形成中的獨特功能。

?卵圓形細胞在小鼠海馬體中活躍。Credit: Cembrowski Lab/UBC Faculty of Medicine

研究團隊首先通過基因操縱使小鼠的卵形細胞在活躍時發光，隨后使用微型單光子顯微鏡觀察這些細胞在小鼠與環境互動時的活動。結果顯示，當小鼠遇到新物體時，卵形細胞被強烈激活，但隨著物體被記住，細胞活動逐漸停止。這種反應表明卵形細胞在記憶形成中起關鍵作用。此外，研究還發現，抑制卵形細胞會阻礙小鼠的非空間物體學習，但不影響空間學習；激活卵形細胞則會將小鼠對新物體的探索行為轉變為對熟悉物體的探索。這一發現表明，卵形細胞在非空間記憶和行為偏好中具有特異性控制作用。

研究還探討了卵形細胞在阿爾茨海默病和癲癇等疾病中的潛在作用。團隊假設，卵形細胞的失調可能是這些疾病癥狀的驅動因素。例如，在阿爾茨海默病中，卵形細胞的功能障礙可能導致物體識別記憶的喪失；而在癲癇中，卵形細胞的過度興奮可能參與癲癇發作的起始和傳播。研究發表在 Nature Communications 上。

#大腦健康 #記憶形成 #卵形細胞 #阿爾茨海默病 #神經技術

閱讀更多：

Kinman, Adrienne I., et al. “Atypical Hippocampal Excitatory Neurons Express and Govern Object Memory.” Nature Communications, vol. 16, no. 1, Feb. 2025, p. 1195. www.nature.com, https://doi.org/10.1038/s41467-025-56260-8

善意與惡意創造力：腦活動模式的共性與差異

創造力可以驅動社會發展，但其背后的神經活動尚不明確。華東師范大學心理與認知科學學院的郝寧團隊使用功能磁共振成像技術，探索了善意和惡意創造性觀念生成的腦活動差異。研究發現，兩者既有共性，也存在顯著不同。

研究團隊使用功能磁共振成像技術收集了48名健康被試的腦活動數據，被試需完成善意創造性觀念生成任務、惡意創造性觀念生成任務及普通創造性情境任務。分析其行為數據，如觀點的新穎性、善意性或惡意性。結果發現，善意和惡意創造性觀念生成有共享的“創意引擎”，即兩者均伴隨著額中回（middle frontal gyrus）和額上回（superior frontal gyrus）的顯著激活。惡意創造性觀念生成伴隨右側中央島蓋（right rolandic operculum）、緣上回（supramarginal gyrus）和角回（angular gyrus）等腦區更強的激活，且功能連接強度更低。善意創造性觀念生成則涉及更廣泛的腦區協作和網絡整合。研究發表在 Cerebral Cortex 上。

#認知科學 #創造力 #功能磁共振成像 #腦活動

閱讀更多：

Gao, Zhenni, et al. “Neural Correlates Underlying Creative Ideation Associated with Malevolent or Benevolent Intentions.” Cerebral Cortex, vol. 35, no. 2, Feb. 2025, p. bhaf010. Silverchair, https://doi.org/10.1093/cercor/bhaf010

類腦神經網絡模仿人類的關系學習能力

人類和動物具有學習物體或事件之間關系的能力，這種能力被稱為“關系學習”，但其生物學基礎尚不明確。舊金山 ML Collective 的 Thomas Miconi 和哥倫比亞大學的 Kenneth Kay 合作，使用具有突觸可塑性的類腦人工神經網絡，揭示了關系學習的神經機制。

?塑性神經網絡圖。這些網絡類似于傳統神經網絡，但包括可塑連接（紅色），這些連接可以因網絡自身產生的可塑性信號（循環中的紅色箭頭）而改變。Credit: Thomas Miconi and Kenneth Kay.

研究人員使用了一種具有突觸可塑性（神經網絡能夠根據活動改變連接強度）的人工神經網絡，并通過元學習方法訓練網絡。他們發現，這種網絡能夠模仿人類和動物在傳遞推理任務中的行為模式，并且能夠進行知識重組。研究還揭示了兩種不同的學習機制：一種較為簡單，僅支持一般關系學習；另一種更為復雜，能夠支持知識重組。這些發現為理解關系學習的神經機制提供了新的視角，并可能為未來的認知科學研究提供重要工具。研究發表在 Nature Neuroscience 上。

#認知科學 #關系學習 #神經網絡 #突觸可塑性 #元學習

閱讀更多：

Miconi, Thomas, and Kenneth Kay. “Neural Mechanisms of Relational Learning and Fast Knowledge Reassembly in Plastic Neural Networks.” Nature Neuroscience, vol. 28, no. 2, Feb. 2025, pp. 406–14. www.nature.com, https://doi.org/10.1038/s41593-024-01852-8

不喜歡音樂的人也會跟著搖擺

音樂性快感缺失者通常無法從音樂中獲得愉悅感，但他們是否會對音樂產生生理反應？康科迪亞大學的Isaac Romkey及其團隊通過在線實驗，使用節奏和和聲復雜度不同的音樂刺激，測量了音樂性快感缺失者和對照組的groove反應。結果顯示，兩組在groove反應上沒有顯著差異，表明移動的沖動可能補償了音樂性快感缺失者的愉悅感缺失。

研究團隊使用了一系列節奏和和聲復雜度不同的音樂刺激，通過在線實驗測量了148名參與者（包括17名音樂性快感缺失者和17名對照組）的groove反應。參與者被要求評價每首曲子帶來的愉悅感和想要移動的沖動。結果顯示，兩組在groove反應上沒有顯著差異。中介分析表明，對于音樂性快感缺失者，想要移動的沖動完全中介了節奏和和聲復雜度對愉悅感的影響。這表明，移動的沖動可能補償了音樂性快感缺失者的鈍化愉悅感。研究發表在 PLOS One 上。

#認知科學 #音樂性快感缺失 #groove反應 #背側紋狀體 #腹側紋狀體

閱讀更多：

Romkey, Isaac D., et al. “The Pleasurable Urge to Move to Music Is Unchanged in People with Musical Anhedonia.” PLOS ONE, vol. 20, no. 1, Jan. 2025, p. e0312030. PLoS Journals, https://doi.org/10.1371/journal.pone.0312030

在線接觸比面對面更有效？群體間偏見干預的新發現

偏見和歧視是全球性挑戰的核心問題，但現有干預措施的證據基礎薄弱。為了減少發表偏倚（publication bias）和文件抽屜問題（file drawer problem），Matt Lowe對41項預先注冊的群體間接觸實驗進行了元分析，發現群體間接觸的平均效應較小，且在線干預效果優于面對面干預。

研究采用元分析方法，重點關注41項預先注冊的群體間接觸實驗，僅分析預先指定的主要結果，以減少發表偏倚和結果切換的影響。研究發現，群體間接觸對偏見和群體間關系的平均效應為0.08σ（標準差），而包含培訓等綜合干預措施的效應為0.13σ。令人意外的是，滿足Allport（1954）提出的四個理想條件（共同目標、群體間合作、平等地位和權威支持）的面對面干預效果并不顯著。此外，在線干預的效果比面對面干預高出0.25σ。研究還發現，群體間接觸對特定外群體成員的態度和行為改變效果顯著，但對整個外群體的泛化效果有限。作者建議未來研究應通過更精確的測量和考慮Allport條件之外的調節因素，來解決泛化問題。

#認知科學 #群體間接觸 #偏見減少 #元分析 #在線干預

閱讀更多：

https://mattjlowe.github.io/files/Lowe-2025-has-intergroup-contact-delivered.pdf

學習進步驅動深度任務參與和認知控制

深度參與活動是實現目標的關鍵，但如何在現實生活中保持這種狀態？Hairong Lu、Dimitri Van der Linden和Arnold B. Bakker等研究人員通過實驗探討了學習進步（Learning Progress, LP）如何影響任務參與和認知控制。他們設計了一個游戲化任務，結合腦電圖技術，揭示了學習進步與任務參與度及認知控制的關系。

研究人員設計了一個游戲化任務，參與者通過強化學習過程為小矮人提供果汁。通過計算每個任務階段的學習進步，并結合腦電圖（EEG）測量，研究人員發現學習進步與任務參與度（表現為心流體驗和低分心度）顯著相關。腦電圖數據顯示，學習進步與增強的主動準備（如減少的預刺激偶然負變，CNV）和改善的反饋處理（如增加的P3b振幅）相關。此外，頂葉α波去同步化（parietal alpha desynchronization）表明學習進步調節了認知控制，抑制了默認模式網絡（DMN）的激活并增強了注意力功能。研究結果強調了學習進步在維持任務參與和認知控制中的關鍵作用。研究發表在 NeuroImage 上。

#認知科學 #學習進步 #心流狀態 #腦電圖 #認知控制

閱讀更多：

“The Neuroscientific Basis of Flow: Learning Progress Guides Task Engagement and Cognitive Control.” NeuroImage, vol. 308, Mar. 2025, p. 121076. www.sciencedirect.com, https://doi.org/10.1016/j.neuroimage.2025.121076

AI 行業動態

蘋果聯手阿里，AI功能即將登陸中國iPhone

據報道，蘋果正在與阿里巴巴手合作，為中國市場的 iPhone 注入先進的人工智能功能。近年來，蘋果在中國的銷量因缺乏足夠的AI應用而出現下滑，此次跨界合作正是為了解決這一困境。

根據報道，蘋果曾先后考察了百度、騰訊、字節跳動以及 DeepSeek 的方案，但最終因阿里巴巴擁有龐大且精準的消費者數據及成熟的AI技術優勢而被選中。合作不僅有望加速新功能通過中國監管部門的審批，也將推動 Siri 和搜索等功能實現個性化、智能化升級，從而更好地迎合本地用戶需求，并在激烈的市場競爭中對抗華為等品牌不斷提升的AI實力。

#蘋果 #阿里巴巴 #AI創新 #中國市場

閱讀更多：

https://www.techradar.com/computing/artificial-intelligence/apple-is-reportedly-partnering-with-alibaba-in-china-for-ai-features-and-it-makes-sense-after-deepseek

Anthropic CEO 警告：AI 可能在 2026-2027 年達到“超級天才國家”水平

Anthropic 首席執行官 Dario Amodei 在巴黎 AI 行動峰會（Paris AI Action Summit）上發出警告，AI 可能在 2026-2027 年（最晚 2030 年）達到突破性水平，智能程度堪比“一個充滿超級天才的國家”（a country of geniuses in a datacenter）。這一進步將深刻影響全球經濟、社會結構和國家安全，但當前監管和治理的速度遠遠落后于 AI 發展。

Amodei 強調，AI 的快速發展可能帶來以下重大挑戰：全球競爭加劇：如果民主國家在 AI 領域落后，可能會失去經濟和軍事優勢，甚至面臨專制國家的技術壟斷。安全威脅升級：AI 可能被用于大規模殺傷性武器（CBRN，即化學、生物、放射性和核武器）開發、網絡攻擊，甚至欺騙用戶并執行不符合人類意圖的任務。經濟沖擊：AI 可能取代大量傳統工作，導致全球范圍內的就業市場劇變，加劇社會不平等問題。

為了應對這些挑戰，Amodei 呼吁各國政府采取更果斷的措施，包括加強 AI 監管、確保民主國家在 AI 供應鏈中的主導地位、建立全球 AI 安全審查機構，并推行 AI 時代的再教育計劃，以緩解失業風險。

#AI監管 #科技變革 #數據中心中的天才國度

閱讀更多：

https://www.anthropic.com/news/paris-ai-summit

Cerebras 加速 Perplexity AI 搜索模型 Sonar，每秒 1,200 tokens 提供答案

Perplexity AI 推出了全新的 AI 搜索模型 Sonar，并借助 Cerebras Systems 提供的 AI 計算支持，實現了每秒 1,200 tokens 的推理速度。這一突破使得 Sonar 在回答質量、準確性和可讀性方面均有顯著提升，為用戶帶來了更加高效的搜索體驗。

Sonar 基于 Llama 3.3 70B 進行深度訓練，優化了信息檢索的精準度，并能夠以接近即時的速度提供答案。目前，該模型已開放給 Perplexity Pro 用戶，并可在設置中啟用 Sonar API。相較于傳統搜索引擎，AI 搜索可直接給出經過 AI 處理的答案，省去用戶篩選網頁的繁瑣過程。

Cerebras Systems 是一家專注于高性能 AI 計算的公司，致力于推動人工智能訓練和推理的極限。其核心產品包括：CS-3 AI 計算系統 ——全球最快的 AI 訓練設備，擁有 900,000 計算核心和 44GB 片上內存，可單機訓練 1 萬億參數 AI 模型。Wafer-Scale Engine（WSE） ——當前全球最大、最快的 AI 處理器，性能超越傳統 GPU 100 倍。

憑借這些先進技術，Cerebras 讓 Sonar 的推理速度達到了驚人的 1,200 tokens/s，比 Gemini 2.0 Flash 快 10 倍，甚至超越了 GPT-4o 和 Claude 3.5 Sonnet。通過 A/B 測試，Sonar 在 IFEval（指令遵循性）和 MMLU（世界知識測試）等學術評測上表現優異，進一步提升了 AI 搜索的競爭力。

Perplexity AI 首席技術官 Denis Yarats 認為，Cerebras 先進的 AI 計算技術是 Sonar 高速推理能力的關鍵，未來雙方將繼續深化合作，推動 AI 搜索技術的發展。Cerebras CEO Andrew Feldman 也表示，希望通過這項合作，讓全球用戶享受到更快、更精準的信息獲取體驗。

#AI搜索 #Cerebras #PerplexityAI #Llama3.3 #高速推理

閱讀更多：

https://www.perplexity.ai/hub/blog/meet-new-sonar

僅 32B！ReasonFlux 以小博大，革新 AI 數學推理能力

近日，普林斯頓大學與北京大學聯合推出了一種全新的大語言模型推理框架——ReasonFlux。該框架基于層次化強化學習（Hierarchical Reinforcement Learning，HRL，一種將復雜任務拆解為多層次決策的優化策略），旨在提升 AI 解決復雜數學推理問題的能力。

當前的 LLM 推理方法，如 Best-of-N（多路徑探索法）和蒙特卡洛樹搜索（MCTS，一種通過隨機模擬優化決策路徑的搜索算法），通常依賴增加計算資源來提高推理能力，但計算成本高且可解釋性較弱。ReasonFlux 通過結構化思維模板與層次化推理，大幅提升推理效率并增強可解釋性。

核心技術包括：結構化思維模板庫：由約 500 個高效模板組成，覆蓋不等式求解、三角函數變換等數學問題，為 LLM 提供清晰的推理路徑。層次化強化學習優化：采用高層導航（Navigator）選擇最佳推理路徑，減少計算冗余，提高泛化能力。高效推理系統：僅使用 32B 參數和 8 塊 NVIDIA A100 GPU 進行訓練，展現出媲美更大模型的推理能力。

在數學推理基準測試（MATH、AIME 2024、AMC 2023 等）中，ReasonFlux-32B 取得了 91.2% 的準確率，超越多款主流 AI 推理模型。這一突破表明，即便是較小規模的模型，通過優化推理框架，也能實現高效、精準的推理能力。

#ReasonFlux #層次化強化學習 #推理大模型 #數學推理 #AI推理優化

閱讀更多：

https://arxiv.org/abs/2502.06772

AI 研發動態

新算法提升 AI 獨立學習和發現數據模式的能力

悉尼科技大學的研究團隊開發了一種名為扭矩聚類（Torque Clustering）的新AI算法，該算法比現有方法更接近自然智能，顯著提高了AI系統獨立學習和發現數據模式的能力。

扭矩聚類算法基于扭矩的物理概念，能夠自主識別聚類并無縫適應不同類型的數據。該算法通過識別質量和距離的峰值，有效地檢測并移除了錯誤的合并。經過在1000個不同數據集上的嚴格測試，實現了平均調整互信息（AMI）得分97.7%，優于其他最先進的方法。該算法完全無參數，能夠自主識別各種聚類類型，確定最佳聚類數量，并識別噪聲。研究發表在 IEEE Transactions on Pattern Analysis and Machine Intelligence 上。

#神經技術 #無監督學習 #扭矩聚類 #AI算法 #數據分析

閱讀更多：

Yang, Jie, and Chin-Teng Lin. “Autonomous Clustering by Fast Find of Mass and Distance Peaks.” IEEE Transactions on Pattern Analysis and Machine Intelligence, 2025, pp. 1–14. IEEE Xplore, https://doi.org/10.1109/TPAMI.2025.3535743

未經訓練的佩戴假肢的患者可以通過觸摸區分物體

肢體截肢會導致嚴重的后果，如運動和感覺功能喪失以及幻肢痛（PLP）。斯科爾科特赫研究所、假肢制造商 Motorica 和遠東聯邦大學的研究人員進行了這項研究，使用周圍神經刺激（PNS）、脊髓刺激（SCS）和經皮電神經刺激（TENS）等方法，成功讓假肢使用者通過觸摸區分物體。

?視頻截圖顯示，一名蒙眼測試對象根據假肢手臂處理管子（灰色管道）的反饋來描述物體的大小。Credit: Gurgen Soghoyan et al./Frontiers in Neuroscience

研究團隊與兩位肘部以上截肢的患者合作。每位參與者都在脊髓附近和手臂的周圍神經中植入電極。因此，這兩個電極提供了兩種不同類型的刺激，研究人員著手比較相關的感覺。利用假肢手以電脈沖形式提供的反饋，患者成功區分了各種尺寸的物品，以及通過觸摸區分軟硬物體。實驗持續了一個月，使患者的學習和習慣化過程得以監控。除了參與者的主觀報告外，團隊還研究了他們的腦活動記錄。該研究發表在 Frontiers in Neuroscience 上。

#神經技術 #假肢 #神經刺激 #觸覺反饋

閱讀更多：

Soghoyan, Gurgen, et al. “Restoration of Natural Somatic Sensations to the Amputees: Finding the Right Combination of Neurostimulation Methods.” Frontiers in Neuroscience, vol. 18, Nov. 2024. Frontiers, https://doi.org/10.3389/fnins.2024.1466684

發現人類和動物行為中的符號認知模型

符號認知模型在理解大腦如何產生行為方面至關重要，但傳統方法依賴于研究人員的假設和創造力，可能無法找到最適合數據集的模型。為了解決這一問題，Romera-Paredes等研究人員改進了FunSearch工具，增加了額外的優化層次，稱為CogFunSearch。該方法利用大型語言模型在進化算法中自動發現符號認知模型，應用于人類、老鼠和果蠅的數據集，執行經典的獎勵引導決策任務。研究發現，CogFunSearch發現的程序在可靠性方面優于已知的最佳人工發現認知模型。

CogFunSearch方法的關鍵是利用大型語言模型在進化算法中自動發現符號認知模型。在外部優化循環中，FunSearch進化程序，而在內部循環中，模型參數被擬合到數據。研究團隊將CogFunSearch應用于來自三種物種（人類、老鼠和果蠅）的數據集，執行經典的獎勵引導決策任務。

研究發現，CogFunSearch發現的程序在可靠性方面優于已知的最佳人工發現認知模型。這些程序可以很容易地解釋為關于人類和動物認知的假設，實例化了可解釋的符號學習和決策算法。研究結果顯示，CogFunSearch能夠生成大量程序，這些程序在定量性能和程序復雜性之間顯示出明顯的權衡。盡管得分最高的程序比基線模型更復雜，但可以為每個數據集識別出性能更高且更簡單的模型。這些結果廣泛展示了使用LLM驅動的程序合成提出關于人類和動物認知機制的新科學假設的可行性。

#認知科學 #符號認知模型 #大型語言模型 #進化算法 #獎勵引導決策

閱讀更多：

Castro, Pablo Samuel, et al. Discovering Symbolic Cognitive Models from Human and Animal Behavior. bioRxiv, 6 Feb. 2025, p. 2025.02.05.636732. bioRxiv, https://doi.org/10.1101/2025.02.05.636732

OpenAI o3：大規模強化學習輕松斬獲IOI金牌

OpenAI團隊針對復雜編碼與推理問題展開研究，采用強化學習與測試時策略相結合的方法，對比通用模型與領域特定模型，驗證了大規模RL訓練能顯著提升模型成績，取得了IOI金牌和Codeforces高分。

研究采用強化學習對大語言模型進行訓練，首先利用RL生成思維鏈提升推理能力。通用模型o1在初步測試中表現不俗，而基于o1針對編碼任務進行額外RL微調并結合人工設計測試時推理策略的o1-ioi，在IOI 2024中嚴格提交限制下獲得213分（49th percentile），放寬限制后提升至362.14分；更重要的是，經過進一步大規模RL訓練的o3，僅在嚴格限制下便取得395.64分（超越金牌線359.71分），在Codeforces中獲得2724分（99.8th percentile），顯示其成績直逼頂尖人類選手。此外，模型在HackerRank Astra和SWE-bench等真實軟件工程任務上也獲得明顯提升。

#認知科學 #強化學習 #大語言模型 #競技編程

閱讀更多：

OpenAI, et al. Competitive Programming with Large Reasoning Models. 1, arXiv:2502.06807, arXiv, 3 Feb. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2502.06807

3.5B參數模型用循環策略挑戰50B性能

針對復雜推理任務計算效率低下的問題，馬里蘭大學研究團隊采用循環隱式推理技術構建了概念驗證模型。該團隊利用全新架構，通過重復執行循環模塊提升模型推理深度，在數學與編程等測試中取得了相當于50B參數模型的效果。

本研究提出的核心方法是循環隱式推理（latent space recurrent reasoning：通過在潛在空間中反復迭代實現隱式推理），在傳統僅解碼器結構中引入核心循環塊，使模型能夠在測試時根據任務復雜度自適應延展計算深度，而不依賴于專門設計的鏈式思維訓練數據。概念驗證模型參數規模為3.5B，訓練使用了8000億 token。實驗結果顯示，該模型在數學推理（如 GSM8k、MATH、MathQA）和編程測試（如 MBPP、HumanEval）中表現出色，復雜任務上性能可擴展至相當于50B參數模型，部分任務成績提升高達5倍。模型架構基于 Transformer設計，并采用前奏、核心循環塊與尾聲三部分構成，同時具備自適應計算與 KV 緩存共享（KV Cache：用于存儲鍵值對信息以加速推理）等優勢，為大語言模型推理能力的提升提供了新的計算維度。

#認知科學 #循環隱式推理 #大語言模型 #Transformer

閱讀更多：

Geiping, Jonas, et al. Scaling up Test-Time Compute with Latent Reasoning: A Recurrent Depth Approach. arXiv:2502.05171, arXiv, 7 Feb. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2502.05171

基于智能體超網絡的MaAS框架實現了高性能與低成本的多智能體系統

該研究針對多智能體系統人工配置繁瑣與資源浪費問題，由同濟大學、新加坡國立大學、中國科學技術大學及上海人工智能實驗室的研究人員提出，通過智能體超網絡自動采樣構建系統，經實驗驗證實現了性能提升與成本降低。

本研究提出的MaAS（Multi-agent Architecture Search）框架通過構建智能體超網絡實現多智能體系統的自動化設計。該方法利用控制器網絡對系統進行優化，并通過蒙特卡羅采樣與文本梯度估計同步更新架構參數與各層操作。研究團隊在代碼生成、數學推理和工具使用等七項任務的基準測試中驗證了該方法，結果顯示，MaAS在性能上提升了0.54%至11.82%，在數學推理等任務中，其推理成本僅為傳統系統的6%至45%，同時具備出色的跨數據集和跨LLM模型的遷移能力。該研究不僅降低了資源消耗，還實現了面向不同任務的定制化集體智能解決方案。

#認知科學 #多智能體 #自動化設計 #智能體超網絡

閱讀更多：

Zhang, Guibin, et al. Multi-Agent Architecture Search via Agentic Supernet. arXiv:2502.04180, arXiv, 6 Feb. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2502.04180

整理｜ChatGPT

編輯｜丹雀、存源

關于追問nextquestion

天橋腦科學研究院旗下科學媒體，旨在以科學追問為紐帶，深入探究人工智能與人類智能相互融合與促進，不斷探索科學的邊界。如果您有進一步想要討論的內容，歡迎評論區留言，或添加小助手微信questionlab，加入社群與我們互動。

關于天橋腦科學研究院

天橋腦科學研究院（Tianqiao and Chrissy Chen Institute）是由陳天橋、雒芊芊夫婦出資10億美元創建的世界最大私人腦科學研究機構之一，圍繞全球化、跨學科和青年科學家三大重點，支持腦科學研究，造福人類。

Chen Institute與華山醫院、上海市精神衛生中心設立了應用神經技術前沿實驗室、人工智能與精神健康前沿實驗室；與加州理工學院合作成立了加州理工天橋神經科學研究院。

Chen Institute建成了支持腦科學和人工智能領域研究的生態系統，項目遍布歐美、亞洲和大洋洲，包括、、、科研型臨床醫生獎勵計劃、、等。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.