█腦科學動態
Science:多巴胺神經元“獎勵機制”削弱減肥藥效果
Science:首次捕獲線粒體呼吸鏈超復合體天然結構
腦細胞的可塑性比以前認為的更強
關節置換金屬可侵入腦脊液,長期神經毒性引關注
懷舊音樂激活雙重腦網絡,或成記憶障礙干預新工具
多巴胺是運動技能學習的“開關”,阻斷后學習能力歸零
主動感知+語言:人類高效比較物體的兩大“外掛”
短時任務處理速率達42比特/秒,長時任務遵循冪律衰減
大腦多任務“卡頓”之謎破解:額頂葉網絡是“單線程”瓶頸
看電影也能畫腦圖,MIT團隊繪制最全大腦皮層功能網絡圖譜
█AI行業動態
狗狗也能聽懂AI?文字轉狗吠黑科技來了
Google Research提出評估LLMs跨語言知識遷移能力的新測試
Anthropic公司推出專為高等教育機構設計的人工智能助手
█AI驅動科學
大語言模型通過圖靈測試,GPT-4.5偽裝人類成功率超七成
Meta團隊突破注意力機制瓶頸,多詞注意力讓大模型更“聰明”
AI定制膝關節置換術為“羅圈腿”患者帶來福音
機器人學會"皺眉思考",人類更愿信任它
大語言模型“聰明”是假象,依賴模板復述而非真實推理
AI也會“壓力山大”?大語言模型表現竟與人類驚人相似
神經網絡自組織奧秘揭曉:MIT團隊發現表征對齊統一理論
腦科學動態
Science:多巴胺神經元“獎勵機制”削弱減肥藥效果
為何減肥藥對暴飲暴食者效果有限?加州大學圣地亞哥分校和霍華德休斯醫學研究所的Zhu等團隊發現,腹側被蓋區多巴胺神經元(VTADA)被美味食物激活后會延長進食時間,并抵抗減肥藥索馬魯肽的抑制作用。
?腹側被蓋區多巴胺釋放神經元在進食過程中控制食欲。Credit: Science (2025).
研究通過光遺傳學和閉環神經調控技術,揭示小鼠大腦中“藍斑周圍→腹側被蓋區(VTA)”神經回路的作用:VTADA神經元僅在進食時響應美味信號,其活動強度決定進食時長。索馬魯肽(GLP-1R激動劑類減肥藥)通過抑制VTADA神經元減少進食,但長期用藥后神經元活動逐漸恢復,導致藥效下降。人工激活VTADA神經元可完全抵消藥物作用,而靶向抑制則能恢復藥效。研究還發現periLCVGLUT2神經元通過抑制VTA中的GABA神經元間接“解除”對VTADA神經元的抑制,形成正反饋循環。這一機制解釋了為何享樂性飲食難以通過藥物干預完全控制。研究發表在 Science 上。
#疾病與健康 #神經調控 #個性化醫療 #肥胖機制 #多巴胺神經元
閱讀更多:
Zhu, Zhenggang, et al. “Hedonic Eating Is Controlled by Dopamine Neurons That Oppose GLP-1R Satiety.” Science, vol. 387, no. 6741, Mar. 2025, p. eadt0773. science.org (Atypon), https://doi.org/10.1126/science.adt0773
Science:首次捕獲線粒體呼吸鏈超復合體天然結構
線粒體呼吸鏈如何原位組裝,來自巴塞爾大學的研究團隊以萊茵衣藻為模型,通過冷凍電子斷層掃描(cryo-ET)技術,首次解析了 5 ? 分辨率的呼吸體(respirasome)天然結構,揭示了細胞色素 c 的結合位點及復合物間的相互作用界面。
研究采用冷凍聚焦離子束減薄(cryo-FIB)技術制備 100-200 nm 厚度的冷凍細胞切片,通過冷凍電子斷層掃描(cryo-ET)獲得線粒體嵴膜的高分辨率圖像。結果顯示,ATP 合酶(ATP synthase)與呼吸鏈復合物(I、III、IV)分別富集于嵴膜的彎曲和平坦區域。呼吸體由復合物 I、III、IV 組成,其原位結構(5 ?)與體外純化樣本(2.4 ? SPA cryo-EM)對比顯示,天然環境中復合物間存在獨特的構象變化和結合界面。此外,研究首次觀察到電子載體細胞色素 c(cyt. c)在呼吸體上的結合位點,證實其在電子傳遞中的動態穿梭機制。這一成果為理解線粒體能量生產機制提供了直接證據。研究發表在 Science 上。
#神經科學 #神經機制與腦功能解析 #跨學科整合 #計算模型與人工智能模擬
閱讀更多:
Waltz, Florent, et al. “In-Cell Architecture of the Mitochondrial Respiratory Chain.” Science, Mar. 2025. world, www.science.org, https://doi.org/10.1126/science.ads8738
腦細胞的可塑性比以前認為的更強
神經元亞型是否一成不變?加州大學圣克魯斯分校的Mohammed Mostajo-Radji團隊與Braingeneers合作,通過3D腦類器官模型發現,抑制性神經元身份可受環境調控,甚至實現亞型間轉換。
?計算機渲染的 parvalbumin 陽性神經元,研究人員首次能夠在體外模型中大量生產這種神經元。Credit: iScience (2025).
研究首次在體外大量生成parvalbumin陽性神經元(PV神經元,調控大腦可塑性的關鍵細胞),并證實3D結構是成功關鍵。團隊將小鼠MGE前體細胞移植到腦類器官(cerebral organoids,模擬大腦的3D培養體系)中,觀察到PV神經元高效分化,遠超2D模型。更驚人的是,已分化的somatostatin神經元(SST神經元)在3D環境中會轉變成PV神經元,表明神經元身份具有可塑性。單細胞RNA測序顯示,這一過程伴隨PV成熟標記上調、SST標記下調。研究還發現,人皮層環境比鼠皮層更易觸發這種轉變,暗示物種特異性信號的存在。該發現為研究神經發育疾病(如孤獨癥、精神分裂癥)提供了新工具,并提示大腦可能通過環境信號動態調整神經元功能。研究發表在 iScience 上。
#神經科學 #神經機制與腦功能解析 #跨學科整合 #類器官技術 #神經元可塑性
閱讀更多:
Mostajo-Radji, Mohammed A., et al. Fate Plasticity of Interneuron Specification. bioRxiv, 3 Oct. 2024, p. 2024.10.02.614266. bioRxiv, https://doi.org/10.1101/2024.10.02.614266
關節置換金屬可侵入腦脊液,長期神經毒性引關注
人工關節植入物釋放的金屬顆粒是否危害中樞神經系統,柏林夏里特醫學院團隊通過檢測204名患者的腦脊液和血液,首次證實鈷、鈦等金屬能穿透神經屏障并積累,相關結果或解釋部分術后神經癥狀。
研究通過電感耦合等離子體質譜(ICP-MS,一種高精度金屬檢測技術)分析患者樣本,發現植入組腦脊液鈷中位數(0.03 μg/L)顯著高于對照組(0.02 μg/L),且鈷鉻鉬合金使用者腦脊液鉻濃度更高(0.31 μg/L vs. 0.23 μg/L)。鈦、鈮、鋯在血清升高時腦脊液水平同步增加,但血腦屏障功能(通過S-100B蛋白評估)未受損。疼痛癥狀與腦脊液鈷濃度正相關,提示金屬釋放可能與局部磨損有關。研究強調需進一步探究這些金屬是否導致認知障礙或神經退行性疾病。研究發表在 JAMA Network Open 上。
#疾病與健康 #個性化醫療 #金屬毒性 #關節置換
閱讀更多:
Rakow, Anastasia, et al. “Metal Concentrations in Blood and Cerebrospinal Fluid of Patients With Arthroplasty Implants.” JAMA Network Open, vol. 8, no. 3, Mar. 2025, p. e252281. Silverchair, https://doi.org/10.1001/jamanetworkopen.2025.2281
懷舊音樂激活雙重腦網絡,或成記憶障礙干預新工具
音樂如何通過神經機制增強記憶?南加州大學Assal Habibi團隊發現,懷舊音樂能同步激活大腦記憶與獎賞系統,為阿爾茨海默病等患者提供非藥物干預潛力。
?fMRI 任務設計 (A) 和一次運行內歌曲三連音的示例混排 (B)。在面板 B 中,FC = 熟悉的控制歌曲塊,UC = 不熟悉的控制歌曲塊,N = 懷舊歌曲塊,R = 休息時間。數字表示在三連音中的位置(即,FC1 是熟悉的控制歌曲,在音樂上與懷舊歌曲 1 (N1) 和不熟悉的控制歌曲 1 (UC1) 相匹配)。Credit: Human Brain Mapping (2025).
團隊利用機器學習構建三類音樂(懷舊/熟悉非懷舊/陌生非懷舊),通過功能性磁共振成像(fMRI)分析57名參與者的腦區響應。結果顯示:懷舊音樂獨特激活默認模式網絡(DMN,負責記憶整合)、獎賞網絡及內側顳葉(記憶關鍵區);自我參照區(后內側皮層)與情感區(島葉)功能連接增強;老年人相關腦區血氧水平依賴(BOLD)信號更強,且反應與情感體驗直接相關,青年則關聯認知能力。研究為音樂療法臨床轉化奠定神經科學基礎。研究發表于 Human Brain Mapping。
#疾病與健康 #神經機制與腦功能解析 #個性化醫療 #心理健康與精神疾病 #記憶機制
閱讀更多:
Hennessy, Sarah, et al. “Music-Evoked Nostalgia Activates Default Mode and Reward Networks Across the Lifespan.” Human Brain Mapping, vol. 46, no. 4, 2025, p. e70181. Wiley Online Library, https://doi.org/10.1002/hbm.70181
多巴胺是運動技能學習的“開關”,阻斷后學習能力歸零
以色列理工學院Hadas Benisty、Jackie Schiller、Amir Ghanayim及Ronen Talmon團隊發現,多巴胺在初級運動皮層(M1)的局部釋放是神經網絡重組的關鍵驅動力,缺乏它則學習完全停滯。
?示意圖突出顯示了從 VTA 到 M1 的多巴胺能輸入在運動學習中的重要作用。Credit: Nature Communications (2025).
研究通過鈣成像(GCaMP6s標記神經元活動)和化學遺傳學技術(DREADDs抑制多巴胺信號),觀察小鼠學習前肢取食任務時的M1神經網絡變化。結果顯示,正常學習中,第2-3層神經元的功能連接逐漸形成“專家”配置,且感官信號轉為任務結果反饋。但阻斷VTA到M1的多巴胺輸入后,神經網絡凍結,小鼠無法進步;恢復多巴胺則學習繼續。值得注意的是,多巴胺僅影響新技能獲取,對已掌握技能無干擾。研究提出多巴胺通過強化學習機制重塑M1網絡連接,為帕金森病等運動障礙的治療提供靶點。研究發表在 Nature Communications 上。
#神經科學 #神經機制與腦功能解析 #神經調控 #運動學習 #多巴胺
閱讀更多:
Ghanayim, Amir, et al. “VTA Projections to M1 Are Essential for Reorganization of Layer 2-3 Network Dynamics Underlying Motor Learning.” Nature Communications, vol. 16, no. 1, Jan. 2025, p. 200. www.nature.com, https://doi.org/10.1038/s41467-024-55317-4
主動感知+語言:人類高效比較物體的兩大“外掛”
人類如何高效判斷兩物體是否相同?圣達菲研究所的Marina Dubova和Arseny Moskvichev團隊發現,人們依賴“主動感知”和語言描述兩種策略,顯著降低記憶負擔并提升準確性。
?Credit: Attention, Perception, & Psychophysics (2025).
研究設計實驗讓參與者對比模糊且僅能局部觀看的圖像對,發現其普遍采用感知卸載(perceptual offloading,即頻繁切換視線對比圖像),尤其在圖像難區分時。實驗數據顯示,允許自由切換時,參與者反應更快(速度提升約30%)、準確率更高(達85%以上);而強制單圖觀看時,準確率下降至70%,且需依賴語言描述細節(如“左圖有紅色斑點”),但僅對易語言化(verbalizable)的刺激有效。
進一步分析表明,當圖像特征難以命名(如抽象圖案)且感知受限時,參與者效率驟降(錯誤率增加50%)。研究提示,人類通過動態分配認知資源——優先“外包”任務給感知系統,其次調用語言系統——實現高效比較。研究發表在 Attention, Perception, & Psychophysics 上。
#認知科學 #神經機制與腦功能解析 #計算模型與人工智能模擬 #視覺感知
閱讀更多:
Dubova, Marina, and Arseny Moskvichev. “The Role of Active Perception and Naming in Sameness Comparison.” Attention, Perception, & Psychophysics, Mar. 2025. Springer Link, https://doi.org/10.3758/s13414-025-03046-1
記憶競賽揭示大腦極限:短時任務處理速率達42比特/秒,長時任務遵循冪律衰減
人腦信息處理速率是否被低估?慕尼黑大學(LMU Munich)的Bastian Wiederhold團隊通過分析國際記憶競賽數據發現,短時記憶任務中大腦實際處理速率可達42比特/秒,遠超傳統認知的10比特/秒,而長時任務中速率隨記憶時間呈冪律下降。
研究整合了國際記憶協會(IAM)、Memory League(ML)和speed-memory.com的競賽數據,涵蓋1秒至1小時的記憶任務。通過計算最低必要信息速率(bit/s),團隊發現:短時任務(如數字速記)中,選手的閱讀速度成為瓶頸,但實際心理聯想(mental association)形成更快;跨時間尺度上,處理速率與記憶時長呈冪律關系(power law),即速率=時間^α,α為負值;盡管記憶策略優化使競賽成績提升,任務間速率差異模式保持穩定,提示大腦處理機制存在普適性規律。研究為理解人腦信息處理極限提供了新視角,挑戰了“大腦低速”的固有認知。
#認知科學 #記憶機制 #神經機制與腦功能解析 #計算模型與人工智能模擬
閱讀更多:
Wiederhold, Bastian. The Speed of Information Processing at Memory Competitions: Limited by Reading in Short Tasks and Declining as a Power Law for Longer Times. bioRxiv, 1 Apr. 2025, p. 2025.03.31.646314. bioRxiv, https://doi.org/10.1101/2025.03.31.646314
大腦多任務“卡頓”之謎破解:額頂葉網絡是“單線程”瓶頸
為什么人類無法高效同時處理兩項復雜任務?范德堡大學的Qiuhai Yue、Allen T. Newton和René Marois團隊通過超快速腦成像技術,首次發現額頂葉多需求網絡(MD network)是導致多任務“串行排隊”的關鍵腦區,為認知瓶頸提供了直接神經證據。
研究采用超快速功能磁共振成像(fMRI,199毫秒時間分辨率)和高場強(7T)設備,結合多變量分析(multivariate analyses,區分不同任務的大腦活動模式),實時追蹤雙任務下的大腦活動。實驗設計避免感覺運動模態重疊,確保瓶頸僅源于認知階段。
結果顯示:視覺和聽覺皮層同時處理兩類任務;額頂葉MD網絡(如背外側前額葉和后頂葉)對第二任務的反應延遲300-500毫秒,形成“單線程”隊列;MD網絡與運動皮層(如輔助運動區)共同構成瓶頸,而反應執行仍可并行。這一發現解釋了為何“邊開車邊打電話”非常危險,因為高級認知資源被迫排隊。研究發表在 Nature Communications 上。
#認知科學 #神經機制與腦功能解析 #跨學科整合 #計算模型與人工智能模擬
閱讀更多:
Yue, Qiuhai, et al. “Ultrafast fMRI Reveals Serial Queuing of Information Processing during Multitasking in the Human Brain.” Nature Communications, vol. 16, no. 1, Mar. 2025, p. 3057. www.nature.com, https://doi.org/10.1038/s41467-025-58228-0
看電影也能畫腦圖,MIT團隊繪制最全大腦皮層功能網絡圖譜
大腦如何分工協作處理復雜信息?MIT的Robert Desimone、劍橋大學John Duncan及Reza Rajimehr團隊通過電影刺激下的腦掃描,首次繪制包含24個功能網絡的皮層圖譜,揭示自然情境下的腦區動態協作機制。
?Credit: Christine Daniloff, MIT; Shutterstock
研究依托人類連接組計劃(Human Connectome Project),使用7特斯拉高分辨率fMRI記錄176人觀看電影時的腦活動。通過機器學習聚類分析,團隊不僅確認了語言、視覺等經典網絡,還發現前額葉存在對場景高度敏感的新網絡(此前未被報道)。更關鍵的是,執行控制網絡(executive control networks)與感覺/語言網絡呈現“推拉”式互動——當處理特定信息(如人臉)時,控制網絡靜默;而電影情節轉折時,控制網絡活躍以協調全局。這種動態平衡解釋了大腦如何高效分配資源。此外,社交處理網絡內部分化為“人-物交互”和“人-人交互”子區,凸顯功能精細化。研究為自然認知研究奠定框架,未來可深入探索網絡亞區機制。研究發表在 Neuron 上。
#神經科學 #神經機制與腦功能解析 #跨學科整合 #計算模型與人工智能模擬 #自然認知
閱讀更多:
Rajimehr, Reza, et al. “Functional Architecture of Cerebral Cortex during Naturalistic Movie Watching.” Neuron, vol. 112, no. 24, Dec. 2024, pp. 4130-4146.e3. www.cell.com, https://doi.org/10.1016/j.neuron.2024.10.005
AI 行業動態
狗狗也能聽懂AI?文字轉狗吠黑科技來了
ElevenLabs近日宣布推出全球首款專為狗狗設計的AI語音合成模型Text to Bark(文字轉狗吠),用戶只需輸入文字并選擇犬種,系統即可生成逼真的狗吠聲。獨立測試顯示,95%的狗狗無法區分AI生成的吠聲與真實吠聲。
該技術基于開源犬類語言學研究(Canine Linguistic Research,即分析狗吠聲的學術領域),由ElevenLabs團隊開發。研究人員表示,這一突破不僅為寵物主人提供了趣味工具,還可能為動物行為學研究開辟新路徑。企業用戶還可通過Bark to Speech API接入服務,并享受包括雙重爪紋認證(2FP,即2-Factor Pawthentication)在內的安全功能。
ElevenLabs此前以高擬真文字轉語音(Text to Speech)和語音轉文字(Scribe)技術聞名,此次創新進一步鞏固了其在生成式AI領域的領先地位。團隊戲稱這是“人類的一小步,狗狗的一大步”,并計劃未來拓展至其他動物語言模型。
#AI語音合成 #跨物種溝通 #寵物科技 #ElevenLabs #狗吠生成
閱讀更多:
https://elevenlabs.io/blog/text-to-bark
Google Research提出評估LLMs跨語言知識遷移能力的新測試
Google Research近期推出了ECLeKTic,這是一個用于評估大型語言模型(LLMs)跨語言知識遷移能力的全新基準測試。該基準測試通過控制12種語言中維基百科文章的存在與否,精心設計了一系列知識問答任務,旨在檢測模型在源語言中獲取的知識能否有效地遷移并應用于目標語言。
團隊首先篩選出在某些語言中存在,而在其他語言中缺失的維基百科文章。然后,在文章存在的語言中生成與該文章相關的問題,并將這些問題翻譯成其他缺少該文章的語言。這樣,模型在回答這些目標語言問題時,必須依賴于在源語言中學到的知識,從而評估其跨語言知識遷移的能力。實驗結果顯示,即使是當前最先進的LLMs,在跨語言知識遷移方面仍存在顯著挑戰。例如,模型在源語言中能夠正確回答的問題,換成目標語言后,準確率明顯下降。這表明,盡管模型在多語言環境下接受了訓練,但在深層次的知識遷移和應用上仍有待提升。
#認知科學#跨語言知識遷移#大型語言模型#基準測試
閱讀更多:
https://research.google/blog/eclektic-a-novel-benchmark-for-evaluating-cross-lingual-knowledge-transfer-in-llms/
Anthropic公司推出專為高等教育機構設計的人工智能助手
Anthropic公司推出專為高等教育機構設計的人工智能助手——Claude for Education。該版本旨在協助大學在教學、學習和行政管理中有效地應用人工智能技術,確保教育工作者和學生在塑造人工智能在社會中的角色方面發揮積極作用。
Claude for Education引入了“學習模式”(Learning mode),這一新功能旨在引導學生的推理過程,而非直接提供答案,從而培養他們的批判性思維能力。具體而言,Claude會通過提問“你會如何解決這個問題?”來鼓勵學生自主思考,而不是直接給出解決方案。此外,Claude還采用蘇格拉底式提問法(Socratic questioning),例如詢問“有哪些證據支持你的結論?”,以幫助學生深入理解問題的本質。同時,Claude強調核心概念的理解,突出特定問題背后的基本原理,并提供研究論文、學習指南和大綱等結構化模板,輔助學生的學習過程。
通過Claude for Education,Anthropic致力于為教育機構提供安全、可靠的人工智能訪問權限,支持學生撰寫文獻綜述、解決復雜問題,并獲得論文反饋;幫助教師創建符合特定學習目標的評分標準,提供個性化反饋;協助行政人員分析招生趨勢、自動回復常見咨詢,并將復雜的政策文件轉換為易于理解的FAQ格式。
Claude for Education的推出,標志著Anthropic在推動人工智能與教育深度融合方面邁出了重要一步,為高等教育機構提供了強有力的支持,助力培養具備批判性思維和創新能力的人才。
#認知科學#人工智能#教育技術#高等教育
閱讀更多:
https://www.anthropic.com/news/introducing-claude-for-education
AI 驅動科學
大語言模型通過圖靈測試,GPT-4.5偽裝人類成功率超七成
AI能否通過圖靈測試引發長達75年的爭論。加州大學圣地亞哥分校的Cameron R. Jones和Benjamin K. Bergen團隊通過兩項隨機對照實驗發現,GPT-4.5在擬人化提示下被73%的參與者誤認為人類,成為首個通過標準三方圖靈測試的AI系統。
研究采用經典三方圖靈測試框架,284名參與者與AI(GPT-4.5、LLaMa-3.1、ELIZA)及真人進行5分鐘對話。關鍵發現:模型表現:GPT-4.5在“擬人化提示”(PERSONA prompt,即模擬年輕網民性格)下通過率高達73%,顯著高于人類對照組(p<0.01);LLaMa-3.1通過率56%,與人類無差異。基線對比:規則型AI ELIZA(1960年代技術)通過率僅23%,GPT-4o為21%,證實測試有效性。機制分析:擬人化提示使模型更擅長使用網絡俚語和個性化表達(如“emoji濫用”),而基線提示(NO-PERSONA)僅提供基礎指令,表現較差。
#大模型技術 #意圖與決策 #跨學科整合 #自動化科研 #認知科學
閱讀更多:
Jones, Cameron R., and Benjamin K. Bergen. Large Language Models Pass the Turing Test. arXiv:2503.23674, arXiv, 31 Mar. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2503.23674
Meta團隊突破注意力機制瓶頸,多詞注意力讓大模型更“聰明”
傳統注意力機制因依賴單一詞向量相似性,難以精準定位復雜上下文信息。Meta的FAIR團隊(Olga Golovneva、Tianlu Wang、Jason Weston、Sainbayar Sukhbaatar)提出多詞注意力(MTA),通過卷積操作整合多詞信息,顯著提升模型性能。
研究團隊設計的多詞注意力(MTA)在傳統注意力機制基礎上,引入三維卷積(覆蓋鍵、查詢和注意力頭),使模型能同時分析多個詞向量的關聯。例如,MTA可先分別定位“Alice”和“rabbit”,再結合兩者注意力權重找到共現的句子。實驗顯示,MTA在玩具任務中輕松解決傳統注意力無法處理的難題。在大規模語言建模任務中(880M參數,105B訓練數據),MTA將驗證困惑度(perplexity)降低,且參數量僅增加0.001%。長上下文任務如“大海撈針”(Needle-in-the-Haystack)和BabiLong中,MTA性能遠超基線模型。這一成果為大模型的高效信息檢索提供了新思路。
#大模型技術 #預測模型構建 #跨學科整合 #計算模型與人工智能模擬
閱讀更多:
Golovneva, Olga, et al. Multi-Token Attention. arXiv:2504.00927, arXiv, 1 Apr. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2504.00927
AI定制膝關節置換術為“羅圈腿”患者帶來福音
傳統膝關節置換術對天生腿部彎曲患者效果不佳,奧克蘭大學Simon Young團隊開發AI輔助“功能對齊”技術,通過機器人分析個體解剖數據,優化假體定位。臨床試驗顯示,該技術顯著提升患者術后生活質量和滿意度。
研究采用隨機對照試驗(n=244),對比傳統機械對齊(MA)與功能對齊(FA)。FA組通過人工智能算法分析患者膝關節三維影像,從2萬種虛擬方案中篩選最佳匹配,并動態調整軟組織平衡(soft-tissue balance,即關節周圍韌帶張力協調)。結果發現,FA組自然彎曲腿患者的KOOS癥狀評分(86.6±12.9 vs 82.5±14.0)和生活質量評分(76.1±20.3 vs 70.7±22.7)顯著更高,且94%患者愿意推薦該技術(MA組82%)。FA還減少65%的軟組織松解需求。研究發表在 Journal of Arthroplasty 上。
#疾病與健康 #個性化醫療 #AI驅動科學 #骨科手術 #機器人輔助
閱讀更多:
Young, Simon W., et al. “The John N. Insall Award: Functional Versus Mechanical Alignment in Total Knee Arthroplasty: A Randomized Controlled Trial.” The Journal of Arthroplasty, vol. 0, no. 0, Feb. 2025. www.arthroplastyjournal.org, https://doi.org/10.1016/j.arth.2025.02.065
機器人學會"皺眉思考",人類更愿信任它
如何讓機器人擺脫"恐怖谷"的冰冷感?廣島大學Shushi Namba團隊聯合RIKEN發現,賦予機器人"思考表情"是關鍵。通過模仿人類沉思時的皺眉動作,安卓機器人Nikola成功獲得更高親和力。
?皺眉癥患者眉毛下垂,眼睛瞇起。Credit: Shushi Namba/Hiroshima University
研究分三階段:首先用非負矩陣分解(NMF)解析人類思考時的5類面部模式(如瞇眼、嘴角緊繃),從中選定"皺眉臉"(Component 4)作為最顯著特征。隨后,團隊在機器人Nikola面部復現該表情,并通過240段視頻測試發現,89%參與者認為皺眉機器人更"真實"且減少33%的詭異感。在模擬壽司店問答場景中,思考臉使機器人"人性化"評分提升40%,效果優于傳統加載動畫(dots)。但研究也指出,動態表情整合與文化差異是下一步重點。研究發表在 International Journal of Social Robotics 上。
#認知科學 #跨學科整合 #人機交互 #恐怖谷效應 #表情建模
閱讀更多:
Namba, Shushi, et al. “How an Android Expresses ‘Now Loading…’: Examining the Properties of Thinking Faces.” International Journal of Social Robotics, vol. 16, no. 8, Aug. 2024, pp. 1861–77. Springer Link, https://doi.org/10.1007/s12369-024-01163-9
大語言模型“聰明”是假象,依賴模板復述而非真實推理
大語言模型的“推理能力”是真實理解還是數據復述?字節跳動研究團隊設計 RoR-Bench 評測集,通過對比原題與微調變異題,發現GPT-4、Claude等模型在語義變化下準確率驟降超50%,揭示其“復述模板”的固有缺陷。
研究團隊構建包含215對題目的 RoR-Bench(含文本與圖像任務),每對包含原題和僅改動關鍵條件的變異題(如“相向而行”改為“相背而行”)。測試顯示,所有模型在變異題上平均準確率從70-90%跌至20-30%,部分模型(如DeepSeek-R1)下降超60%。多模態模型同樣中招,如GPT-4V在視覺錯覺題中“背答案”。團隊嘗試強制糾正提示(Forced Correct Prompt)、少樣本學習(Few-shot Learning)等方法,效果均有限。研究表明,LLMs的“推理”實為對訓練模板的匹配,缺乏對語義細微差異的敏感度。
#大模型技術 #計算模型與人工智能模擬 #跨學科整合 #語義理解 #AI評測
閱讀更多:
Yan, Kai, et al. Recitation over Reasoning: How Cutting-Edge Language Models Can Fail on Elementary School-Level Reasoning Problems? arXiv:2504.00509, arXiv, 1 Apr. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2504.00509
AI也會“壓力山大”?大語言模型表現竟與人類驚人相似
壓力如何影響AI?中國科學院自動化研究所的團隊開發StressPrompt提示集,發現大語言模型在壓力下的表現曲線與人類幾乎一致:中等壓力提升任務表現,極端壓力導致性能下降。
研究基于壓力與應對理論(Stress and Coping Theory)等心理學框架,設計100條壓力提示,由人類評分分級后應用于Llama-3等模型。結果顯示,在數學推理(MATH)任務中,Llama-3-8B-Instruct在中等壓力(6分)時得分比低壓力(1分)提升72倍(0.04→2.93分)。情緒智能(EQ-Bench)任務中,適度壓力增強模型表現,但高壓力會加劇偏見(ToxiGen數據集)。團隊通過表征工程(Representation Engineering)開發的壓力掃描儀發現,LLMs深層神經活動對壓力敏感,類似人腦高級認知區。這一發現為AI在客服、急救等高壓場景的優化提供新思路,例如通過動態調節“壓力”提升表現。
#認知科學 #大模型技術 #跨學科整合 #計算模型與人工智能模擬
閱讀更多:
Shen, Guobin, et al. StressPrompt: Does Stress Impact Large Language Models and Human Performance Similarly? arXiv:2409.17167, arXiv, 28 Jan. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2409.17167
神經網絡自組織奧秘揭曉:MIT團隊發現表征對齊統一理論
神經網絡如何高效學習數據特征?麻省理工學院CSAIL的Tomaso Poggio與博士后Liu Ziyin團隊提出突破性理論,揭示神經網絡訓練中表征、權重與梯度的自對齊機制,為解釋深度學習「黑箱」提供了統一框架。
研究提出典型表征假設(CRH),證明神經網絡每層的潛在表征(latent representations)、權重和神經元梯度(neuron gradients)會在訓練中自動對齊,形成緊湊且任務無關的特征表達。當人為打破對齊時,三者轉為多項式關系(PAH)。團隊通過圖像分類和自監督學習實驗驗證,發現這種機制能解釋神經崩潰(neural collapse,即類別表征高度結構化)等現象。例如,在CIFAR-10任務中,對齊層的特征維度縮減了70%。研究還指出,通過梯度噪聲注入可人工調控表征結構。
#AI驅動科學 #神經機制與腦功能解析 #計算模型與人工智能模擬 #跨學科整合
閱讀更多:
Ziyin, Liu, et al. Formation of Representations in Neural Networks. arXiv:2410.03006, arXiv, 27 Feb. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2410.03006
整理|ChatGPT
編輯|丹雀、存源
關于追問nextquestion
天橋腦科學研究院旗下科學媒體,旨在以科學追問為紐帶,深入探究人工智能與人類智能相互融合與促進,不斷探索科學的邊界。如果您有進一步想要討論的內容,歡迎評論區留言,或后臺留言“社群”即可加入社群與我們互動。
關于天橋腦科學研究院
天橋腦科學研究院(Tianqiao and Chrissy Chen Institute)是由陳天橋、雒芊芊夫婦出資10億美元創建的世界最大私人腦科學研究機構之一,圍繞全球化、跨學科和青年科學家三大重點,支持腦科學研究,造福人類。
Chen Institute與華山醫院、上海市精神衛生中心設立了應用神經技術前沿實驗室、人工智能與精神健康前沿實驗室;與加州理工學院合作成立了加州理工天橋神經科學研究院。
Chen Institute建成了支持腦科學和人工智能領域研究的生態系統,項目遍布歐美、亞洲和大洋洲,包括、、、科研型臨床醫生獎勵計劃、、等。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.