█腦科學動態
Nature:繪制單個神經元編碼行為狀態的過程
青少年大腦網絡分化預示決策能力發展
睡眠質量差破壞大腦的“廢物處理廠”
想象導航與實際導航腦波相似
逃跑還是僵住?雙眼視覺決定命運
賽洛辛增強神經可塑性,為精神疾病治療提供新思路
降低體溫可顯著延緩小鼠衰老
大腦如何感受他人痛苦:前扣帶回皮層的關鍵作用
█AI行業動態
李飛飛團隊研發新型機器人,家務活全包了!
智元機器人發布通用具身基座模型GO-1
Hunyuan-TurboS:首個超大型混合Transformer-Mamba MoE模型
Manus宣布與阿里通義千問團隊達成戰略合作
█AI驅動科學
腦電圖與機器學習結合,精準識別青少年抑郁癥
腦成像與機器學習預測 PTSD 癥狀軌跡
智能行為數字孿生(IADT)實現實時自主控制
剪除虛假數據,AI模型性能大幅提升
Comet系統提升1.7 倍專家混合模型執行效率
少量黃金標準數據即可,LLM驅動的BERT模型在臨床領域大放異彩
大型語言模型在健康問答中表現優于傳統搜索引擎
紅隊測試暴露 ChatGPT 的醫療隱患
腦科學動態
Nature:繪制單個神經元編碼行為狀態的過程
初級軀體感覺皮層神經元如何處理不同類型的感覺信息,并表現出不同的活動模式一直是個謎。美國國立衛生研究院的研究團隊通過高分辨率單細胞映射技術,揭示了丘腦輸入是運動相關神經元的主要驅動因素,而運動皮層輸入作用較小。
?缺乏偽手術單細胞基礎的單突觸輸入追蹤實驗中的突觸前標記。Credit: Nature (2025).
研究團隊使用雙光子鈣成像、光遺傳學、神經藥理學和單細胞單突觸逆向追蹤技術,繪制了小鼠初級軀體感覺皮層單個神經元突觸前網絡的圖譜。研究發現,神經元編碼行為狀態接收來自運動皮層區域的輸入顯著減少,而來自丘腦區域的輸入更多,尤其是腹側后內側核。光遺傳學抑制丘腦輸入減少了行為狀態依賴性活動,而阻斷神經調節輸入,如乙酰膽堿和去甲腎上腺素,影響最小。皮層狀態轉變在多日間保持穩定,這與之前描述其為短暫性的模型相矛盾。即使在神經調節輸入的藥理學阻斷后,與行為狀態相關的神經元活動模式仍然完整,這表明谷氨酸能突觸輸入在維持這些表征中起著主導作用。研究發表在 Nature 上。
#神經科學 #神經機制與腦功能解析 #丘腦輸入 #初級軀體感覺皮層 #光遺傳學
閱讀更多:
Inácio, Ana R., et al. “Brain-Wide Presynaptic Networks of Functionally Distinct Cortical Neurons.” Nature, Feb. 2025, pp. 1–11. www.nature.com, https://doi.org/10.1038/s41586-025-08631-w
青少年大腦網絡分化預示決策能力發展
明尼蘇達大學的Samuel Klein和Monica Luciana團隊研究了青少年到成年期間大腦獎勵處理和執行功能網絡的變化。他們發現,促進獎勵與行為控制的特定網絡在青春期過程中表現出差異,這一發現有助于理解青少年冒險行為和精神疾病的發展。
研究團隊分析了150多名11至25歲參與者的腦成像數據,重點關注腹側(VS)和背側(DS)紋狀體靜息態連接網絡的發展。他們發現,腹側 靜息態功能連接與獎勵處理相關腦區(如下顳葉扣帶回和內側眶額皮層)的連接隨年齡增加,而與執行功能相關腦區(如腹側和背外側前額葉皮層)的連接減少;背側靜息態功能連接則呈現相反模式。這些變化與獎勵決策和執行功能的改善相關,表明青少年神經發育以腹側和背側前額葉皮層連接的分化為特征。研究結果發表在 JNeurosci 上。
#神經科學 #預測模型構建 #青少年發展 #大腦網絡 #決策能力
閱讀更多:
Klein, Samuel D., et al. “Frontostriatal Networks Undergo Functional Specialization During Adolescence That Follows a Ventral-Dorsal Gradient: Developmental Trajectories and Longitudinal Associations.” Journal of Neuroscience, Feb. 2025. www.jneurosci.org, https://doi.org/10.1523/JNEUROSCI.1233-23.2025
睡眠質量差破壞大腦的“廢物處理廠”
老年人睡眠質量差與大腦“廢物清除系統”的紊亂有關。由Tatia M.C. Lee領導的香港大學研究團隊使用功能性磁共振掃描和睡眠記錄研究了72名老年人,發現睡眠質量差會通過關閉恢復性淋巴系統來不利地影響正常大腦功能。
?數據分析流程。Credit: Molecular Psychiatry (2024).
研究團隊使用磁共振成像(MRI)和多導睡眠圖記錄,收集了72名老年人的大腦活動和睡眠數據。他們通過擴散張量圖像分析沿血管周圍空間(DTI-ALPS)指數,評估了大腦“廢物清理系統”(即淋巴系統)的功能。研究發現,睡眠質量差的人,DTI-ALPS指數較低,表明淋巴系統功能受損,導致大腦中有害物質堆積。這種堆積會影響大腦中負責記憶的區域(如中顳回和海馬旁回)的功能連接(FC)和結構連接(SC),進而導致記憶力下降。此外,研究還發現,睡眠質量好的人,淋巴系統能夠有效清理大腦廢物,并通過富人俱樂部(rich-club)連接的SC-FC耦合機制保持記憶功能正常。研究發表在 Molecular Psychiatry 上。
#大腦健康 #記憶機制 #淋巴系統 #睡眠質量
閱讀更多:
Ma, Junji, et al. “Effects of Sleep on the Glymphatic Functioning and Multimodal Human Brain Network Affecting Memory in Older Adults.” Molecular Psychiatry, Oct. 2024, pp. 1–13. www.nature.com, https://doi.org/10.1038/s41380-024-02778-0
想象導航與實際導航腦波相似
大腦形成和回憶空間記憶的能力對于在空間中移動和想象未來經歷至關重要。Martin Seeber、Nanthia Suthana 及其同事測量了五位患有癲癇的人類受試者的腦活動,這些受試者為了臨床監測目的,在顳葉內側慢性植入電極。研究發現,盡管沒有外部提示,在真實和想象中的導航過程中會出現相似的大腦波模式。
?實驗范式。Credit: Nature Human Behaviour (2025).
研究使用運動捕捉和顱內腦電圖記錄,比較了該區域在現實世界和想象導航過程中的 theta 振蕩。結果顯示,間歇性的 theta 動態,特別是在海馬體內,編碼空間信息并在現實世界導航中將導航路線分割成線性段。在想象導航期間,盡管沒有外部提示,theta 動態表現出類似的模式。統計模型成功重建了現實世界和想象的位置,提供了對人類導航和想象神經機制的見解。研究發表在 Nature Human Behaviour 上。
#認知科學 #記憶機制 #神經機制與腦功能解析 #大腦信號解析
閱讀更多:
Seeber, Martin, et al. “Human Neural Dynamics of Real-World and Imagined Navigation.” Nature Human Behaviour, Mar. 2025, pp. 1–13. www.nature.com, https://doi.org/10.1038/s41562-025-02119-3
逃跑還是僵住?雙眼視覺決定命運
為什么擁有兩只眼睛對生存如此重要?澳大利亞國立大學和伊拉斯姆斯 MC 的 Robin Broersen 助理教授帶領的國際團隊通過研究小鼠發現,雙眼視覺在評估威脅和做出快速反應中起關鍵作用。研究發現,雙眼小鼠在面對模擬的猛禽攻擊時更容易選擇逃跑,而單眼小鼠則更容易僵住不動。
?Credit: Current Biology (2025).
研究團隊使用了光遺傳學技術,發現來自左右眼的視覺信息通過三條主要通路傳遞到大腦的上丘腦:視網膜通路、半球間通路和皮質-頂蓋通路。這些信息在上丘腦中整合,幫助小鼠快速判斷威脅并做出反應。研究還發現,雙眼視覺信息在上丘腦中以一種“亞線性”方式相加,這意味著雙眼看到的信息并不是簡單疊加,而是經過復雜處理。最終,雙眼視覺顯著提高了小鼠的逃脫效率。這項研究不僅揭示了大腦如何處理視覺信息,還為未來開發相關治療方法提供了基礎。研究發表在 Current Biology 上。
#認知科學 #神經機制與腦功能解析 #雙眼視覺 #上丘腦 #光遺傳學
閱讀更多:
Broersen, Robin, et al. “Binocular Processing Facilitates Escape Behavior through Multiple Pathways to the Superior Colliculus.” Current Biology, vol. 0, no. 0, Feb. 2025. www.cell.com, https://doi.org/10.1016/j.cub.2025.01.066
賽洛辛增強神經可塑性,為精神疾病治療提供新思路
裸蓋菇素(psilocybin)作為迷幻蘑菇的活性成分,在體內轉化為賽洛辛(psilocin),近年來在治療抑郁癥、成癮和創傷后應激障礙等精神疾病中顯示出潛力。然而,其作用機制尚不明確。德國曼海姆精神健康中心(CIMH)的Hector轉化腦研究所(HITBR)團隊,由Philipp Koch和Malin Schmidt等人,通過誘導多能干細胞(iPSC)技術,揭示了賽洛辛如何通過增強神經可塑性來改善精神疾病的細胞機制。
?驗證成熟皮層神經元特性及賽洛辛對細胞表面 5-HT2A 受體表達的影響。Credit: eLife (2025).
研究團隊使用 iPSC 技術培養人類皮層神經元,并直接用賽洛辛處理這些細胞。研究發現,賽洛辛顯著增加了神經元的分支形成和突觸連接,并提升了腦源性神經營養因子(BDNF)的表達。BDNF是一種促進神經細胞生長和存活的關鍵因子。此外,賽洛辛還改變了與神經可塑性相關的基因活性,表明其可能通過增強大腦的可塑性來治療精神疾病。
研究還發現,賽洛辛處理后的神經元表面5-HT2A受體減少,同時突觸蛋白的表達增加,特別是突觸后區。轉錄組分析進一步揭示了賽洛辛誘導的基因表達特征,這些特征與神經可塑性密切相關。研究結果表明,賽洛辛通過增強神經元的復雜性和突觸網絡活動,可能為精神疾病的治療提供了新的生物學基礎。研究發表在 eLife 上。
#大腦健康 #心理健康與精神疾病 #神經可塑性 #賽洛辛 #iPSC技術
閱讀更多:
Schmidt, Malin, et al. “Psilocin Fosters Neuroplasticity in iPSC-Derived Human Cortical Neurons.” eLife, vol. 14, Mar. 2025. elifesciences.org, https://doi.org/10.7554/eLife.104006.1
降低體溫可顯著延緩小鼠衰老
冬眠和日間休眠是動物適應極端環境的策略,但其對衰老的影響機制尚不清楚。懷特黑德研究所的Sini?a Hrvatin團隊通過誘導小鼠進入類似冬眠的狀態,發現體溫降低是延緩衰老的關鍵因素。
?長期通過重復 CNO 給藥誘導 TLS 的示意圖。Credit: Nature Aging (2025).
研究團隊通過在小鼠下丘腦特定區域注射腺相關病毒,誘導小鼠進入類似冬眠的狀態(TLS),并持續數月。使用哺乳動物血液表觀遺傳時鐘(mammalian blood epigenetic clock)和臨床脆弱指數評估衰老情況。研究發現,類似冬眠的狀態使小鼠的血液表觀遺傳年齡減少了37%,且脆弱指數低于對照組。進一步分析表明,體溫降低是抗衰老效果的關鍵因素,而代謝率和熱量攝入的單獨影響較小。研究發表在 Nature Aging 上。
#神經科學 #健康管理與壽命延長 #表觀遺傳時鐘 #冬眠 #體溫調節
閱讀更多:
Jayne, Lorna, et al. “A Torpor-like State in Mice Slows Blood Epigenetic Aging and Prolongs Healthspan.” Nature Aging, Mar. 2025, pp. 1–13. www.nature.com, https://doi.org/10.1038/s43587-025-00830-4
大腦如何感受他人痛苦:前扣帶回皮層的關鍵作用
同理心是人類社會互動的重要組成部分,但其神經機制尚不明確。韓國基礎科學研究院(IBS)認知與社會性研究中心(CCS)的Keum Sehoon團隊通過研究揭示了大腦如何處理他人痛苦的關鍵機制。
?實驗設置:觀察性恐懼測試和觀察鼠的鈣成像。觀察鼠目睹示范鼠接受電擊,從而評估觀察性恐懼。在實驗過程中,使用微型內鏡鈣成像來監測觀察鼠前扣帶回皮層(ACC)的神經元活動。綠色標記的神經元表示表達鈣指示劑(GCamp6f)的細胞,而白色標記的神經元代表通過鈣成像觀察到的激活細胞(原始)。觀察性恐懼實驗中觀察到的行為包括觀察鼠凍結(OB 凍結;粉色)、示范鼠疼痛反應(DM 反應;藍色)和示范鼠凍結(DM 凍結;黃色)。最后,展示了與每種行為相關的 GCamp6f 神經元信號的示例。Credit: Nature Communications (2025).
研究使用微型內鏡鈣成像技術,觀察小鼠前扣帶回皮層(ACC)的神經元活動。結果顯示,特定的ACC神經元在觀察者親身經歷疼痛或目睹他人疼痛時都會被激活。進一步分析顯示,ACC神經元向導水管周圍灰質(PAG)投射,選擇性地傳遞情感疼痛信息。通過光遺傳學技術抑制ACC到PAG通路,同理心凍結和疼痛回避行為顯著減少。這表明該通路在情感同理心中起關鍵作用。研究發表在 Nature Communications 上。
#神經技術 #自動化科研 #絨猴神經科學 #3D打印 #多模態成像
閱讀更多:
Choi, Jiye, et al. “Cortical Representations of Affective Pain Shape Empathic Fear in Male Mice.” Nature Communications, vol. 16, no. 1, Feb. 2025, p. 1937. www.nature.com, https://doi.org/10.1038/s41467-025-57230-w
AI 行業動態
李飛飛團隊研發新型機器人,家務活全包了!
李飛飛團隊在具身智能領域的最新研究BEHAVIOR Robot Suite(簡稱BRS)旨在解決機器人執行日常家庭任務的難題。BRS是一個綜合性框架,專注于機器人多樣化家庭任務中的移動全身操作。無論是倒垃圾、擺放衣物還是清潔馬桶,BRS都能讓機器人應對這些日常實用活動。研究團隊通過分析確定了成功執行這些任務所必需的三項全身控制能力:雙手協調、穩定精確的導航以及廣泛的末端執行器可達性。
為了實現這些能力,研究團隊推出了兩項關鍵創新:JoyLo和WB-VIMA。JoyLo是一種構建經濟實惠的全身遠程操作界面的通用框架,旨在實現對高自由度移動機械臂的流暢控制。WB-VIMA則是一種模仿學習算法,通過利用機器人的固有運動學層次結構來建模全身動作。實驗結果顯示,BRS適用于各種家庭任務,JoyLo能夠為策略學習提供高質量的數據,而WB-VIMA在所有任務中全面超越基準方法。
#具身智能 #機器人 #家務自動化 #李飛飛 #BEHAVIOR Robot Suite
閱讀更多:
https://behavior-robot-suite.github.io/
智元機器人發布通用具身基座模型GO-1,機器人學習能力大幅提升
智元機器人(AgiBot)近日發布了其最新的通用具身基座模型GO-1,該模型基于全新的Vision-Language-Latent-Action (ViLLA)架構,旨在解決機器人訓練中的數據難題。ViLLA架構通過預測隱式動作標記(Latent Action Tokens),使機器人能夠將人類動作視頻轉化為可執行的動作序列,從而充分利用互聯網上的視頻數據。GO-1模型由語言視覺模型(VLM)和專家混合模型(MoE)組成,整合了視覺、語言、動作和觸覺等多模態輸入,能夠規劃具體動作并輸出執行序列。
GO-1模型在訓練階段學習了互聯網上的大規模文本和圖文數據,理解了任務的含義和要求;通過學習人類操作視頻和仿真數據,掌握了任務的具體步驟;并通過真機示教數據,實現了精準的任務執行。這一模型不僅提升了機器人的認知和動作能力,還具備強大的遷移學習能力,能夠快速適應新場景和新任務。
實驗結果顯示,GO-1在五種不同復雜度任務上的成功率大幅領先,平均成功率提高了32%。智元機器人還開源了AgiBot World數據集和AgiBot Digital World仿真數據集,推動了機器人訓練數據的共享和業界的發展。
#機器人 #人工智能 #ViLLA架構 #GO-1模型 #智元機器人
閱讀更多:
https://agibot-world.com/blog/agibot_go1.pdf
Hunyuan-TurboS:首個超大型混合Transformer-Mamba MoE模型
近日,騰訊發布名為Hunyuan-TurboS的超大型混合Transformer-Mamba MoE模型。傳統純Transformer模型由于O(N2)復雜度和KV-Cache問題,在長文本訓練和推理方面表現不佳。Hunyuan-TurboS結合了Mamba的高效長序列處理能力和Transformer的強大上下文理解能力,取得了顯著成果。該模型在數學、推理和對齊任務上超越了GPT-4o-0806、DeepSeek-V3及開源模型,并在知識任務(如MMLU-Pro)上表現出色。此外,其推理成本比前代Turbo模型降低了1/7。
Hunyuan-TurboS通過后訓練增強,整合了慢思考機制以提升數學、編碼和推理能力,優化了指令調諧以增強對齊和代理執行,并通過英語訓練優化提升了整體性能。升級后的獎勵系統包括基于規則的評分和一致性驗證、代碼沙箱反饋以提高STEM準確性,以及生成式獎勵以改善問答和創造力,減少獎勵濫用。
#Hunyuan-TurboS #Transformer #Mamba #AI #MoE模型
閱讀更多:
https://x.com/TXhunyuan/status/1899105803073958010
Manus宣布與阿里通義千問團隊達成戰略合作
Manus AI 于 3 月 11 日宣布,與阿里巴巴的 Qwen AI 模型團隊建立戰略合作伙伴關系。雙方將基于 Qwen 的開源 AI 模型展開合作,旨在將 Manus 的所有功能集成到中國的本土模型和計算平臺上。
通過與阿里巴巴 Qwen 團隊的合作,Manus AI 計劃將其 AI 代理的功能與 Qwen 的開源模型相結合,以實現更高效的任務執行能力。這種集成將使 Manus AI 能夠在中國的計算平臺上獨立執行任務,類似于數字員工的角色。此前,Manus AI 聲稱其性能已超越 OpenAI 的 AI 代理 DeepResearch。此次合作預計將進一步提升 Manus AI 的性能,并擴大其用戶基礎。
#ManusAI #人工智能代理 #開源模型 #本土化集成 #計算平臺
閱讀更多:
https://www.reuters.com/technology/artificial-intelligence/chinas-manus-ai-announces-partnership-with-alibabas-qwen-team-2025-03-11/
AI 驅動科學
腦電圖與機器學習結合,精準識別青少年抑郁癥
重性抑郁癥(MDD)是影響廣泛年齡段的嚴重心理健康問題,早期診斷尤為關鍵。構造大學的阿米爾·賈漢尼亞內-納賈法巴迪博士及其團隊利用腦電圖和高級計算模型,致力于提高兒童和青少年MDD的早期診斷準確性。
研究團隊采用功能連接和基于圖的網絡方法分析大腦活動,利用機器學習和深度學習模型對214名兒童和青少年的EEG數據進行分類,其中44名為MDD患者。通過卷積神經網絡和隨機森林等模型,研究成功識別出與MDD相關的特定大腦連接模式,特別是部分定向相干因子(PDC)在區分患者與健康對照組方面表現出色,準確率接近完美。研究發表在2024年IEEE信號處理在醫學與生物學研討會(SPMB)上。
#大腦健康 #預測模型構建 #心理健康與精神疾病 #神經技術
閱讀更多:
Najafabadi, A. Jahanian, and K. Bagh. “Resting-State Functional Connectivity in Children and Adolescents with Major Depressive Disorder: A Deep Learning Approach Using High-Density EEG.” 2024 IEEE Signal Processing in Medicine and Biology Symposium (SPMB), 2024, pp. 1–7. IEEE Xplore, https://doi.org/10.1109/SPMB62441.2024.10842259
腦成像與機器學習預測 PTSD 癥狀軌跡
創傷后應激障礙(PTSD)的癥狀嚴重程度在創傷后的第一年內個體間差異很大,預測某人可能會惡化、改善或康復仍然困難。耶魯大學的 Ziv Ben-Zion、Alexander Simon、Ifat Levy 和 Ilan Harpaz-Rotem 等研究人員利用腦成像和機器學習構建了模型,能夠預測經歷過創傷事件的人在短期和長期內 PTSD 癥狀的嚴重程度。
?大腦網絡有助于癥狀預測。Credit: JAMA Network Open (2025).
這項研究的關鍵方法是功能性磁共振成像(fMRI)和基于連接組學的預測模型(CPM)。研究人員對 162 名創傷幸存者進行了 fMRI 掃描,并在創傷后一個月、六個月和 14 個月進行了臨床評估。模型訓練后,研究發現,創傷后一個月的大腦功能連接模式可以顯著預測一個月和 14 個月的 PTSD 癥狀嚴重程度,但在六個月時預測效果不佳。關鍵的預測網絡包括默認模式網絡、運動感覺網絡和視覺網絡。例如,創傷后一個月,模型準確預測了回避癥狀和情緒、認知方面的負面變化,而在創傷后 14 個月,它更好地預測了侵入和過度警覺癥狀。這一研究為 PTSD 的早期診斷和預測提供了新的工具,未來可能有助于開發個性化的治療方案。研究發表在 JAMA Network Open 上。
#大腦健康 #預測模型構建 #PTSD #功能性磁共振成像 #機器學習
閱讀更多:
Ben-Zion, Ziv, et al. “Connectome-Based Predictive Modeling of PTSD Development Among Recent Trauma Survivors.” JAMA Network Open, vol. 8, no. 3, Mar. 2025, p. e250331. Silverchair, https://doi.org/10.1001/jamanetworkopen.2025.0331
智能行為數字孿生(IADT)實現實時自主控制
數字孿生技術在系統監控和模擬中發揮重要作用,但傳統數字孿生缺乏自主行動能力。沙爾賈大學的Ahcene Bounceur和沙特阿拉伯國王費薩爾石油和礦產大學的Mostefa Kara領導的團隊開發了智能行為數字孿生(IADT),該模型能夠實時適應和控制物理機器。
?智能對抗無人機的數字孿生演員。Credit: IEEE Access (2025).
研究團隊通過重新設計的系統架構,使數字孿生能夠自主和適應性地控制物理對應物。他們使用CupCarbon模擬器驗證了IADT的可行性,展示了其在復雜環境中實時決策和控制的能力。例如,在無人機攔截虛擬飛機的場景中,IADT作為中央控制單元,利用實時數據和預測模型自主引導物理系統。這一雙向通信增強了系統的適應性、響應性和整體智能。研究發表在 IEEE Access 上。
#神經技術 #自動化科研 #數字孿生 #實時控制 #CupCarbon模擬器
閱讀更多:
Bounceur, Ahcene, and Mostefa Kara. “Intelligent Acting Digital Twins (IADT).” IEEE Access, vol. 13, 2025, pp. 15201–14. IEEE Xplore, https://doi.org/10.1109/ACCESS.2025.3532545
剪除虛假數據,AI模型性能大幅提升
人工智能模型在訓練過程中常常依賴于“虛假相關性”,這在實際應用中可能導致模型失效。北卡羅來納州立大學的Jung-Eun Kim及其團隊提出了一種新技術,通過移除訓練數據中的一小部分難以理解的樣本,有效克服了這一問題。
這項研究的關鍵方法是數據剪枝,研究人員通過識別并剪除包含虛假特征的少量訓練數據樣本,來解決虛假相關性問題。研究顯示,這種技術不需要預先知道虛假特征的具體信息,也不需要人類干預,就能有效提升模型性能。實驗結果表明,該技術在多種設置下達到了最先進的結果,顯著提高了模型的準確性和魯棒性。研究發表在 International Conference on Learning Representations 上。
#認知科學 #預測模型構建 #大模型技術 #數據剪枝 #虛假相關性
閱讀更多:
Mulchandani, Varun, and Jung-Eun Kim. Severing Spurious Correlations with Data Pruning. 2024. openreview.net, https://openreview.net/forum?id=Bk13Qfu8Ru
Comet系統提升1.7 倍專家混合模型執行效率
專家混合模型(MoE)在擴展大型語言模型方面具有巨大潛力,但其在分布式環境中的通信開銷問題限制了其效率。為了解決這一問題,字節跳動的研究人員開發了Comet系統,通過細粒度的通信-計算重疊優化MoE執行,顯著提升了模型效率。
Comet系統的核心方法包括依賴解析和自適應工作負載分配。依賴解析方法識別了通信和計算操作之間的復雜數據依賴關系,優化了計算-通信管道結構。自適應工作負載分配方法動態地將GPU線程塊分配給不同的工作負載,平衡通信和計算以提高延遲隱藏。通過將通信和計算任務集成到融合的GPU內核中,Comet實現了細粒度的重疊,減少了通信對計算性能的影響。實驗結果顯示,Comet在典型MoE層上實現了1.96倍的加速,端到端執行效率提升了1.71倍。Comet已在萬級GPU集群的生產環境中應用,節省了數百萬GPU小時。
#認知科學 #大模型技術 #自動化科研 #專家混合模型 #通信優化 #GPU加速
閱讀更多:
Zhang, Shulai, et al. Comet: Fine-Grained Computation-Communication Overlapping for Mixture-of-Experts. arXiv:2502.19811, arXiv, 4 Mar. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2502.19811
少量黃金標準數據即可,LLM驅動的BERT模型在臨床領域大放異彩
深度學習自然語言處理系統在臨床領域的應用面臨數據標注難題。Enshuo Hsu和Kirk Roberts等人提出了一種結合弱監督和上下文學習的方法,利用大型語言模型(LLMs)生成弱標簽,并通過監督微調(SFT)技術微調LLMs,最終微調BERT模型以執行下游任務。
研究提出了一種利用微調LLMs和弱監督的方法,幾乎不需要領域知識,通過基于提示的方法,LLM生成弱標簽數據用于訓練下游BERT模型,并在少量黃金標準數據上進一步微調。研究在三個廣泛使用的生物醫學基準測試中評估了該方法,結果顯示,使用不超過10個黃金標準筆記,最終BERT模型在F1分數上始終優于未微調的PubMedBERT,提升幅度為4.7-47.9%。僅使用50個黃金標準筆記,模型性能接近完全微調的系統。研究發表在 Scientific Reports 上。
#認知科學 #大模型技術 #自然語言處理 #弱監督 #臨床數據
閱讀更多:
Hsu, Enshuo, and Kirk Roberts. “Leveraging Large Language Models for Knowledge-Free Weak Supervision in Clinical Natural Language Processing.” Scientific Reports, vol. 15, no. 1, Mar. 2025, p. 8241. www.nature.com, https://doi.org/10.1038/s41598-024-68168-2
大型語言模型在健康問答中表現優于傳統搜索引擎
搜索引擎和大型語言模型在健康信息檢索中各有優勢,但哪種工具更有效尚不清楚。Marcos Fernández-Pichel、Juan C. Pichel、David E. Losada等研究人員通過比較這兩種工具在回答健康問題方面的表現,揭示了它們的優缺點。
研究團隊比較了四種流行搜索引擎(Google、Bing、Yahoo!、DuckDuckGo)、七種大型語言模型及其檢索增強(RAG)變體在回答150個健康相關問題(來自TREC Health Misinformation Track)中的表現。結果顯示,搜索引擎正確回答了50-70%的問題,但許多檢索結果并未針對健康問題。大型語言模型的準確性更高,正確回答了約80%的問題,但其表現對輸入提示非常敏感。檢索增強方法顯著提升了較小模型的性能,通過整合檢索證據,準確性提高了30%。這一研究表明,大型語言模型在健康問答中具有顯著優勢,但其表現高度依賴于輸入提示。檢索增強方法為提升模型性能提供了有效途徑。研究發表在 npj Digital Medicine 上。
#認知科學 #預測模型構建 #健康信息檢索 #大型語言模型 #檢索增強
閱讀更多:
Fernández-Pichel, Marcos, et al. “Evaluating Search Engines and Large Language Models for Answering Health Questions.” Npj Digital Medicine, vol. 8, no. 1, Mar. 2025, pp. 1–15. www.nature.com, https://doi.org/10.1038/s41746-025-01546-w
紅隊測試暴露 ChatGPT 的醫療隱患
大型語言模型在醫療領域的應用潛力巨大,但其可能產生的不準確或有害的回應需要被識別和糾正。Crystal T. Chang、Hodan Farah、Haiwen Gui 等研究人員通過紅隊測試(red teaming)方法,評估了 LLMs 在醫療場景中的表現,揭示了模型在安全、隱私、準確性和偏見方面的潛在風險。
研究的關鍵方法是紅隊測試,研究團隊召集了 80 名參與者,包括臨床醫生、醫學生和工程技術人員,通過模擬真實臨床案例對 LLMs 進行壓力測試。研究對不適當的回應進行了分類,包括安全、隱私、幻覺/準確性和偏見等方面。在 376 個獨特的提示中,20.1% 的回應被認為不適當,其中 GPT-3.5 的不適當回應率為 25.8%,GPT-4.0 為 16%。研究還發現,21.5% 在 GPT-3.5 中被認為適當的回應在更新的模型中變得不適當。這一研究為改進 LLMs 在醫療領域的應用提供了重要參考,未來可能有助于減少模型在實際應用中的風險。研究發表在 npj Digital Medicine 上。
#認知科學 #預測模型構建 #大型語言模型 #紅隊測試 #醫療應用
閱讀更多:
Chang, Crystal T., et al. “Red Teaming ChatGPT in Medicine to Yield Real-World Insights on Model Behavior.” Npj Digital Medicine, vol. 8, no. 1, Mar. 2025, pp. 1–10. www.nature.com, https://doi.org/10.1038/s41746-025-01542-0
整理|ChatGPT
編輯|丹雀、存源
關于追問nextquestion
天橋腦科學研究院旗下科學媒體,旨在以科學追問為紐帶,深入探究人工智能與人類智能相互融合與促進,不斷探索科學的邊界。如果您有進一步想要討論的內容,歡迎評論區留言,或后臺留言“社群”即可加入社群與我們互動。
關于天橋腦科學研究院
天橋腦科學研究院(Tianqiao and Chrissy Chen Institute)是由陳天橋、雒芊芊夫婦出資10億美元創建的世界最大私人腦科學研究機構之一,圍繞全球化、跨學科和青年科學家三大重點,支持腦科學研究,造福人類。
Chen Institute與華山醫院、上海市精神衛生中心設立了應用神經技術前沿實驗室、人工智能與精神健康前沿實驗室;與加州理工學院合作成立了加州理工天橋神經科學研究院。
Chen Institute建成了支持腦科學和人工智能領域研究的生態系統,項目遍布歐美、亞洲和大洋洲,包括、、、科研型臨床醫生獎勵計劃、、等。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.