2025年2月,隨著國產大語言模型DeepSeek-R1的發布,更加全面地討論大語言模型怎樣影響中國哲學社會科學的時機已經成熟。
大語言模型是當前國際人工智能競賽的焦點。以美國的“星門計劃”為例,美國總統特朗普再度當選以來的一件重要工作就是宣布由OpenAI、甲骨文和軟銀等三家企業合力,投資5000億美元在美國建設人工智能研發與落地的基礎設施。與此同時,美國還有Llama系列模型、Claude系列模型等競品參與市場競爭。歐洲也不甘落后,法國推出Mistral模型,試圖參與人工智能的競爭。
中國科技企業在大語言模型方面千帆競發,阿里推出通義千問、字節跳動推出豆包、百度推出文心一言、月之暗面推出Kimi,除此之外還有很多通用或有專用場景的大語言模型產品在不斷研發和推出。深度求索發布的DeepSeek-R1模型,在推理能力上達到世界先進水平,與此同時成本遠低于競品,為大語言模型的研發提供了新的思路,在中外學術界和產業界引發熱烈反響。更重要的是其產品開源、不設壁壘,廣大第三世界國家可以在其基礎上研發符合自身需要的大語言模型產品,為世界技術公平作出巨大貢獻。
大語言模型作為生產力工具可以用于學術研究,這一議題已經得到廣泛討論。大語言模型可以直接用于學術研究中的實質階段,例如有研究探索用大語言模型輔助人類研究者建立因果推斷模型、建構社會調查數據、對數據進行編碼分類等。大語言模型還可用于輔助學者的學術生產,例如輔助學者寫代碼進行數據分析、從事多語翻譯、修正文章格式、檢索學術文本等。在大語言模型助力下,中國哲學社會科學研究的水平和效率都有較大提升的潛力。
此前,中國已有不少學術期刊文章討論其中的機遇與挑戰。不過,此前的大語言模型以歐美的ChatGPT、Claude、Llama等模型為研究對象,不免存在水土不服的問題。隨著DeepSeek-R1的發布,在中國哲學社會科學研究實踐中更深度地整合大語言模型變得更加可行。
其一,DeepSeek是國產大語言模型,基于中國國情對模型進行進一步的調整,有助于使它更符合中國哲學社會科學學者的需求。例如,有不少研究發現,歐美國家研發的大語言模型可能存在新自由主義偏見,輸出的結果并不一定符合世界其他國家的世界觀和價值觀。通過自主研發,DeepSeek在這一點上可以更好地契合中國國情,幫助研究者從事具有中國特色的哲學社會科學研究。
其二,DeepSeek在中外文翻譯上表現優異。采用大語言模型從事中文與外文之間的互譯可以建立高度自動化的翻譯流程,幫助中國更好、更快地講好中國故事。學術期刊或專著的翻譯周期可以大幅縮減,而且可以與在線出版高度耦合,把中國的學術研究推向世界舞臺。采用中文學術話語形成語料對模型進行調優,可以使其翻譯準確性得到進一步提高。
其三,DeepSeek可以為中國各語言之間的互譯提供支持。中國有56個民族,各民族語言有數十種。此前與少數民族相關的民族學、人類學和少數民族文學研究面臨的一大挑戰就是對民族語言材料的解讀和運用。基于大語言模型可以提高對民族語言翻譯的便利性和準確性,有利于對各民族文化的研究與傳承,更好地促進民族融合。這項重要工作可以寄希望于中國的大語言模型。
其四,DeepSeek可以幫助中國哲學社會科學跨越國際出版行業建立的知識壁壘,獲取專業內容。大量學術出版物的文本并不在互聯網上公開流通,需要學術研究機構付費獲取,而這一高昂費用并不是每個高校都能負擔得起。即便能夠負擔費用,從海量文本中檢索特定信息也相當困難。DeepSeek等大語言模型的預訓練數據中包含大量專業文本,而且可以對其掌握的信息進行檢索和推理,這些都有助于中國哲學社會科學研究提升自身水平。不過與其他大語言模型類似,DeepSeek也面臨“幻覺”問題,因此還需要使用者的甄別。
與此同時,DeepSeek等大語言模型有可能對現有的學術分發機制帶來挑戰。一方面,從門戶網站到搜索引擎、從搜索引擎到推薦算法,互聯網上的信息分發模式隨著技術進步也在不斷變革。DeepSeek在生成內容的同時扮演信息分發的角色,對現有的學術數據庫檢索—推薦模式造成沖擊。優化當前學術出版的流程從而應對這一挑戰,是科研成果在當代獲得社會影響必要的前提。另一方面,大語言模型也為中國哲學社會科學的學術生產帶來了一些不確定性。可以想見,可能有許多主要由DeepSeek之類大語言模型生成的論文投稿正在涌向學術期刊,而編輯如何對此加以甄別、如何對待其中隱含的倫理問題將成為迫切的議題。
挑戰與機遇并存,大語言模型為中國哲學社會科學建設有中國特色的話語體系創造了歷史機遇,中國哲學社會科學研究者應當抓住窗口期,構建具有中國特色、中國風格、中國氣派的哲學社會科學。目前,已經有部分高校在本地部署了DeepSeek的某個版本,服務教學與科研,這是一種寶貴的探索。結合哲學社會科學研究機構的使用反饋和建議,大語言模型及其研發團隊能夠針對學術界科研人員需求推動進一步研發,設計多種應用層產品,在學術生產的各個環節提供服務。例如,針對前述第二點,呼吁中國高水平學術期刊聯合建立“開放獲取”(Open Access)在線平臺,以中英文雙語同步發表中國學術期刊上的學術研究,從而向世界講好中國故事。對文本的格式處理、參考文獻的統一管理、中英文互譯等工作都可以借助DeepSeek完成,使更多原本浩大的工程有了可行性。又如,針對前述第三點,語言學家、人類學家可以收集各民族語言語料、幫助進行數據標注,研發團隊在哲學社會科學工作者的指導下開發民族語言互譯的應用產品,再投入到實踐當中,可以節約更多“單打獨斗”帶來的開發成本。此外,DeepSeek對中文學術期刊發表內容的“幻覺”問題,一定程度阻礙了中國學術成果的傳播。中國的學術刊物應該在有關機構的號召和引領下,對自己的期刊發表內容進行整合,面向大語言模型訓練的需要提供語料,降低“幻覺”問題的發生。
作者系中國政法大學社會學院副教授
來源:中國社會科學報
責任編輯:余朋翰 王亮
新媒體編輯:張雨楠
如需交流可聯系我們
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.