為了推動大模型技術的普及與傳播,經過數月的大量修訂,由中國人民大學師生聯手撰寫的《大語言模型》中文書籍正式出版。作為該領域全面解析大模型技術的中文著作,該書將提供大模型技術的權威介紹,注重為大模型技術的入門讀者提供講解,力圖展現一個整體的大模型技術框架和路線圖。目前專著已經上線各大電商平臺,文末附京東購買鏈接。
本書由中國人民大學高瓴人工智能學院趙鑫教授和文繼榮教授領銜主編,博士生李軍毅、周昆和碩士唐天一參與編著,作者團隊在大模型領域有著豐富的研究與開發經驗,曾主導研發了文瀾、玉蘭等大模型。
推薦語
張宏江 北京智源人工智能研究院學術顧問委員會主任、美國國家工程院外籍院士:
本書的編者長期從事大模型技術的相關研究,曾組織研發了文瀾、玉蘭等一系列大模型,具有深厚的科研與實踐積累。本書內容深入結合了編者在研發大模型過程中的第一手經驗,全面覆蓋了大模型技術的多方面知識,可以作為深入學習大模型技術的參考書籍,強烈推薦閱讀!
鄂維南 北京大學講席教授、中國科學院院士:
本書的編寫團隊于2023年3月發布了學術界首篇大語言模型綜述文章“A Survey of Large Language Models”,受到了廣泛關注。在這篇經典綜述文章基礎上,編寫團隊對編寫內容進行了精心組織與撰寫,并且融入了其長期從事大模型技術的科研經驗。本書具有重要的參考與學習價值,是一部值得推薦的大模型佳作。
張亞勤 清華大學智能科學講席教授、中國工程院外籍院士:
大模型作為一種快速興起的人工智能技術,已經深刻地影響了未來的科技發展趨勢。為了更好地推進大模型技術在我國的學習與普及,亟須有專業的中文技術圖書進行系統介紹。本書是一部精心編寫的大模型技術圖書,涵蓋了預訓練、微調、對齊、提示工程等眾多基礎內容,能夠為相關從業人員提供權威的、系統的學習參考,強烈推薦閱讀。
書籍特色
1.全面解讀大語言模型
本書內容基本全覆蓋大語言模型訓練與使用的全流程,從預訓練到微調與對齊,從使用技術到評測應用,幫助讀者全面掌握大語言模型的核心技術。
2.豐富的配套代碼與工具
本書以核心算法技術為基礎,并配有大量的代碼實戰與講解,同時搭配相關的開發工具包LLMBox與YuLan大模型,供讀者深入閱讀理解相關技術。
3.通俗易懂,專業權威
本書兼顧理論深度與閱讀體驗,以清晰的語言與豐富的圖解,降低技術門檻,讓初學者和專業人士都能輕松上手。
精美插圖
我們梳理了自2019年以來的各大學術機構的大語言模型發展歷程,可以看到近三年大模型的井噴式發展。
我們整理了基于LLaMA模型的各類衍生工作,通過繼續預訓練、指令微調等方法,LLaMA可以適配到不同的語言、多樣的領域。
片段欣賞
本書通過圖片、表格、公式、示例、代碼、實驗結果等多樣化的展示形式,力求向讀者深入淺出地講解大模型的不同技術。
本書收集了不同的預訓練數據過濾技巧,以“建議”的形式向讀者更好地展示具體的過濾方法。
本書基于配套開發工具包LLMBox與YuLan大模型,展示了完整的指令微調代碼,讀者可以“端到端”上手實踐。
書籍目錄(共四個部分、13個章節,全書357頁):
第一部分 背景與基礎知識
第1章 引言
第2章 基礎介紹
第3章 大語言模型資源
第二部分 預訓練
第4章 數據準備
第5章 模型架構
第6章 模型預訓練
第三部分 微調與對齊
第7章 指令微調
第8章 人類對齊
第四部分 使用與評測
第9章 解碼與部署
第10章 提示學習
第11章 規劃與智能體
第12章 評測
第13 章 總結
最后,附上本書的京東購買鏈接:
點擊封面,購買此書
想要這本書的朋友,歡迎在后臺回復“大語言模型”參加抽獎贈書活動!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.