新智元報道
編輯:英智 好困
【新智元導讀】只有660B參數的開源模型,在數學和編程性能上擊敗了GPT-4.5和Claude 3.7。DeepSeek-V3-0324新版本的發布讓全球網友為之瘋狂,推理能力提升近20%,模型權重已全面開源!
DeepSeek-V3-0324新版本發布,推理能力大幅提升,在數學、代碼上超過GPT-4.5!
網友表示,這是OpenAI的噩夢,模型參數量只有660B,100%開源。
進入官網、APP或小程序后,關閉深度思考即可體驗。官方建議,非復雜推理任務用V3新版本更好。
模型權重現已開源:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324
性能全面提升,中文能力更強
DeepSeek-V3-0324全面超越了Claude 3.7!
新版模型借鑒DeepSeek-R1中的強化學習技術,在數學、代碼類評測集上超過了GPT-4.5。
在推理能力方面,DeepSeek-V3-0324相較于第一代V3,基準測試的準確率最高提升了近20%:
MMLU-Pro:75.9 → 81.2 (+5.3)
GPQA:59.1 → 68.4 (+9.3)
AIME:39.6 → 59.4 (+19.8)
LiveCodeBench:39.2 → 49.2 (+10.0)
在HTML等前端開發任務上,DeepSeek-V3-0324生成的代碼可用性更高,視覺上也更有設計感:
提升了代碼的執行效率
網頁和游戲前端界面更美觀
多個小球在指定空間范圍內運動的p5.js程序:包含若干可以調整重力、摩擦力等參數的滑動按鈕,并以賽博朋克風格的HTML呈現
在中文寫作任務上,DeepSeek-V3-0324基于R1進行了優化,提升了中長篇文本的創作風格和內容質量:
符合R1寫作規范
提高了中長篇寫作的質量
改進了多輪交互式內容重寫
優化了翻譯質量和信函寫作
中文搜索場景下,DeepSeek-V3-0324提升了對報告的分析能力,輸出內容更詳實、準確,排版更清晰美觀:
增強了報告分析請求功能,提供更詳細的輸出結果
除此之外,DeepSeek-V3-0324還提高了API函數調用的準確性,修復了之前V3版本中的問題。
國外網友已玩嗨
網友「Haider」表示,新的DeepSeek V3更新比預期要大得多,尤其是編程,贊其為目前最強大的完全免費的AI。
他用新模型構建的「聲波可視化器」游戲如下,結果好得難以置信。
@BrainYoung利用DeepSeek-V3-0324的巨大改進制作了以下游戲:
制作一個酷炫的three.js游戲。
官方使用指南
系統提示
在官方網頁/應用中,DeepSeek使用帶有特定日期的統一系統提示詞。
該助手為DeepSeek Chat,由深度求索公司創造。
今天是{current date}。
例如:
該助手為DeepSeek Chat,由深度求索公司創造。
今天是3月24日,星期一。
采樣溫度
在網頁和應用環境中,模型溫度參數T_model設置為0.3。
由于許多用戶在API調用中會使用默認溫度1.0,為此,DeepSeek貼心地設置了一個API溫度T_api映射機制——可以自動將輸入的API溫度1.0調整為模型最優溫度0.3。
換句話說,如果是通過API調用V3,那么溫度1.0就等同于溫度0.3。
文件上傳和網絡搜索
對于文件上傳,請按照模板創建提示詞,其中{file_name}、{file_content}和{question}是參數。
file_template = \
"""[file name]: {file_name}
[file content begin]
{file_content}
[file content end]
{question}"""
在進行網絡搜索時,{search_results}、{cur_date}和{question}是參數。
search_answer_zh_template = \
'''# 以下內容是基于用戶發送的消息的搜索結果:
{search_results}
在我給你的搜索結果中,每個結果都是[webpage X begin]...[webpage X end]格式的,X代表每篇文章的數字索引。請在適當的情況下在句子末尾引用上下文。請按照引用編號[citation:X]的格式在答案中對應部分引用上下文。如果一句話源自多個上下文,請列出所有相關的引用編號,例如[citation:3][citation:5],切記不要將引用集中在最后返回引用編號,而是在答案對應部分列出。
在回答時,請注意以下幾點:
- 今天是{cur_date}。
- 并非搜索結果的所有內容都與用戶的問題密切相關,你需要結合問題,對搜索結果進行甄別、篩選。
- 對于列舉類的問題(如列舉所有航班信息),盡量將答案控制在10個要點以內,并告訴用戶可以查看搜索來源、獲得完整信息。優先提供信息完整、最相關的列舉項;如非必要,不要主動告訴用戶搜索結果未提供的內容。
- 對于創作類的問題(如寫論文),請務必在正文的段落中引用對應的參考編號,例如[citation:3][citation:5],不能只在文章末尾引用。你需要解讀并概括用戶的題目要求,選擇合適的格式,充分利用搜索結果并抽取重要信息,生成符合用戶要求、極具思想深度、富有創造力與專業性的答案。你的創作篇幅需要盡可能延長,對于每一個要點的論述要推測用戶的意圖,給出盡可能多角度的回答要點,且務必信息量大、論述詳盡。
- 如果回答很長,請盡量結構化、分段落總結。如果需要分點作答,盡量控制在5個點以內,并合并相關的內容。
- 對于客觀類的問答,如果問題的答案非常簡短,可以適當補充一到兩句相關信息,以豐富內容。
- 你需要根據用戶要求和回答內容選擇合適、美觀的回答格式,確保可讀性強。
- 你的回答應該綜合多個相關網頁來回答,不能重復引用一個網頁。
- 除非用戶要求,否則你回答的語言需要和用戶提問的語言保持一致。
# 用戶消息為:
{question}'''
對于中文查詢,使用的提示詞如下:
search_answer_zh_template = \
'''# 以下內容是基于用戶發送的消息的搜索結果:
{search_results}
在我給你的搜索結果中,每個結果都是[webpage X begin]...[webpage X end]格式的,X代表每篇文章的數字索引。請在適當的情況下在句子末尾引用上下文。請按照引用編號[citation:X]的格式在答案中對應部分引用上下文。如果一句話源自多個上下文,請列出所有相關的引用編號,例如[citation:3][citation:5],切記不要將引用集中在最后返回引用編號,而是在答案對應部分列出。
在回答時,請注意以下幾點:
- 今天是{cur_date}。
- 并非搜索結果的所有內容都與用戶的問題密切相關,你需要結合問題,對搜索結果進行甄別、篩選。
- 對于列舉類的問題(如列舉所有航班信息),盡量將答案控制在10個要點以內,并告訴用戶可以查看搜索來源、獲得完整信息。優先提供信息完整、最相關的列舉項;如非必要,不要主動告訴用戶搜索結果未提供的內容。
- 對于創作類的問題(如寫論文),請務必在正文的段落中引用對應的參考編號,例如[citation:3][citation:5],不能只在文章末尾引用。你需要解讀并概括用戶的題目要求,選擇合適的格式,充分利用搜索結果并抽取重要信息,生成符合用戶要求、極具思想深度、富有創造力與專業性的答案。你的創作篇幅需要盡可能延長,對于每一個要點的論述要推測用戶的意圖,給出盡可能多角度的回答要點,且務必信息量大、論述詳盡。
- 如果回答很長,請盡量結構化、分段落總結。如果需要分點作答,盡量控制在5個點以內,并合并相關的內容。
- 對于客觀類的問答,如果問題的答案非常簡短,可以適當補充一到兩句相關信息,以豐富內容。
- 你需要根據用戶要求和回答內容選擇合適、美觀的回答格式,確保可讀性強。
- 你的回答應該綜合多個相關網頁來回答,不能重復引用一個網頁。
- 除非用戶要求,否則你回答的語言需要和用戶提問的語言保持一致。
# 用戶消息為:
{question}'''
對于英文查詢,使用的提示詞如下:
search_answer_en_template = \
'''# The following contents are the search results related to the user's message:
{search_results}
In the search results I provide to you, each result is formatted as [webpage X begin]...[webpage X end], where X represents the numerical index of each article. Please cite the context at the end of the relevant sentence when appropriate. Use the citation format [citation:X] in the corresponding part of your answer. If a sentence is derived from multiple contexts, list all relevant citation numbers, such as [citation:3][citation:5]. Be sure not to cluster all citations at the end; instead, include them in the corresponding parts of the answer.
When responding, please keep the following points in mind:
- Today is {cur_date}.
- Not all content in the search results is closely related to the user's question. You need to evaluate and filter the search results based on the question.
- For listing-type questions (e.g., listing all flight information), try to limit the answer to 10 key points and inform the user that they can refer to the search sources for complete information. Prioritize providing the most complete and relevant items in the list. Avoid mentioning content not provided in the search results unless necessary.
- For creative tasks (e.g., writing an essay), ensure that references are cited within the body of the text, such as [citation:3][citation:5], rather than only at the end of the text. You need to interpret and summarize the user's requirements, choose an appropriate format, fully utilize the search results, extract key information, and generate an answer that is insightful, creative, and professional. Extend the length of your response as much as possible, addressing each point in detail and from multiple perspectives, ensuring the content is rich and thorough.
- If the response is lengthy, structure it well and summarize it in paragraphs. If a point-by-point format is needed, try to limit it to 5 points and merge related content.
- For objective Q&A, if the answer is very brief, you may add one or two related sentences to enrich the content.
- Choose an appropriate and visually appealing format for your response based on the user's requirements and the content of the answer, ensuring strong readability.
- Your answer should synthesize information from multiple relevant webpages and avoid repeatedly citing the same webpage.
- Unless the user requests otherwise, your response should be in the same language as the user's question.
# The user's message is:
{question}'''
本地運行
DeepSeek-V3-0324的模型結構與DeepSeek-V3完全相同,支持函數調用、JSON輸出和FIM(填充中間)完成等功能。
參考資料:
https://mp.weixin.qq.com/s/XK6ymJL7y0vo_GQXxmpuBA
https://huggingface.co/deepseek-ai/DeepSeek-V3-0324
https://x.com/deepseek_ai/status/1904526863604883661
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.