作者|Hayward
原創首發|藍字計劃
AI的聊天功能一向被網友們調戲為“人工智障”,網友和他們聊天以找樂子的居多。真的有人會和AI“交心”嗎?
你好,有的。上周一位網友曬出一張截圖,是自己身患重病的父親在去世前夕和與豆包的對話,第一句是“我要去世了,豆包”。
現在的AI工具越來越“聰明”,和它聊天時往往還能得到窩心的回復,不少小學生、老年人已經開始把AI聊天助手當作朋友。
我們對AI的依賴、AI和我們生活的結合度,正走到歷史新高。
發現了嗎:過去搜索問題我們會先問百度,現在則會“問問DeepSeek”、“問問夸克”;如果需要做旅游攻略,還可以交給豆包、夸克生成答案。
經過大浪淘沙后,中國海量的AI工具還漸漸形成了三條不同的前進路線,上面提到的DeepSeek、夸克和豆包,正是三類工具的代表產品。
AI工具的“三國時代”,已經悄悄開始了。
天下三分
說2025年是AI元年一點都不夸張。
QuestMobile的數據,截至2025年2月,AI原生App月活躍用戶(MAU)突破2.4億,較去年同期凈增超1.15億,也就是說已經有接近2.5億的人接觸過AI工具。
在商業領域,行業數據顯示,2024年中國AI核心產業規模達5784億元,同比增長13.9%;到了2029年,這兩個數字還會分別攀升至1萬億元和32.1%。
說DeepSeek、夸克和豆包三分天下,三款軟件都擁有Top級別的月活是一大原因。
DeepSeek是國內AI原生App排名第一的軟件,今年3月的數據顯示月活能達到1.94億;夸克也不遑多讓,同期月活達1.48億,去年暑期時夸克的峰值月活更是接近2億;豆包則經歷了月活的暴增,從2024年的173萬增長至今年3月的1.1億,增速達到了35倍。
另一方面,在技術路線、應用場景上三個軟件剛好又“涇渭分明”。DeepSeek、豆包和夸克,分別代表了底層技術突破、用戶體驗重構和產業場景深耕三個維度,勾勒出中國AI工具的立體化發展脈絡。
三條路線,三個方向
相信天天都在用這三款軟件的人不少,但大家有沒有想過,為什么夸克豆包沒有像DeepSeek一樣擅長邏輯推理?
夸克的AI搜索功能結果,為什么會和DeepSeek搜出來的有明顯的區別?
這正是DeepSeek、夸克和豆包代表著中國AI工具三條不同發展路線的具體表現。
先說大家很熟悉的DeepSeek。
DeepSeek作為中國AGI領域的代表,其核心競爭力體現在通用大模型的研發與開源生態構建,他們和其他 AI 廠商最大的不同在于專注于底層技術突破,而非商業化。
雖然也有傳統模型產品V3,但在今天提起DeepSeek大家最先想起的肯定是推理模型R1。
既然是「推理模型」,推理能力自然是R1的優勢,它在數學推理、代碼生成和復雜任務處理上實現了突破性進展,數學任務上的性能可與OpenAI的O1相媲美。
傳統大模型在回答同類型問題時,更容易遇到知識精細度不足與領域適配困難、復雜推理能力缺失、算力消耗與部署成本過高等問題,這都被DeepSeek R1一一解決了。
其中的關鍵是,DeepSeek R1可以依靠混合專家架構(MoE)實現效率躍升,以強化學習突破數據依賴,借開源生態加速場景滲透,解決數學推理、復雜任務處理場景的各種問題。
技術架構上,強化學習驅動的高效推理帶來了大模型訓練的“規模效應”革命,對MoE架構進行優化,相比傳統全參數模型降低30%的算力消耗,回答專業領域問題時延遲更低,實現“小力出奇跡”。
當然更加驚艷世人的是DeepSeek R1首次以長鏈邏輯與思維可視化的方式,展現了推理模型的特性,它也是全球首個展示完整推導過程的推理模型。
在推理能力的加持下,R1的復雜任務分解能力大大提升,可逐步拆解跨領域問題。比如在解答高考數學題時,R1會逐步呈現概率計算路徑,而傳統模型只會直接輸出最終結果,用戶也可以從推理過程中找出模型的思考漏洞并進行改進。
DeepSeek的技術路線,決定了它更擅長自然語言處理和復雜推理類的問題,在代碼生成和編程輔助上也展現出了極強的能力。特別對金融、銀行和科研機構來說,DeepSeek的出現能大大增加數據分析的效率,也算是掀起了一股產效比革命。
而且這種技術路徑不僅提升了模型的泛化能力,還通過MIT開源協議降低了開發者的使用門檻,推動AI技術的普惠化。
從行業趨勢看,DeepSeek的發展與《2025中國AIGC應用全景圖譜報告》中提到的“模型層關鍵趨勢”高度契合。
報告提到,中國大模型的競爭正從“技術有無”轉向“代差級領先能力”,而DeepSeek通過混合專家系統(MoE)和多模態技術突破,在模型深度推理能力上確實建立了差異化優勢,還成為了全世界學習的對象。
此外,深度求索主張的開源策略與國內廠商“協作創新”的趨勢一致,現在還有自稱AI工具的軟件沒接入DeepSeek嗎?
DeepSeek,偉大。
然后來談談夸克。
夸克和DeepSeek的最大不同之處在于,DeepSeek的網頁搜索功能是一種輔助功能,夸克則把AI搜索作為了工具的核心。
阿里在定義夸克的時候,將這稱為“AI與行業場景的深度融合”。
阿里對夸克的期望很高,把它定位為「AI普惠平臺」:以“2億人的AI全能助手”為品牌核心,依托阿里生態實現“搜索+生成”雙向增強,確立了“AI+搜索”“AI+辦公”“AI+教育”三大主線。
阿里在打造AI時代的夸克時,在“提升搜索效果”上下了非常大的功夫,所以今天的夸克,是這樣的:
能搜到幾秒前發生的大新聞。夸克可以依托阿里云通義大模型與搜索生態的深度融合,實現10秒每次的更新頻率,抓取新消息的延遲也降低到了3分鐘以內。
弄了一個「超級框」。夸克將將AI對話、深度搜索、內容生成(PPT、文案)、學術研究等功能全塞了進去,它有點像過去的“百度一下”,不需要分門別類,簡化了用戶在搜索時的思考成本和操作邏輯。
擁有相對更低的AI幻覺。夸克設置了三審三校機制,醫療、法律等專業領域生成需經行業專家審核,結合知識圖譜校驗,據稱可以將醫療問答錯誤率控制在5%以下。
從結果來看,避開DeepSeek和豆包等軟件的鋒芒,主攻AI搜索的夸克是成功的。每月擁有1.5億上下的月活基本奠定了它在AI搜索工具的龍頭地位,并在去年高考期間靠著填報志愿、成績分析、職業規劃等功能狠狠出圈。
為了助力夸克成功,阿里也是費盡心思。夸克AI能力依托于阿里的心血結晶:通義千問大模型。
雖然是一款基于Transformer和MoE架構的、不時髦的非推理類傳統大模型,但能力還真挺行。
實際上根據基準測試平臺Chatbot Arena的評測榜單,通義Qwen2.5-Max超越DeepSeek-V3、Open AI o1-mini和Claude-3.5-Sonnet等模型,以1332分位列全球第七名,是中國非推理模型中最強的。
具體來看,Qwen2.5-Max在數學和編程等單項能力上排名第一,在硬提示(Hard prompts)方面排名第二。
而在LMArena的盲測榜單中,Qwen2.5-Max的數學推理(如MMLU-Pro、LiveCodeBench)和硬提示(Hard prompts)處理能力分別位列全球第1和第2,超越DeepSeek-V3(排名第8)。
夸克正是從通義千問力得到了文本、圖片、音頻、視頻聯合解析的多模態融合能力,在一些需要邏輯推理的場景中也可以發揮通義千問數學能力強的優點。
夸克讓阿里看到了進軍在AI領域的機會,2024年開始夸克在年度下載量、年度月活兩個關鍵數據上屢創新高,也是疫情以來阿里在C端增幅最快的產品之一。
或許對輕量化瀏覽器出生的夸克來說,延續“瀏覽器”這一歷史定位,從搜索路線切入AI的C端,期待成為DeepSeek、豆包這樣的國民級軟件,已經是最好選擇。
最后,是今天開頭那則小故事的主角:火山引擎的豆包
實際上,可能對大多數的用戶來說,豆包更加符合他們對AI工具的認知。能吟詩作對、能畫畫做視頻,為用戶改文案,生成某些平臺專屬的風格文案…
字節對豆包的定位是“全民AI入口”,主攻消費級市場,創意生成和社交娛樂是它的最大賣點,多模態交互是整個工具的靈魂。
豆包代表了中國AI工具在C端場景的深度滲透。比起DeepSeek它功能更多;比起夸克,它生圖效果更好。
如果你覺得豆包不行,字節還為它安排了兩個馬仔打手保駕護航:即夢App主打輕量級的視頻和圖片生成,可靈則面向專業級的企業用戶。
再依托字節的流量生態,AI產出的視頻素材直接給到短視頻平臺使用,圖片素材可以同步到飛書上作為插圖,美美實現生態閉環。
為了實現這些創意生成效果,過去豆包AI依靠Transformer與擴散模型結合的基礎架構,結合語音-文本聯合建模和視覺生成技術的多模態技術融合,為用戶提供多模態功能。
4月17日,豆包發布了全新的1.5深度思考模型,采用了MoE架構,總參數200B、激活參數20B。
在繼續提高多模態能力的同時,豆包1.5強化了模型的數學、編程、科學和推理能力,測試表現甚至超過DeepSeek-R1、QwQ-32B等國產推理模型,與OpenAI o1、o3-mini-high等模型能力相仿。
隨著架構優化、資源分配優化和推理效率的提升,深度思考大模型讓豆包的圖片生成、視頻生成能力進一步升級,不僅支持了“邊想邊搜”、“視覺理解”等實用能力,豆包文生圖3.0也將生成圖片的最大分辨率提高到了2k級別。
依托字節系應用的海量流量,豆包預計還能持續在月活上創新高。哪怕在創意生成的絕對水準方面還沒有達到GPT-4o的高度,但作為一款使用門檻低、上手簡單的國產AI軟件,豆包完全還可以美美地偏安一隅。
最終,DeepSeek代表的通用大模型、豆包代表的消費級應用、夸克代表的行業解決方案,構成了“基礎研究-場景落地-生態協同”的完整鏈條。
三個AI工具都已經各自搶好賽道。夸張點說,只要你需要用AI工具,就繞不開上面三個軟件里的任意一個。
AI圍城
回過頭來,還是不勝唏噓。去年的今天,主流的AI工具搜索的內容、生成的文字都幾乎處于不可用狀態,當時也不會有人想在工作上用AI工具作為輔助,畢竟大概率是會幫倒忙的。
但一年之后,我們身邊涌現了各種各樣的AI,不僅查資料的豐富程度、準確程度大幅度提高,AI制作的頭圖、插圖已經司空見慣。從DeepSeek平地驚雷的那一刻起,我們的生活就被深深改變了。
就是,這也不完全是一件好事。
AI工具泛濫的一大問題是AI幻覺問題日益嚴重,比如大家信賴的DeepSeek R1,偏偏是眾多工具中AI幻覺偏高的;其他的AI軟件雖說各種手段降低了幻覺率,但其實也沒好到哪去。
在一部分的測試中,R1的事實性測試幻覺率高達22.33%,更糟的是一些由幻覺產生的“AI胡說八道”又會成為語料,重新喂回給AI,形成惡性循環,最終把整個中文互聯網都污染了。
哪怕你不用AI,也不知道網上哪些是由AI編造的假信息。
|又是一次言之鑿鑿的胡說八道
另外,開頭那個關于豆包的新聞,總讓人止不住擔憂:老人家寧愿向AI告別,也不愿意和家人傾訴。
畢竟遠在大洋彼岸的美國,一年前有一位名叫Sewell Setzer的弗羅里達州男孩,在聊天機器人程序Character.ai的“慫恿”下選擇自殺,年僅14歲。現在他的家人還和AI軟件的公司打著官司,這是一宗“人類和AI走得太近”引發悲劇的典型案例。
當AI越來越智能,聊天機器人越發像人,我們就像身處由AI構筑的圍城里。把作品、言論、思想喂給AI作為語料,把最后的心情、感覺、心愿留給AI,會不會終有一天,人類變得和AI太“親近”,又和人類太“疏遠”?
在這AI三國鼎立的一刻,人類和人工智能之間的關系,開始慢慢變得微妙起來。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.