99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

14.9萬(wàn)元,滿血流暢運(yùn)行DeepSeek一體機(jī)抱回家!清華90后初創(chuàng)出品

0
分享至

金磊 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI

滿血DeepSeek一體機(jī),價(jià)格竟然被打到10萬(wàn)元級(jí)別了!

而且還不是量化版本,正是那個(gè)671B參數(shù)、最高質(zhì)量的FP8原版。



或許有小伙伴要問(wèn)了,那跑DeepSeek-R1/V3的速度,能跟官方一較高下嗎?

可以的,甚至是更快的那種。例如我們提個(gè)問(wèn)題,來(lái)感受一下這個(gè)feel:

一個(gè)漢字具有左右結(jié)構(gòu),左邊是木,右邊是乞。這個(gè)字是什么?只需回答這個(gè)字即可。



△左:一體機(jī);右:DeepSeek官網(wǎng)

視頻地址:
https://mp.weixin.qq.com/s/luK0nlylq5faBytZ6Pvc1Q

從視頻中不難看出,不僅答案精準(zhǔn),一體機(jī)的速度也是肉眼可見(jiàn)地比DeepSeek官網(wǎng)快上一些,粗略估計(jì)是已經(jīng)接近了22 tokens/s。

那么這個(gè)一體機(jī)到底是什么來(lái)頭?

不賣關(guān)子,它就是由北京行云集成電路最新推出的產(chǎn)品——褐蟻HY90,具體價(jià)格定到了14.9萬(wàn)元。

而且除了產(chǎn)品,這家公司本身也是有不少的“標(biāo)簽”在身上的,其中最為吸睛或許當(dāng)屬CEO了:

季宇,清華90后博士、前華為“天才少年”、計(jì)算機(jī)學(xué)會(huì)CCF優(yōu)博獎(jiǎng)獲得者。



那么褐蟻HY90具體執(zhí)行起更多任務(wù)時(shí),又會(huì)是什么樣的效果?

來(lái),更多維度的一波實(shí)測(cè)走起。

實(shí)測(cè)10萬(wàn)元級(jí)的DeepSeek一體機(jī)

我們先在褐蟻HY90部署DeepSeek-R1,來(lái)測(cè)試一下它的推理能力。

有請(qǐng)AIME 2025的數(shù)學(xué)題

Find the sum of all integer bases b>9 for which 17b is a divisor of 97b.



視頻地址:
https://mp.weixin.qq.com/s/luK0nlylq5faBytZ6Pvc1Q

從內(nèi)容生成的速度上來(lái)看,褐蟻HY90面對(duì)數(shù)學(xué)推理問(wèn)題,依舊是可以保持接近20+ tokens/s。

并且最終給到的答案也是精準(zhǔn)無(wú)誤:70。



再來(lái)一道新版類似“9.9和9.11哪個(gè)大”、“Strawberry里面有幾個(gè)‘r’”,極度迷惑一眾AI的難題:

讓7米長(zhǎng)的甘蔗通過(guò)2米高1米寬的門。



△左:一體機(jī);右:DeepSeek官網(wǎng)

速度依舊在線,并且這個(gè)問(wèn)題已經(jīng)是難不倒DeepSeek,給出的答案也是正解。

而除了DeepSeek之外,我們還在褐蟻HY90上體驗(yàn)了一把類似Deep Research的功能:



視頻地址:
https://mp.weixin.qq.com/s/luK0nlylq5faBytZ6Pvc1Q

由此可見(jiàn),無(wú)論是什么類型的題目,褐蟻HY90都能以相對(duì)較快的速度絲滑處理。

不過(guò)有一說(shuō)一,以往的一體機(jī),即便是搭載Q4量化版本,成本動(dòng)輒就要達(dá)到200萬(wàn)元。

而褐蟻HY90在搭載滿血、未量化的DeepSeek情況下,不僅能夠保證速度,更是把價(jià)格打掉了一個(gè)數(shù)量級(jí)。

因此,接下來(lái)的一個(gè)問(wèn)題便是:

如何煉成的?

在我們聊“如何實(shí)現(xiàn)”之前,且需了解一下“什么在阻礙”。

首先,大家提到一體機(jī),第一反應(yīng)大概率就是GPU,而它本身就或許構(gòu)成了短板。

因?yàn)閭鹘y(tǒng)GPU方案因顯存容量限制,例如671GB需求需多張A100顯卡,成本已經(jīng)超過(guò)了百萬(wàn)的級(jí)別。

而CPU方案則受限于內(nèi)存帶寬,因?yàn)榇竽P屯评硇枰l繁加載參數(shù)(如671B參數(shù)的FP8精度模型占用約671GB內(nèi)存)。

如果內(nèi)存帶寬不足,就會(huì)導(dǎo)致計(jì)算單元(CPU 核心)長(zhǎng)時(shí)間等待數(shù)據(jù),形成“內(nèi)存墻”(Memory Wall),嚴(yán)重影響推理速度。

針對(duì)上述的短板,行云的褐蟻一體機(jī)采用雙路AMD 9005系列CPU,通過(guò)1TB/s的高內(nèi)存帶寬滿足基礎(chǔ)推理需求,同時(shí)搭配一張中高端消費(fèi)級(jí)GPU作為算力補(bǔ)充。

這種異構(gòu)計(jì)算架構(gòu)通過(guò)軟件協(xié)同優(yōu)化,既解決了純CPU方案在部分推理階段的算力不足問(wèn)題,又顯著降低了成本,將硬件投入壓縮至10萬(wàn)元以內(nèi)。



除此之外,行云自主研發(fā)的推理引擎框架通過(guò)算法優(yōu)化和任務(wù)調(diào)度,同樣對(duì)token生成速率起到了顯著的提升作用。

在FP8精度下,Decode階段速度穩(wěn)定在20TPS以上,且受上下文長(zhǎng)度影響較?。?28K上下文仍保持15TPS);Prefill階段在16K上下文內(nèi)首字延遲控制在80秒以內(nèi)。





這種高效推理能力尤其適合需要連續(xù)生成大量token的場(chǎng)景(如AI Agent),大幅縮短任務(wù)響應(yīng)時(shí)間。

不僅如此,團(tuán)隊(duì)還針對(duì)大模型運(yùn)行需求,精準(zhǔn)平衡了計(jì)算能力與內(nèi)存帶寬,支持滿血FP8精度的R1/V3模型,并預(yù)留擴(kuò)展能力,未來(lái)可支持1.5T參數(shù)量的模型。

通過(guò)參數(shù)壓縮技術(shù)(如INT4量化),進(jìn)一步將Decode速度提升至28TPS(1K上下文),滿足不同場(chǎng)景對(duì)速度與精度的靈活需求。

據(jù)了解,團(tuán)隊(duì)后續(xù)還將對(duì)MoE類的模型提供較好的支持。



褐蟻一體機(jī)的出現(xiàn),可以說(shuō)是改寫了行業(yè)的格局——

此前運(yùn)行滿血671B模型需百萬(wàn)級(jí)設(shè)備,而同類低配方案(如32B/70B模型)仍需20-40萬(wàn)元。

行云通過(guò)技術(shù)整合,將最高質(zhì)量的模型體驗(yàn)直接帶入10萬(wàn)元價(jià)位,為中小團(tuán)隊(duì)提供了低門檻、高擴(kuò)展性的AI部署方案。

這一技術(shù)突破不僅實(shí)現(xiàn)了“高性能+低成本”的平衡,更推動(dòng)了大模型在智能客服、數(shù)據(jù)分析等場(chǎng)景的普惠應(yīng)用。

清華90后創(chuàng)辦的公司

最后,正如我們剛才提到的,行云除了產(chǎn)品本身之外,創(chuàng)始團(tuán)隊(duì)同樣也有不少的亮點(diǎn)。

首先就是創(chuàng)始人兼CEO季宇,他本科就讀于清華大學(xué)物理系,后轉(zhuǎn)向計(jì)算機(jī)體系結(jié)構(gòu)方向,獲得清華大學(xué)計(jì)算機(jī)體系結(jié)構(gòu)博士學(xué)位。

在學(xué)術(shù)研究方面,他曾作為共同第一作者在頂級(jí)期刊《自然》(Nature)上發(fā)表計(jì)算機(jī)體系結(jié)構(gòu)相關(guān)論文,并榮獲中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)優(yōu)秀博士學(xué)位論文獎(jiǎng)(CCF優(yōu)博獎(jiǎng))。



△行云集成電路創(chuàng)始人兼CEO,季宇

在2023年8月成立行云集成電路之前,季宇曾在華為海思昇騰芯片團(tuán)隊(duì),擔(dān)任昇騰AI芯片編譯器專家,負(fù)責(zé)多個(gè)昇騰編譯器項(xiàng)目,也曾入選“華為天才少年”。

在華為期間,正因長(zhǎng)期專注于AI編譯器優(yōu)化和處理器微架構(gòu)等挑戰(zhàn)性問(wèn)題,也讓他積累了豐富的AI芯片研發(fā)經(jīng)驗(yàn)。

除了季宇本人之外,CTO余洪敏擁有深厚的學(xué)術(shù)背景和豐富的行業(yè)經(jīng)驗(yàn)。

他本科畢業(yè)于華中科技大學(xué),后在中國(guó)科學(xué)院半導(dǎo)體研究所獲得博士學(xué)位。

在職業(yè)履歷方面,余洪敏曾擔(dān)任百度昆侖芯、華為海思車載昇騰芯片等多款芯片的負(fù)責(zé)人,并曾在地平線擔(dān)任芯片研發(fā)總監(jiān)。

他長(zhǎng)期領(lǐng)導(dǎo)和管理超過(guò)100人的研發(fā)團(tuán)隊(duì),精通芯片研發(fā)設(shè)計(jì)全流程,具備豐富的實(shí)戰(zhàn)經(jīng)驗(yàn)——成功主導(dǎo)10余款芯片的流片與量產(chǎn),并多次推動(dòng)先進(jìn)工藝數(shù)據(jù)中心芯片的架構(gòu)設(shè)計(jì)、工程實(shí)現(xiàn)及大規(guī)模商用部署。

值得一提的是,在去年11月份,行云集成電路還得到了一眾明星資本的投資,包括智譜AI、峰瑞資本、嘉御資本、春華資本、聚合資本、中科創(chuàng)星、同創(chuàng)偉業(yè)、奇績(jī)創(chuàng)壇、水木清華校友基金等。

由此,從行云集成電路成立至今的發(fā)展來(lái)看,是有產(chǎn)品,有團(tuán)隊(duì),更有市場(chǎng)的那種了。

但更重要的一點(diǎn)是,這家剛成立兩年的公司,一舉實(shí)現(xiàn)了一體機(jī)圈子里類似的DeepSeek的“高性能+低成本”——

嗯,“中國(guó)初創(chuàng)”的含金量還在持續(xù)上升。

一體機(jī)近期可從官方公眾號(hào)預(yù)約體驗(yàn),更多詳情見(jiàn)↓


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
福州一知名火鍋品牌加盟店關(guān)閉!商場(chǎng)索賠44萬(wàn)違約金

福州一知名火鍋品牌加盟店關(guān)閉!商場(chǎng)索賠44萬(wàn)違約金

男女那點(diǎn)事兒兒
2025-04-30 00:36:14
銀行存款大調(diào)整!2025年4月起,存款超50萬(wàn)的家庭需留意!

銀行存款大調(diào)整!2025年4月起,存款超50萬(wàn)的家庭需留意!

巢客HOME
2025-04-08 20:33:26
越南一位大媽買彩票,不料竟中了140億。豪氣的她提前大擺宴席慶賀,并貸款給大家發(fā)禮品,可領(lǐng)獎(jiǎng)時(shí)卻傻眼了

越南一位大媽買彩票,不料竟中了140億。豪氣的她提前大擺宴席慶賀,并貸款給大家發(fā)禮品,可領(lǐng)獎(jiǎng)時(shí)卻傻眼了

明智家庭教育
2025-04-29 21:12:06
醫(yī)圈大瓜的事:北京協(xié)和的4+4,才是真正要命的問(wèn)題

醫(yī)圈大瓜的事:北京協(xié)和的4+4,才是真正要命的問(wèn)題

林孤小姐
2025-04-28 19:45:18
美國(guó)為何一直針對(duì)中國(guó)?英國(guó)學(xué)者:因?yàn)橹袊?guó)犯了2個(gè)“原罪”

美國(guó)為何一直針對(duì)中國(guó)?英國(guó)學(xué)者:因?yàn)橹袊?guó)犯了2個(gè)“原罪”

獵火照狼山
2025-04-30 00:10:03
正式簽約,阿爾德里奇亮相中國(guó),新崗位曝光,曾7進(jìn)NBA全明星

正式簽約,阿爾德里奇亮相中國(guó),新崗位曝光,曾7進(jìn)NBA全明星

樂(lè)聊球
2025-04-29 16:09:10
陜西檢察長(zhǎng)陳平疑案:死前喊冤,被槍斃后家屬不能收尸,直接火化

陜西檢察長(zhǎng)陳平疑案:死前喊冤,被槍斃后家屬不能收尸,直接火化

午夜故事會(huì)
2024-04-15 18:31:39
俄國(guó)家杜馬國(guó)防委員會(huì)主席稱不排除朝鮮軍人可能被部署到俄烏沖突前線其他地段

俄國(guó)家杜馬國(guó)防委員會(huì)主席稱不排除朝鮮軍人可能被部署到俄烏沖突前線其他地段

暖心的小屋
2025-04-30 01:14:04
為什么單親媽媽大部分都很窮?網(wǎng)友吐槽式回答,真實(shí)又扎心

為什么單親媽媽大部分都很窮?網(wǎng)友吐槽式回答,真實(shí)又扎心

墻頭草
2025-04-28 09:42:55
意裁委:我不裝了,點(diǎn)球沒(méi)判是個(gè)錯(cuò)誤,但錯(cuò)得不是很嚴(yán)重!

意裁委:我不裝了,點(diǎn)球沒(méi)判是個(gè)錯(cuò)誤,但錯(cuò)得不是很嚴(yán)重!

狗哥是一名三十年內(nèi)拉
2025-04-29 15:07:19
普京感謝朝鮮出兵,向金正恩打包票:若有需要,俄將出兵援朝

普京感謝朝鮮出兵,向金正恩打包票:若有需要,俄將出兵援朝

第一軍情
2025-04-29 10:16:46
醫(yī)生發(fā)現(xiàn):經(jīng)常喝茶的糖尿病患者,用不了多久,身體或出現(xiàn)4變化

醫(yī)生發(fā)現(xiàn):經(jīng)常喝茶的糖尿病患者,用不了多久,身體或出現(xiàn)4變化

白宸侃片
2025-04-29 11:29:26
中美談不成后,外媒曝中企赴美建廠,特朗普趁火打劫,性質(zhì)很嚴(yán)重

中美談不成后,外媒曝中企赴美建廠,特朗普趁火打劫,性質(zhì)很嚴(yán)重

娛樂(lè)的宅急便
2025-04-29 17:26:35
618期間,如果iPhone16Pro跌至6000元,疊加國(guó)補(bǔ),國(guó)產(chǎn)機(jī)就麻煩了

618期間,如果iPhone16Pro跌至6000元,疊加國(guó)補(bǔ),國(guó)產(chǎn)機(jī)就麻煩了

互聯(lián)網(wǎng).亂侃秀
2025-04-29 13:12:04
中央一錘定音!關(guān)于2025年全國(guó)樓市,所有房主們的命運(yùn)轉(zhuǎn)折來(lái)了?

中央一錘定音!關(guān)于2025年全國(guó)樓市,所有房主們的命運(yùn)轉(zhuǎn)折來(lái)了?

麓谷隱士
2025-04-27 17:02:50
安徽省2025年養(yǎng)老金調(diào)整將至,哪些老人增長(zhǎng)的錢數(shù)能更多一些?

安徽省2025年養(yǎng)老金調(diào)整將至,哪些老人增長(zhǎng)的錢數(shù)能更多一些?

暖心人社
2025-04-29 23:38:53
裁判報(bào)告!1次吹罰毀掉冠軍,湖人被黑,2-2變1-3!聯(lián)盟硬捧華子

裁判報(bào)告!1次吹罰毀掉冠軍,湖人被黑,2-2變1-3!聯(lián)盟硬捧華子

標(biāo)體
2025-04-29 09:19:56
加拿大總理:被美國(guó)背棄的教訓(xùn)不能忘記,特朗普正試圖擊潰我們,永遠(yuǎn)都不可能得逞

加拿大總理:被美國(guó)背棄的教訓(xùn)不能忘記,特朗普正試圖擊潰我們,永遠(yuǎn)都不可能得逞

每日經(jīng)濟(jì)新聞
2025-04-29 20:38:28
俄羅斯為什么不能暗殺澤連斯基?他若真死了,那俄羅斯才倒大霉!

俄羅斯為什么不能暗殺澤連斯基?他若真死了,那俄羅斯才倒大霉!

硬核Deeper
2025-04-27 02:33:11
丑話在前!印度對(duì)巴基斯坦動(dòng)手前,提前召見(jiàn)中國(guó)大使把話講清楚

丑話在前!印度對(duì)巴基斯坦動(dòng)手前,提前召見(jiàn)中國(guó)大使把話講清楚

獵火照狼山
2025-04-26 18:55:23
2025-04-30 04:28:49
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
10404文章數(shù) 176119關(guān)注度
往期回顧 全部

科技要聞

賽力斯港股二次上市 市值僅次于比亞迪小米

頭條要聞

美國(guó)參議院投票通過(guò)戴維·珀杜出任美國(guó)駐華大使

頭條要聞

美國(guó)參議院投票通過(guò)戴維·珀杜出任美國(guó)駐華大使

體育要聞

勇士火箭雷霆太陽(yáng),你們是怎么失去他的?

娛樂(lè)要聞

帶著兒子嫁給張譯 如今才知到底有多值

財(cái)經(jīng)要聞

沃爾瑪恢復(fù)中國(guó)供應(yīng)商出貨 客戶承擔(dān)關(guān)稅

汽車要聞

為全球造最好小車 firefly的故事才剛剛開(kāi)始

態(tài)度原創(chuàng)

游戲
家居
本地
時(shí)尚
公開(kāi)課

賽前同為4-4!WBG技高一籌,三局戰(zhàn)勝BLG,搞到5-4

家居要聞

雅奢氛圍 營(yíng)造品質(zhì)生活

本地新聞

春色滿城關(guān)不住 | 北洋門扉開(kāi):名校與花潮撞個(gè)滿懷

當(dāng)熱帶天堂邂逅全球時(shí)尚

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 阜康市| 兴安县| 平度市| 隆林| 康平县| 山丹县| 二手房| 应城市| 仙居县| 凤台县| 洱源县| 襄汾县| 岳池县| 乐山市| 玉溪市| 温宿县| 察隅县| 固原市| 太湖县| 道孚县| 建宁县| 樟树市| 昌邑市| 新竹县| 益阳市| 手游| 蕲春县| 富宁县| 板桥市| 望奎县| 凌海市| 龙江县| 泾源县| 宁远县| 曲松县| 西安市| 桦甸市| 勐海县| 芦溪县| 谷城县| 石林|