中國AI公司的創造力
正技驚四座
最近幾天
一家名為深度求索(DeepSeek)的
中國公司在歐美AI圈
引起了不小的震動
甚至被認為是大模型行業的
最大“黑馬”
DeepSeek
被不少外國人
稱為“神秘的東方力量”
1月27日,DeepSeek應用登頂蘋果美國地區應用商店免費App下載排行榜,在美區下載榜上超越了ChatGPT。同日,蘋果中國區應用商店免費榜顯示,DeepSeek成為中國區第一。
蘋果美國區應用商店
蘋果APP Store中國區免費榜
而把開源模型做到全球第一
和公司團隊開發
大模型“DeepSeek-V3”的
科技創業者
是來自廣東湛江的梁文鋒
近日
這名85后還現身《新聞聯播》
以AI初創公司深度求索(DeepSeek)
創始人的身份參加了一場
國家超高規格座談會,并現場發言
他發言的照片
流傳于各類社交平臺
梁文鋒
土生土長的湛江人
初中就學完了高中數學
梁文鋒從小成績優異
小學六年級時
他就通過考試被吳川一中錄用
在吳川一中完成了初中、高中學業
一直是學校里的“尖子生”
并在數學學科表現出極大天賦
“他初中就學完高中的數學,甚至已經開始學大學的數學,數學思維能力很強。”梁文鋒的初中班主任容先生表示,初中時期的梁文鋒性格很文靜,但不是書呆子,他在學習上很有自己的“一套方法”,很注重勞逸結合,仿佛不需要花很多時間來學習就可以學好每一個學科。
最后一排右邊第6個是梁文鋒。
2002年,梁文鋒17歲,他以吳川一中高考第一名的成績考上浙江大學本科電子信息工程專業,于2007年考上浙江大學信息與通信工程專業研究生。據悉,在大學期間,梁文鋒就與同學一起開始積累市場行情數據和探索全自動量化交易。
2023年,梁文鋒創立深度求索品牌DeepSeek。
DeepSeek是什么?
為何技驚四座?
DeepSeek,全稱杭州深度求索人工智能基礎技術研究有限公司,成立于2023年7月17日,是一家創新型科技公司,專注于開發先進的大語言模型(LLM)和相關技術。
幾天前,總部位于中國杭州的DeepSeek發布推理模型R1,在性能逼近OpenAI o1正式版的同時,推理成本卻僅為后者的幾十分之一。
紐約時報稱,DeepSeek大模型以極低成本(600萬美元)和少量芯片(2000塊)實現了與OpenAI等巨頭相媲美的性能,挑戰了“唯有科技巨頭才能研發尖端AI”的行業共識。
低成本實現高性能模型研發,對用戶來說的體驗感也立竿見影——它功能強大,但卻免費使用,并且DeepSeek還將代碼面向開發者進行了開源。
據了解,DeepSeek R1沒有使用業內普遍使用的監督微調(SFT)訓練范式,而是直接通過強化學習讓模型自主進化出復雜的推理能力,包括反思和長鏈思考等能力。這種方法不僅提高了訓練效率,還減少了對昂貴計算資源的依賴。與OpenAI的o1相比,DeepSeek模型的百萬token輸入成本從15美元銳減到0.55美元,輸出成本則從60美元降低到2美元。
有人提出,DeepSeek恰恰是美國對華進行芯片出口限制之下所激發出的創新。
對此,網友們也紛紛評論點贊
據悉,今年春節
梁文鋒會回來湛江吳川過年
點贊轉發,
祝愿梁文鋒創造出更多的奇跡!
來源:廣州日報綜合自湛江發布、北京日報
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.