近日,一名叫梁文鋒的85后登上《新聞聯播》,以AI初創公司深度求索(DeepSeek)創始人的身份參加座談會,并現場發言。2024年12月梁文鋒和團隊開發的大模型“DeepSeek-V3”發布,這款大模型以低成本、高性能以及開源模式迅速轟動硅谷、震驚全球,被海外稱作“來自東方的神秘力量”。
eepSeek團隊創始人就是來自湛江的梁文鋒。據悉,今年春節梁文鋒會回來湛江吳川過年。
梁文鋒從小成績優異,小學六年級時,他就通過考試被吳川一中錄用。在吳川一中完成了初中、高中學業,一直是學校里的“尖子生”,并在數學學科表現出極大天賦,初中時期就學完了高中數學,甚至開始學大學的數學。
2002年,天才梁文鋒17歲,他以吳川一中“高考狀元”的成績考上浙江大學本科電子信息工程專業,于2007年考上浙江大學信息與通信工程專業研究生。據悉,在大學期間,梁文鋒就與同學一起開始積累市場行情數據和探索全自動量化交易。
2023年,梁文鋒創立深度求索品牌DeepSeek。DeepSeek,全稱“杭州深度求索人工智能基礎技術研究有限公司”。
整個DeepSeek團隊規模不大,不到 140 人,但 “人才密度” 極高,成員多是來自清華、北大、北航等頂尖高校的應屆博士畢業生、在讀生以及碩士生。值得一提的是,團隊沒有“海歸”,完全本土人才。成員們普遍具有強大的學術背景和科研能力。
1月27日,Deepseek應用登頂蘋果中國地區和美國地區應用商店免費APP下載排行榜,在美區下載榜上超越了ChatGPT。
Deepseek來自國產大模型公司深度求索,系量化巨頭幻方量化旗下大模型公司。1月20日,該公司正式發布推理大模型DeepSeek-R1。一經推出,DeepSeek-R1便憑借其“物美價廉”的特性在海外開發者社區中引發了轟動。
作為一款開源模型,R1在數學、代碼、自然語言推理等任務上的性能能夠比肩OpenAI o1模型正式版,并采用MIT許可協議,支持免費商用、任意修改和衍生開發等。
來源:湛江發布、大象新聞、澎湃新聞
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.