這幾天,中國AI 新創公司深度求索(DeepSeek)先后發布了DeepSeek-V3 和DeepSeek-R1 兩款大模型,成本價格低廉,性能與OpenAI 相當,讓硅谷震驚,甚至引發了Meta內部的恐慌,工程師們開始連夜嘗試復制DeepSeek的成果。
DeepSeek,甚至沖上美國APP Store免費APP下載榜第一名,被稱為東方神秘力量,而DeepSeek創始人梁文鋒的超狂背景也曝光。據悉,該團隊成員都來自頂尖學校,核心成員是應屆生,才女羅福莉也參與開發。
關于梁文鋒,總結來說有幾點:
1、梁文鋒是典型的“小鎮做題家”:1985年出生于廣東湛江的五(三)線城市,父母均是小學教師。他自小在學習上展現出很高天賦,尤其是在數學領域。
初中就完成高中數學課程,開始學大學數學,17時以吳川市第一中學「高考狀元」身份,進入浙江大學信息與電子工程學系,獲得本碩學位,于2010年畢業。
2.在校期間,梁文鋒對金融市場產生了濃厚的興趣,2008年全球金融危機之際,他帶領團隊探索機器學習技術在全自動量化交易中的應用潛力。
梁文鋒決定量化投資,但這個決定并不容易,畢竟當時量化還是個新事物,很多人不相信量化可以賺錢。
梁文鋒苦熬了2年,2010年,滬深300股指期貨推出,量化投資迎來了春天,梁文鋒和他的團隊大賺一筆,自營資金超過5億元。
他才剛從學校畢業就賺到了一大桶金,這實際上為他后來的創業鋪平了道路。
3.2023年,梁文鋒正式成立DeepSeek,一家專注于人工智慧大模型技術研發的創新公司。
成立1年后,DeepSeek就拿出讓業界關注的產品,去年5月,公司發布DeepSeek-V2,以其創新的模型架構和史無前例的性價比(CP值)引發關注。
Deepseek人才招募原則是「只招1%的天才,去做99%中國公司做不到的事情。」
團隊不大,約只有 140 人,當中人才都來自清華、北大、北航等頂尖大學的應屆博士畢業生及在校學生,據說并沒有「海歸」的海外留學生,只重用國內本土人才。
DeepSeek-R1的成功,也讓天才工程師羅福莉一舉成名。
羅福莉是名95后(1995年后生),碩士畢業于北京大學計算語言學專業。2019年還在北大讀碩士期間,便于人工智能領域頂級國際會議ACL上發表8篇論文,被稱為「AI天才少女」。
2022年,羅福莉跳槽到DeepSeek擔任深度學習研究員,參與研發MoE大模型DeepSeek -V2。
Deepseek的崛起,剛上任的美國總統川普表示,「我正面看待這件事情。」因為美國企業也做得到,未來不必再花這么多錢來達到相同的結果。
但是川普也認為,DeepSeek應該被美國AI產業視為一記當頭棒喝。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.