內容來自機器之心
編輯:Panda、蛋醬
今天凌晨,一個創業消息引爆了整個 AI 社區:一家名為 Thinking Machines Lab 的新創業公司建立了,而其背后有一個堪稱有史以來最豪華的大模型創業團隊陣容。
據該公司的首條推文介紹,Thinking Machines Lab 是一家「人工智能研究和產品公司?!?/p>
他們還強調這會是一家重視研究開放的公司,其推文中承諾:「我們致力于通過論文發表和代碼發布來開放科學,同時會重點關注應用于不同領域的人機協作。我們的方法包括共同設計研究和產品,以便從實際部署和快速迭代中學習。這項工作需要三個核心基礎:SOTA 的模型智能、高質量的基礎設施和先進的多模態能力。我們致力于構建處于能力領先的模型來兌現這一承諾?!?/p>
該公司官方網站對這三核心基礎進行了展開說明
模型智能是基石。 除了強調人機協作和定制之外,模型智能也至關重要,我們正為科學和編程等領域構建前沿能力模型。最終,最先進的模型將解鎖最具變革性的應用和優勢,例如實現新穎的科學發現和工程突破。
基礎設施質量是重中之重。 研究生產力至關重要,在很大程度上取決于基礎設施的可靠性、效率和易用性。我們的目標是長期正確地構建事物,以最大限度地提高生產力和安全性,而不是走捷徑。
先進的多模態能力。我們認為多模態對于實現更自然、更高效的通信、保存更多信息、更好地捕捉意圖以及支持與現實環境的更深入集成至關重要。
此外,尤其值得關注是該公司背后的豪華團隊陣容,其中包括多位前 OpenAI 重要成員,如擔任首席科學家的 John Schulman、著名 AI 研究科學家和博客作家翁荔。
上述推文中也寫到:「我們是一些最廣泛使用的 AI 產品和軟件背后的科學家、工程師和構建者,包括 ChatGPT、Character.ai、PyTorch 和 Mistral。我們的使命是讓 AI 為您服務,打造一個每個人都能獲得知識和工具的未來,讓 AI 能夠滿足每個人獨特的需求?!?/p>
下面我們簡要介紹下 Thinking Machines Lab 背后的這個豪華創業團隊:
Mira Murati(CEO)
Thinking Machines Lab 的 CEO 為 OpenAI 前 CTO Mira Murati,他曾在 OpenAI 領導過研究、產品與安全方面的工作。去年 9 月,Murati 離開了 OpenAI。
Mira 于 1988 年出生于阿爾巴尼亞,在 2022 年擔任 OpenAI 的首席技術官。
在學生時代,Mira 就參加過許多奧林匹克競賽和數學競賽。她本科畢業于達特茅斯學院機械工程系,曾在高盛和法國航空航天集團 Zodiac Aerospace 實習。她還在特斯拉工作了三年,擔任特斯拉跨界 SUV Model X 的高級產品經理,在此期間,特斯拉發布了 Autopilot 的早期版本。
2016 年,Mira 加入 Leap Motion,一家為 PC 制造手部和手指追蹤運動傳感器的初創公司,擔任產品和工程副總裁。Mira 在接受外媒 Fast Company 采訪時表示,她希望人類與計算機的交互體驗「像玩球一樣直觀」。
加入 OpenAI 后,Mira 在 ChatGPT、DALL-E、Codex 等的開發中發揮了重要作用。除此以外,今年 5 月份發布的 GPT-4o 以及本月發布的 OpenAI o1,都是在 Mira 的領導下完成的。
John Schulman(首席科學家)
個人主頁:http://joschu.net/
John Schulman 將擔任這家新創業公司的首席科學家。本月初,John Schulman 宣布辭去 Anthropic 的職務。距離他加入這家人工智能初創公司,僅僅過去了半年時間。
他是深度強化學習的一位先驅研究者,創造了著名的 PPO 算法。同時也是 OpenAI 的創始人之一,曾共同領導過 ChatGPT 和 OpenAI 后訓練團隊。
谷歌學術頁面顯示,John Schulman 的學術引用總數已經超過 10 萬。其中,引用量最高的研究便是他創造的 PPO 算法《Proximal policy optimization algorithms》。
他在加州大學伯克利分校獲得了計算機科學博士學位,導師為該校教授、深度強化學習大牛 Pieter Abbeel。之后從事機器人和強化學習研究與工作。在此之前,他還曾在伯克利短暫學習過神經科學,并在加州理工學院學習過物理學。
Barret Zoph(CTO)
個人主頁:https://barretzoph.github.io/
擔任這家新創業公司 CTO 的是 Barret Zoph,也曾是 OpenAI 的一位技術主管,領導過 OpenAI 的后訓練團隊,涉及的研究方向包括對齊、工具使用、評估、ChatGPT、搜索、多模態等等。同時,他還是一位專注投資 AI 公司的天使投資人。
此前,他還曾在谷歌與信息科學學院擔任過研究科學家,參與訓練了大型稀疏語言模型并將其應用于各種應用的研究工作。
他是兩篇重要論文《Learning transferable architectures for scalable image recognition》和《Neural architecture search with reinforcement learning》的第一作者。
下面按名字首字母排序介紹 Thinking Machines Lab 創始團隊其他成員。
Alex Gartrell
個人主頁:https://www.alexgartrell.com/
Alex Gartrell 曾任 Meta 服務器操作系統負責人,Linux 內核、網絡和容器化專家。
Alexander Kirillov
個人主頁:https://alexander-kirillov.github.io/
Alexander Kirillov 將在 Thinking Machines Lab 從事多模態 AI 的研究和開發。他曾參與開發了 OpenAI 高級語音模式和 Meta AI 的 Segment Anything Model(SAM),并曾任 OpenAI 多模態后訓練負責人。
他在德國海德堡大學獲得博士學位,指導老師是 Carsten Rother。
Andrew Tulloch
個人主頁:https://tullo.ch/
Andrew Tulloch 同樣也曾在 OpenAI 與 Meta 工作過,他的主攻方向是機器學習系統的相關研究與工程開發。
Tulloch 還是一位開源社區的重要參與者,為著名開源項目 PyTorch 和 Caffe 做出過重要貢獻。
Brydon Eastman
曾在 OpenAI 從事訓練后研究,專攻人類和合成數據、模型對齊和 RL。
Christian Gibson
曾任 OpenAI 基礎設施工程師,專注于訓練前沿模型的超級計算機。
Devendra Chaplot
Mistral AI 創始團隊成員兼多模態研究主管,Mixtral 和 Pixtral 的共同創始人。VLM、RL 和機器人技術專家。
Ian O'Connell
基礎設施工程,曾就職于 OpenAI、Netflix、Stripe。
Jacob Menick
ML 研究員,曾領導 OpenAI 的 GPT-4o-mini,之前曾為 ChatGPT 和 DeepMind 的深度生成模型創建做出過貢獻。
Jonathan Lachman
運營主管、前 OpenAI 特別項目負責人和白宮國家安全預算主管。
Joshua Gross
在 OpenAI 參與構建產品和研究基礎設施,塑造 ChatGPT 的學習系統和 GPU 集群;此前在 Meta 負責產品基礎設施。
Kurt Shuster
曾參與 Google DeepMind 的推理、Character.AI 的全棧預訓練和推理以及 Meta AI 的基礎對話研究。
Kyle Luther
機器學習研究員,此前他在 OpenAI 任職。
(翁荔)Lilian Weng
曾任 OpenAI 研究(安全)副總裁。
Lilian Weng 是 OpenAI 華人科學家,她 2018 年加入 OpenAI,參與了 GPT-4 項目的預訓練、強化學習 & 對齊、模型安全等方面的工作。她本科畢業于北大,曾前往香港大學進行短期交流,博士畢業于印第安納大學伯明頓分校。
根據領英資料顯示,Lilian Weng 在 OpenAI 已經工作了近 7 年時間,擔任安全研究副總裁一職。2021 年 - 2023 年工作期間,Lilian Weng 建立并領導了應用人工智能研究團隊,包括產品研究、合作伙伴研究和應用安全,從而使得 OpenAI 的 API 更強大、更實用、更安全。之前,她還是 OpenAI 機器人團隊的技術主管,專注于訓練關于機器人任務的算法,如教機械手如何解決魔方、旋轉方塊等。
在加入 OpenAI 之前,她還在 Facebook、Dropbox 從事軟件工程和數據科學方面的工作。Google Scholar 顯示,Lilian Weng 論文引用量超過 13000 多次。閑暇時間,Lilian Weng 還寫了一些關于 AI 的博客文章,她的博客深入、細致,具有前瞻性,被很多 AI 研究者視為重要的參考資料
Luke Metz
Luke Metz 是 OpenAI 創始團隊成員,曾與 John Schulman、Barret Zoph、Liam Fedus 等人在內部共同開發了「low-key research preview」,這是 ChatGPT 的雛形。他也是 o1 推理模型背后的貢獻者之一。
Mario Saltarelli
OpenAI 前 IT 和安全主管。
Myle Ott
人工智能研究員,Character.AI 創始團隊成員,Meta 早期 LLM 負責人,FSDP 和 fairseq 的創建者。
Nikki Sommer
曾任 OpenAI 人力資源業務副總裁及 Twitter 人力資源業務總監。
Noah Shpak
ML 工程師。
Pia Santos
執行運營主管,曾在 OpenAI 任職。
Randall Lin
曾在 OpenAI 負責 ChatGPT,并在 X 擔任「Twitter 算法」的聯合技術負責人。
Rowan Zellers
曾在 OpenAI 工作,從事實時多模態后訓練工作。
Sam Schoenholz
曾領導 OpenAI 的可信賴擴展團隊和 GPT-4o 優化。之前曾在 Google Brain 從事統計物理學與機器學習的交叉研究。
Sam Shleifer
專注于推理的研究工程師,曾就職于 Character.AI、Google DeepMind、FAIR、HuggingFace。
Stephen Chen
Stephen Chen 是在 Meta 工作近十五年的老員工,此前領導人工智能推理相關研究,負責 Meta 的生成式人工智能產品和推薦系統。
Stephen Roller
之前曾在 DeepMind、CharacterAI 和 MetaAI 進行全棧預訓練相關工作。在 Google DeepMind 時,他的研究和工作主要集中在對最大規模語言模型進行預訓練。在 Character.AI 期間,他負責領導預訓練和訓練基礎設施工作。他還曾擔任 Meta 基礎人工智能研究 (FAIR) 的研究工程師,負責領導大型語言模型和對話團隊(FAIR 的大部分工作都是開源的)。
Yinghai Lu
Yinghai Lu 曾領導 OpenAI 和 Meta 的各種推理工作,本次離職前是 OpenAI 研究推理團隊的技術負責人。在 2023 年底加入 OpenAI 之前,他是 Facebook AI Infra 的軟件工程師,負責建立推薦推理系統和生成式 AI 模型,參與了 Llama 2 等項目。
他在 2010 年獲得復旦大學電子工程博士學位。畢業后在美國西北大學電子工程系從事博士后研究工作,之后加入灣區的工業界。加入 Thinking Machines Lab 后,他擔任 ML 系統工程師。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.