(關(guān)注公眾號設(shè)為標(biāo),獲取AI深度洞察)
全文 10,000字 | 閱讀約45分鐘
【核心內(nèi)容預(yù)覽】
GPT-5即將發(fā)布:OpenAI正整合GPT和o系列模型,推出更強大的GPT-5;
研發(fā)融合創(chuàng)新:研究與產(chǎn)品開發(fā)緊密結(jié)合,不再是單純的研究公司;
Deep Research驚艷:被稱為"自ChatGPT以來最佳產(chǎn)品",展現(xiàn)AGI潛力;
AI編程提速:預(yù)測2026年實現(xiàn)編程99%自動化,比競爭對手預(yù)期更早;
教育變革:愿景是AI為每個孩子提供個性化導(dǎo)師,技術(shù)已準(zhǔn)備就緒;
機器人布局:已開始關(guān)注機器人技術(shù),計劃從數(shù)字世界拓展到現(xiàn)實應(yīng)用;
在全球AI競爭日益白熱化的背景下,OpenAI首席產(chǎn)品官(CPO) Kevin Weil近日接受了一場引人注目的訪談。面對來自中國AI巨頭DeepSeek等公司的強大壓力,OpenAI已經(jīng)明確表示GPT-5即將發(fā)布,這被視為公司保持技術(shù)領(lǐng)先地位的關(guān)鍵舉措。
Kevin Weil在訪談中不僅確認(rèn)了這一消息,還透露了GPT-5將整合目前分叉的GPT系列和o系列模型,將推理能力與大規(guī)模預(yù)訓(xùn)練模型的優(yōu)勢結(jié)合起來。"我們正在努力簡化模型系列,盡管我們在命名方面真的很糟糕,"Weil半開玩笑地說道,同時承諾GPT-5將為用戶帶來更一致、更強大的體驗。
在快1個小時的深度對話中,這位曾在Twitter、Instagram和Meta工作過的產(chǎn)品專家分享了他對AI發(fā)展速度的驚嘆,以及OpenAI如何通過研究與產(chǎn)品開發(fā)的緊密融合來保持領(lǐng)先地位。尤其令人關(guān)注的是他對AI編程自動化的大膽預(yù)測——2026年將實現(xiàn)99%的編程自動化,這比競爭對手Anthropic預(yù)測的2027年更早。
文稿整理
主持人:這一集中,我們有幸邀請到 OpenAI 的首席產(chǎn)品官 Kevin Weil 加入我們。Kevin,對于那些可能還不認(rèn)識你的人,你能簡單介紹一下你在 OpenAI 的工作,以及是什么讓你如此與眾不同?
Kevin Weil:是什么讓我與眾不同?嗯,我很幸運能擔(dān)任 OpenAI 的首席產(chǎn)品官,這可能是我職業(yè)生涯中最有趣的工作。我的職業(yè)道路很幸運,經(jīng)歷了許多不同階段。早期我在 Twitter 擔(dān)任工程師,那時公司只有 40 人,后來發(fā)展到約 4000 人。我在那里主要負(fù)責(zé)產(chǎn)品工作。之后我在 Instagram 也擔(dān)任過產(chǎn)品負(fù)責(zé)人,還參與創(chuàng)建了 Meta 公司的 Libra 加密貨幣項目。我還在 Planet 公司花了幾年時間建造衛(wèi)星,那也是一次非常寶貴的經(jīng)歷。但在 OpenAI 之外的其他地方,你對計算機能做什么通常有一個基本認(rèn)識。構(gòu)建產(chǎn)品時,你會考慮為誰構(gòu)建,解決什么問題,但技術(shù)本身變化不大。數(shù)據(jù)庫會有所改進(jìn),但速度不快。今年的數(shù)據(jù)庫可能比去年的快 5%,但功能基本上是一樣的。OpenAI 的與眾不同之處在于,每兩個月我們就會讓計算機做一些全世界歷史上從未實現(xiàn)過的事情。你對技術(shù)能力的認(rèn)知會不斷刷新,這意味著你幾乎每兩三個月就要重新思考你的產(chǎn)品。這很有挑戰(zhàn)性,但也非常有趣。
一、OpenAI 創(chuàng)造前所未有的產(chǎn)品
主持人:Kevin,你能告訴我們你在 OpenAI 的工作經(jīng)歷嗎?OpenAI 既是一家研究公司,又是一家產(chǎn)品公司,你在產(chǎn)品方面的工作是怎樣的?很多人都在談?wù)撃P蜁粩喔倪M(jìn),研究方面有很棒的工作在進(jìn)行,不僅在 OpenAI,也在其他公司。但 OpenAI 作為產(chǎn)品公司,尤其是 ChatGPT,已經(jīng)抓住了全世界的想象力。現(xiàn)在 ChatGPT 已經(jīng)成為一個動詞,我經(jīng)常用它來指代使用 AI 工具的行為。那么,你的日常工作是怎樣處理這種雙重角色的呢?
Kevin Weil:這是個很好的問題。回顧一下,OpenAI 大約 10 年前成立,最初是一家研究公司。一群當(dāng)時被認(rèn)為很瘋狂的人創(chuàng)立了它,他們說:"我們可以構(gòu)建 AGI(人工通用智能)。"當(dāng)時幾乎沒人相信他們,他們有點像邊緣人物。但事實證明他們是對的,他們找到了一些方法,開始構(gòu)建了一些令人驚艷的演示,比如能解魔方的機器人手。然后他們發(fā)現(xiàn)了擴展定律(scaling laws),表明投入更多的計算和數(shù)據(jù),模型會變得非常出色。正如你所說,OpenAI 很快成為一家世界級的研究公司。但現(xiàn)在,有了 ChatGPT、企業(yè)產(chǎn)品、API 產(chǎn)品以及我們正在考慮的其他產(chǎn)品,我們不能僅僅是一家世界級的研究公司,我們還必須是一家世界級的產(chǎn)品公司。實際上,我越來越覺得我們不能把這兩者分開,必須緊密合作。因為就像我之前說的,每兩個月,計算機能做的事情就會改變,你對技術(shù)的認(rèn)知也會隨之更新。如果我們像兩個獨立的公司運作,最多只能互相傳遞一些改進(jìn),但這不是構(gòu)建最佳產(chǎn)品的方式。最佳產(chǎn)品需要研究、產(chǎn)品、工程和設(shè)計團隊緊密協(xié)作,進(jìn)行深度研究。當(dāng)你把用戶需求、要解決的問題與模型能力的早期突破結(jié)合在一起時,魔法就發(fā)生了。如果只是互相拋東西,你可能會做出很酷的東西,但不會是最好的產(chǎn)品。市場競爭太激烈了,有很多優(yōu)秀的公司在構(gòu)建優(yōu)秀的模型,我們要贏的唯一方式是真正作為一個整體運作,這就是我們正在努力的方向。
主持人:所以,你的日常工作主要是思考研究的走向,然后確定產(chǎn)品需要加速到哪里,以滿足未來的需求,以及規(guī)劃整個公司在半年或一年后的發(fā)展方向。
Kevin Weil:沒錯。與AI模型合作的一個有趣之處在于,現(xiàn)在的模型已經(jīng)非常出色,它們不再受智能本身的限制,而是受教學(xué)限制。你可以教它們做任何事,但你需要有數(shù)據(jù)、強化學(xué)習(xí)和適當(dāng)?shù)沫h(huán)境來幫助它們做得更好。 實際上,越來越多的產(chǎn)品工作涉及到評估和教導(dǎo)模型做什么。這里面有很多細(xì)微差別。比如,如果你用大量的競技編程比賽數(shù)據(jù)來訓(xùn)練模型,它會在競技編程方面變得非常出色,但競技編程和實際的前端應(yīng)用開發(fā)并不完全一樣。你需要非常清楚地了解你要解決的問題,確保你在教模型正確的東西。這是產(chǎn)品反向影響研究的部分。然后,就像你說的,有很多應(yīng)用場景是由研究推動產(chǎn)品的,有了新能力后,我們會思考如何用它構(gòu)建出優(yōu)秀的產(chǎn)品。這就是為什么我們需要兩個團隊緊密合作,這樣才能發(fā)揮雙方的優(yōu)勢,創(chuàng)造出令人驚嘆的成果。
主持人:我明白了,你們在研究和產(chǎn)品之間花了太多時間,以至于沒時間給產(chǎn)品起個好名字。
Kevin Weil:哈哈,是的,我們在命名方面確實很糟糕,但我們知道這一點,也接受這一點。我們偶爾會在Reddit上做"問我任何事"(AMA)活動,有一次我和Sam一起參加,有人問我們能不能改進(jìn)產(chǎn)品命名,我們在房間里討論了半天,最后我只回了兩個字:"不"。我們正在努力實現(xiàn)人工通用智能(AGI),而人們最大的反饋是名字有點混亂,建議我們把所有東西都命名為AGI1、AGI2、AGI3,這樣會更簡單。不過,我很興奮,Sam最近提到我們要把模型系列重新整合在一起。歷史上,我們有GPT模型系列,從GPT-3、3.5、4到現(xiàn)在的4.5,這些模型是通過越來越大規(guī)模的預(yù)訓(xùn)練來提升性能的。去年我們在推理方面取得了突破,o1模型系列(包括o1 preview、o1,以及即將推出的o3)能做一些不可思議的事情,它們的基準(zhǔn)測試成績非常高,按照縮放定律,你需要訓(xùn)練一個大10萬倍的模型才能達(dá)到那種性能水平。這些模型在推理方面很出色,但當(dāng)時它們沒有GPT模型的所有功能,比如不能搜索網(wǎng)絡(luò)、處理文件上傳等,它們只是很擅長推理。所以我們給它們起了新名字,形成了不同的系列,因為它們的功能集不同。有時候你確實想用這個,有時候想用那個,我認(rèn)為這是正確的決定,盡管有點混亂,但這幫助我們更快地將這些技術(shù)推向世界。
現(xiàn)在,人們用這些模型做了很多了不起的事情,無論是編程、前沿科學(xué)還是其他領(lǐng)域。我們在大多數(shù)情況下都優(yōu)先考慮速度,力求盡快把新工具交到人們手中,讓他們能更快地做更多酷的事情。但我們確實分開了模型系列,現(xiàn)在,隨著我們對這些推理模型越來越熟悉,我們正在教它們使用GPT系列的所有工具,比如處理文件上傳、搜索網(wǎng)絡(luò),甚至在推理過程中使用Python編程,這很酷,它們可以寫代碼來幫助自己更好地理解問題。所以,o系列和GPT系列開始擁有相同的能力,這給了我們一個機會把它們重新整合在一起,這就是我們計劃用GPT-5做的事情。我們正在努力簡化模型系列,盡管我們在命名方面真的很糟糕。
主持人:你有GPT-5的發(fā)布時間表嗎?我知道這個問題很難回答,但我還是得問。
Kevin Weil:嗯,很快,我們正在談?wù)撍詴r間上有些不確定性,因為我們確實想在整合時簡化模型,這意味著用戶習(xí)慣的所有工具和功能都需要運行得非常好。我們正在教推理模型很多新技能,這是研究性質(zhì)的工作,所以有些事情存在不確定性。我不會給你具體時間,但會很快,我們很認(rèn)真地對待這件事,團隊正在為此努力工作。
二、AI領(lǐng)域的競爭與創(chuàng)新
主持人:Kevin,我不是工程師,我是你們產(chǎn)品的用戶,我很喜歡它們。隨著時間推移,我們看到競爭對手崛起,有人說AI模型可能會被商品化,所以實際的產(chǎn)品和應(yīng)用場景變得更加重要。你們肯定也注意到了,如果OpenAI領(lǐng)先,其他公司也會推出類似產(chǎn)品。作為產(chǎn)品負(fù)責(zé)人,你們在制作產(chǎn)品時會關(guān)注競爭對手的動向嗎?你們?nèi)绾嗡伎既绾卫^續(xù)保持這種先發(fā)優(yōu)勢和領(lǐng)先地位?
Kevin Weil:這是個好問題。我稍微不同意你問題的框架。我其實不認(rèn)為模型正在被商品化,它們發(fā)展得很快,進(jìn)步速度驚人。事實上,模型智能的增長速度是不可思議的。Sam幾周前提到,如果你把智能水平保持不變,智能的成本每年下降10倍。想想摩爾定律,過去60年它定義了我們的科技時代,每18個月芯片上的晶體管數(shù)量翻倍,性能提高一倍。而在AI領(lǐng)域,智能成本每年下降10倍,這條曲線陡峭得多。當(dāng)然,智能水平并不是保持不變,而是在大幅提升的同時,成本還在下降。這是一系列令人難以置信的發(fā)展趨勢。我不認(rèn)為這些模型被商品化了,它們都在快速進(jìn)步。因為我們處于如此陡峭的發(fā)展軌道上,其他人確實能夠很快趕上領(lǐng)先者,但這并不意味著領(lǐng)先不重要。我認(rèn)為即使是3到6個月的領(lǐng)先也非常關(guān)鍵,因為這意味著你首先獲得新能力,可以首先推出利用這些能力的新產(chǎn)品。由于這些能力是全新的,這些產(chǎn)品以前從未存在過,比如Deep Research。你是第一個這樣做的,其他人都在追隨,我認(rèn)為這是一個很有價值的位置。我們會盡最大努力保持領(lǐng)先優(yōu)勢。其他實驗室在某些方面領(lǐng)先,這很好,但我們非常有競爭力,我們會關(guān)注其他人的工作。我們希望引領(lǐng)潮流,我們的使命是確保人工通用智能(AGI)造福全人類,我們通過把AI交到每個人手中來實現(xiàn)這一點,無論是通過ChatGPT等自家產(chǎn)品,還是通過API讓300萬開發(fā)者在各種工具、公司和產(chǎn)品中嵌入AI。我們會盡一切可能把AI帶給盡可能多的人。
主持人:我有個問題,這更像是我的個人觀察。坦白說,我差點要取消ChatGPT的訂閱,轉(zhuǎn)而用Claude一段時間。是的,就在不久前。但后來Deep Research發(fā)布了,我當(dāng)時是普通Plus計劃的用戶,聽說Deep Research是Pro計劃的一部分。我想,可能不會那么好,但我在Twitter上看到很多關(guān)于它的推文。有人說"這是現(xiàn)象級的",我看到越來越多的好評,于是我想,算了,我去升級到Pro計劃吧。老實說,我很久沒有像使用Deep Research那樣有"哇"的驚嘆時刻了。Deep Research太棒了,你知道Perplexity有深度研究功能,Grok也有,但沒有什么能比得上你們的Deep Research。我想知道,這其中有多少是底層模型的功勞,有多少是你們在產(chǎn)品上的工作?因為Deep Research真的很棒,我每天都用它。即使是最簡單的查詢,我也會用它,因為它會查遍Reddit和一大堆博客帖子,收集所有信息,而且?guī)缀醪怀霈F(xiàn)幻覺。在我看來,它感覺像是真正的人工通用智能,因為以前的AI給我的感覺是輸出內(nèi)容很通用,但Deep Research充滿了洞察力。比如,如果你問它制作一個頂級游戲平均需要多少人,早期版本的AI會很含糊,但現(xiàn)在它會給出具體例子,說這個游戲用了這么多人,那個游戲用了那么多人,非常有用。這可能是我對Deep Research最長的贊美了。
Kevin Weil:哈哈,你可以繼續(xù)夸Deep Research,你做得很好。我認(rèn)為Deep Research是自ChatGPT以來我們推出的最佳產(chǎn)品。它太神奇了,內(nèi)部我們稱之為"感受AGI"的時刻,會讓你起雞皮疙瘩。從理性角度,你看到AI和模型智能的趨勢在不斷增長,但有時候很難真正理解當(dāng)人工通用智能無處不在時會是什么感覺。但偶爾你會得到一絲暗示,Deep Research就是其中之一。它讓我能做一些我自己無法做到的事情,比如我是個物理愛好者,我想了解μ子對撞機,我讓它為我做了一個大報告,20分鐘后它給了我一個15頁的μ子對撞機報告,這是我自己做不到的。還有為我兒子做一些醫(yī)學(xué)研究,我沒能力做那種專業(yè)研究,它為我做了,給了我很多安心。它不只是節(jié)省一點時間,而是從根本上為我做了我自己無法完成的事情,這讓我大開眼界。回到你的問題,我認(rèn)為功勞要歸于研究團隊,他們做得難以置信。但這也是一個例子,研究團隊、產(chǎn)品團隊、工程團隊和設(shè)計團隊從一開始就緊密合作,確保我們?yōu)橛脩艚鉀Q的問題與我們訓(xùn)練模型的方式相匹配。當(dāng)我們訓(xùn)練模型提升某些技能時,這些技能直接與我們試圖創(chuàng)建的產(chǎn)品相關(guān)。這真的是將這些團隊結(jié)合在一起產(chǎn)生的魔力。我認(rèn)為,如果我們是分開運作的研究團隊和產(chǎn)品團隊,我們無法創(chuàng)造出這樣的產(chǎn)品。
主持人:關(guān)于Deep Research,我想再問一個問題。最近我試用了GPT-4.5,它有種很明顯的大模型感覺,我不知道怎么準(zhǔn)確解釋,但當(dāng)我使用較小的模型,比如GPT-3 Mini,我能感覺到它太字面化了,就是一種直覺上的感受。而GPT-4.5寫得非常好,它能捕捉到我話語中的細(xì)微差別和各種特殊情況。據(jù)我所知,GPT-4.5沒有推理能力,這只是一個更大的預(yù)訓(xùn)練模型。你認(rèn)為,將這種新的預(yù)訓(xùn)練水平與推理能力結(jié)合起來,我們會看到前所未有的新東西嗎?你期待能力的大幅提升嗎,還是如果模型已經(jīng)足夠大,推理就不那么重要了?
Kevin Weil:不,我認(rèn)為推理絕對重要,你可以在測試基準(zhǔn)中看到這一點。如果你看一些更學(xué)術(shù)、更科學(xué)的測試基準(zhǔn),比如GP QA、Frontier Math或ARC-GI,GPT-4.5無法與o1相提并論,更不用說即將推出的o3了。但正如你所說,還有一些更軟性的評估,更模糊、更人性化的東西,GPT-4.5在這些方面非常出色,這很難量化,但在人類反饋和A/B測試中,你可以看到人們對GPT-4.5的偏好遠(yuǎn)超其他模型。我認(rèn)為這表明,今天我們知道有兩種方法可以提升模型的智能:你可以做越來越大的預(yù)訓(xùn)練,或者在上面做越來越多的強化學(xué)習(xí)(RL)來教它推理。最終的答案不是二選一,而是兩者都要繼續(xù)發(fā)展。更大的預(yù)訓(xùn)練模型能獲得軟技能,更好的世界知識,更有趣的對話,它們感覺更人性化或更真實。
你問我為什么,我認(rèn)為在更大的模型中,你可以包含更多的細(xì)微差別。人類世界充滿了維度、細(xì)微差別和多樣性,當(dāng)你將一個大模型提煉成較小的模型時,比如將GPT-4提煉成GPT-4 Mini,取決于你如何提煉,你可以保留你在意的特定方面的技能。如果你想構(gòu)建一個非常好的小型編程模型,你完全可以做到,你可以提煉GPT-4或o1,得到一個非常好的編程模型,性能測試可能不完全相同,但非常接近,而且模型更小。但如果你試圖與它聊天,它就不是一個很有趣的對話伙伴,它在某種程度上失去了個性。如果它是一個專門用于編程的模型,你可能不在乎這點,因為那不是你使用它的目的。小模型在很多方面都很出色,但當(dāng)維度減少時,你會失去細(xì)微差別和多樣性,而這些恰恰是使得與大模型交談非常愉快的因素。我認(rèn)為反過來也是如此,當(dāng)擴大模型規(guī)模時,增加的維度有更多空間來包含更多細(xì)微差別。這聽起來有點感性,但我覺得背后有科學(xué)支持,這在我們看到的一切中都是真實的。GPT-4.5在處理需要人性化理解的問題方面是迄今為止最好的,你必須親自嘗試才能體會,然后你會說:"哦,我完全明白了。"
三、AI如何改變編程與創(chuàng)意工作
主持人:是的,它是一個更好的寫手,GPT-4.5的寫作感覺很人性化。幾乎就像兩三年前,我會認(rèn)為推理能力是寫得更好的關(guān)鍵,邏輯上你認(rèn)為這個發(fā)生了,然后那個發(fā)生了,這應(yīng)該幫助你寫得更好。但實際上,這種細(xì)微差別才是導(dǎo)致寫作技能提高的原因,這出乎我的意料。所以我在腦海中做了一個修正。 但我有個問題,我想問關(guān)于特定技能的問題。我們先談編程。三年前,如果你說編程將被自動化,沒人會相信你,他們會說GPT-2連基本的編程都做不好。到了GPT-3,它能輸出一些簡單代碼,比如做一個按鈕。兩年前,當(dāng)GPT-4出現(xiàn)時,它開始每天被使用,現(xiàn)在它已經(jīng)非常出色,特別是在競爭性編程方面,而且在構(gòu)建前端或后端基礎(chǔ)設(shè)施方面也越來越好。我?guī)字芮昂虯nthropic的人交談,我問他們Anthropic是否有編程99%自動化的時間表,我指的是前端和后端的實際功能代碼,他們說2027年。你有時間表嗎?你對編程的未來有什么看法?因為你每天都在寫代碼,與研究團隊合作,構(gòu)建產(chǎn)品,你對此有什么預(yù)測或觀點嗎?
Kevin Weil:按照我們現(xiàn)在的發(fā)展速度,我會感到驚訝如果要等到2027年,我認(rèn)為會更早。Anthropic說2027年,我們會說2026年。我看一下,當(dāng)我們推出GPT-4時,它是一個非常好的編程模型,GitHub Copilot等工具被廣泛使用,但與o1 preview相比,o1在編程方面要好得多,因為推理能力在編寫代碼時很重要。無論是解決難題、填字游戲、數(shù)獨還是編寫代碼,你都需要一定程度的推理能力,能夠?qū)栴}分解成更小的部分,形成假設(shè),驗證或反駁這些假設(shè),這就是推理的作用。o1 preview大約相當(dāng)于世界上排名第100萬的競爭性程序員,這聽起來不太好,但世界上有3000萬到4000萬程序員,所以它在前2-3%。o1正式發(fā)布時,大約相當(dāng)于世界上排名第1000名的工程師。即將推出的o3,根據(jù)相同的測試標(biāo)準(zhǔn),相當(dāng)于世界上排名第175名的競爭性編程者。隨著我們開始訓(xùn)練后續(xù)模型,它們的表現(xiàn)更好。
所以我認(rèn)為,今年AI在競爭性編程標(biāo)準(zhǔn)上將永遠(yuǎn)超越人類,就像70年前計算機在乘法上超越人類,15年前AI在國際象棋上超越人類一樣。今年,AI將在編程上永遠(yuǎn)超越人類,而且沒有回頭路。我們對此投入了很多關(guān)注,Anthropic、Google也在投入大量精力,所以這將發(fā)展得非常快。我認(rèn)為世界會因此變得不同,而且我認(rèn)為會變得更好。想象一下,如果你不需要成為工程師就能創(chuàng)建軟件,軟件可以讓你創(chuàng)造任何你想要的東西,這將對世界產(chǎn)生民主化的影響。新冠疫情期間,我和一些人交流,他們試圖為當(dāng)?shù)爻鞘袆?chuàng)建一個網(wǎng)站來跟蹤疫情數(shù)據(jù),但沒有工程師可用,他們自己也沒有這方面的技能,結(jié)果他們無法做到。而今天,這對任何頂級AI模型來說都不是問題,更不用說未來這些模型能夠生成任意數(shù)量的優(yōu)秀軟件時。我對這個未來感到興奮,它很快就會到來。
主持人:Kevin,作為一個內(nèi)容創(chuàng)作者,關(guān)于AI生成內(nèi)容將如何大量涌現(xiàn)的討論正在進(jìn)行。Varun的Instagram基本上是假的,95%的視頻都不是他,而是有人點擊幾個按鈕讓它看起來像是他。真實性正在迅速減弱,你們在OpenAI是否關(guān)注這個問題?你們是否積極思考當(dāng)一切都可以自動生成時,互聯(lián)網(wǎng)會發(fā)生什么?
Kevin Weil:我給你我的個人觀點。我認(rèn)為對于大多數(shù)人類創(chuàng)作,人們重視一種"工作證明"。如果創(chuàng)建大量基于AI的內(nèi)容變得非常容易,就像現(xiàn)在制作圖像一樣,人們會更加重視那些花了很多時間和精力創(chuàng)作的東西,而不是那些可以在五秒內(nèi)制作的東西。拿Sora來說,你現(xiàn)在不能對Sora說"給我做一部電影",它做不到。但如果你給它非常深思熟慮、詳細(xì)的提示,你可以讓它創(chuàng)造出驚人的東西。我們內(nèi)部有一個創(chuàng)作者,他以前在行業(yè)內(nèi)工作過,他用Sora做的事情讓我難以置信,遠(yuǎn)遠(yuǎn)超出了我的想象能力。我和一位導(dǎo)演交談過,他正在考慮使用Sora。他說,以前他做科幻片,比如有一個場景是太空中的飛機飛向一個行星,然后需要切換到飛船在行星表面飛行的場景。有很多種方式可以做這個切換。今天,他會去特效工作室,花10萬美元,讓他們用一個月時間做兩種版本的切換場景,然后他從中選擇一個,因為他只有這兩個選擇。
而用Sora,他可以在一個下午制作40個不同的版本,探索各種不同的表現(xiàn)方式,讓他的創(chuàng)造力自由發(fā)揮,與AI合作做更多的嘗試。最后,他可能還是會去同一家特效工作室制作他最喜歡的那一個,但他是帶著50個想法中最好的一個去的,得到的結(jié)果比以前好得多,因為他與AI合作進(jìn)行了更充分的創(chuàng)意探索。我認(rèn)為,在這個世界上,創(chuàng)作偉大的作品仍然需要大量的工作和專業(yè)知識。創(chuàng)作偉大作品所需的努力和專業(yè)知識的標(biāo)準(zhǔn)可能保持不變,只是通過AI,輸出可以更好,更容易被世界接受,更快完成。如果你能立即看到結(jié)果,你就不會被別人拖慢速度。你花同樣的心力,但不用等待VFX工作室可能需要一個月才能完成的工作,而是立即得到反饋。我和行業(yè)內(nèi)另一個人交談過,他們說創(chuàng)意工作或編程的未來將轉(zhuǎn)向管理,因為我們現(xiàn)在用AI擁有的能力,對于有資本的人來說一直是可用的,那就是雇傭人。我現(xiàn)在寫的代碼比一年前少得多,因為我可以讓一群人去嘗試各種實驗,他們可能需要一周時間來完成,而現(xiàn)在他們也在使用AI。
主持人:你是否認(rèn)為,如果你是一個創(chuàng)意人士,無論是編程者還是撰寫內(nèi)容或制作廣告腳本的人,你會如何適應(yīng)這個新世界?因為在印度和世界各地,有很多人重視智力,認(rèn)為編程是智力的象征,而現(xiàn)在它正在被商品化。如果你是一個剛開始職業(yè)生涯的工程師,你會如何應(yīng)對即將到來的地位沖擊?因為你在Twitter上已經(jīng)看到了一些跡象,每天都有關(guān)于這個話題的討論,有人在否認(rèn),有人在悲傷,各種反應(yīng)都有。也有人說沒什么會發(fā)生,因為創(chuàng)造結(jié)果所需的努力是相同的,我同意這一點。但如果你能接觸到AI工具,現(xiàn)在你就在與那么多其他會寫英語的人競爭,他們可能不像你那樣了解底層技術(shù),但現(xiàn)在也在市場上競爭同樣的工作或職位。你如何看待這種影響?
Kevin Weil:我認(rèn)為,在一個AI模型不受智能限制而是受教學(xué)限制的世界里,專家和經(jīng)驗仍然很重要。Jeff Dean是一個比我更好的工程師,我敢打賭Jeff Dean加上AI比我加上AI做得更好。專業(yè)知識和經(jīng)驗,理解要解決什么問題,關(guān)注哪些方面,如何利用資源,這些仍然很重要。我不認(rèn)為一切都會完全平等,專業(yè)知識不再重要。然后,你開始思考什么才是真正重要的,如果你能創(chuàng)造任何東西,那么知道要創(chuàng)造什么就變得非常關(guān)鍵。誰能感覺到最重要的問題是什么,以及如何解決它們,如果更多的人能夠解決這些問題,世界會變得更好,因為更多的問題會得到解決,社會會更快地前進(jìn),我對此感到興奮。
四、AI將如何塑造工作與教育
主持人:聽起來,AI可能會創(chuàng)造新的工作類別,但這似乎與"現(xiàn)有工作將繼續(xù)存在但AI會成為其中一部分"這一觀點有些矛盾。你能預(yù)見會出現(xiàn)什么樣的新工作嗎?在你構(gòu)建產(chǎn)品的過程中,有沒有什么具體的想法,你認(rèn)為在未來幾年內(nèi)肯定會成為現(xiàn)實?
Kevin Weil:很難說,我不確定我有一個能讓你滿意的答案。但我認(rèn)為幾乎所有的工作都會被AI補充。無論你是在日常工作中使用AI來增強自己的能力,還是像Varun說的那樣,人們將越來越多地成為AI員工的管理者,這些AI員工會為他們完成很多基礎(chǔ)工作。也許我們會把"所以這意味著什么"留給人類,AI做很多"是什么"的工作,然后人類仍然對"這意味著什么"負(fù)責(zé),就像你作為團隊管理者一樣。但我不敢確定,我認(rèn)為很多事情會在未來幾年內(nèi)發(fā)生變化。我唯一確信的是,人們天生希望成為比自己更大的事物的一部分。我不相信一個我們都獲得普遍基本收入,然后躺在沙發(fā)上做藝術(shù)的世界。我認(rèn)為人們想要創(chuàng)造,他們想要幫助他人,他們想要讓世界變得更好。AI會改變很多事情,它會幫助我們以現(xiàn)在無法做到的方式實現(xiàn)目標(biāo),但我認(rèn)為這種基本愿望是人類的本性。所以我不認(rèn)為會有一個AI為我們做所有工作的世界,而我們都放松下來什么都不做。我認(rèn)為我們?nèi)匀粫ぷ鳎匀粫ψ屖澜缱兊酶茫皇俏覀儠胁煌墓ぞ邅碜鲞@些事情。
主持人:也許不是這個話題,但我在想,當(dāng)你們構(gòu)建產(chǎn)品時,你們肯定有很多優(yōu)先事項,你們在開發(fā)自己的產(chǎn)品,但在工作過程中,你們會想,"啊,那是一個創(chuàng)業(yè)點子"。你們在創(chuàng)造智能,然后想,"那應(yīng)該成為一家公司"。當(dāng)然,你們不會花時間去建立那個公司,因為你們有其他優(yōu)先事項。但你腦子里有沒有幾個想法,覺得有人應(yīng)該利用你們正在構(gòu)建的技術(shù)來做些什么?你們在為創(chuàng)業(yè)公司挖掘想法嗎?
Kevin Weil:是的,你在尋找播客之后的項目。嗯,我會給你一個一般性的想法和一個具體的想法。一般性的想法是,我之前說過,這些模型不受智能限制,而是受教學(xué)限制,它們可以學(xué)習(xí)任何東西,關(guān)鍵是你有什么來教它們。所以我認(rèn)為,利用私有數(shù)據(jù)可以構(gòu)建很多大公司。模型是在互聯(lián)網(wǎng)和公共數(shù)據(jù)上訓(xùn)練的,但世界上大部分?jǐn)?shù)據(jù)不是公共數(shù)據(jù),而是鎖在企業(yè)、機構(gòu)、政府等圍墻后的私有數(shù)據(jù)。你可以用這些數(shù)據(jù)讓模型變得非常強大。你已經(jīng)在法律等領(lǐng)域看到了這樣的例子,他們利用私有數(shù)據(jù)來增強模型,使其在特定功能上變得出色,能夠深入了解法律工作流程。我認(rèn)為你可以在很多不同的領(lǐng)域這樣做。
具體的想法是,這對全世界都非常重要,特別是對印度。我真的希望每個孩子都能有一個個性化的導(dǎo)師。我不知道為什么今天還沒有實現(xiàn)。我的孩子沒有這樣的導(dǎo)師,你知道有誰有嗎?這感覺是最有價值的事情之一,你可以做一些有意義的事情來加速世界的進(jìn)步和提高生活質(zhì)量。因為我見過的每一項研究都表明,有個性化導(dǎo)師的孩子比只有普通教育的孩子表現(xiàn)高出幾個標(biāo)準(zhǔn)差。顯然,世界上有很多孩子甚至沒有我們認(rèn)為的基本教育,但他們可能有手機,而ChatGPT是免費的。我只是想看到一個世界,每個孩子都有一個個性化的導(dǎo)師,可以教他們?nèi)魏嗡麄兿胫赖臇|西,以他們想要的速度推動他們,讓他們按照自己天生的智力水平成長。世界會變得更好,AI今天就可以做到這一點。這不是要等待四年后的技術(shù)突破,AI已經(jīng)準(zhǔn)備好了。我想看到有人用一個驚人的AI導(dǎo)師席卷全球。我認(rèn)為在OpenAI,我們會盡一切努力支持有人大規(guī)模地做這件事。這是我們能夠改善世界的最直接方式之一。
主持人:語音模式有普及嗎?因為我以為當(dāng)我們有像電影《她》那樣的技術(shù)時,我們會經(jīng)常使用語音模式,一直和AI交談,但我發(fā)現(xiàn)自己更多的是在和AI發(fā)短信,我不怎么使用語音模式,這很奇怪,因為我一直以為會是相反的情況。你有什么看法嗎?因為你在OpenAI負(fù)責(zé)產(chǎn)品,你知道為什么它沒有普及,或者可能我的理解有誤?
Kevin Weil:我認(rèn)為它會普及的,我們有很多用戶一直在使用它。有很多重度用戶,比如我知道有人下班走路回家時,無論是走到車邊還是公交車站,他們會一直和ChatGPT交談,回顧他們的一天,討論會議,談?wù)摯k事項,最后從ChatGPT那里得到一組待辦事項,總結(jié)了他們的一天。所以有很多很酷的語音應(yīng)用場景。我認(rèn)為它可以比現(xiàn)在好得多。現(xiàn)在,如果你停止說話,語音模式會立即接入,因為它認(rèn)為你說完了。人類不會這樣做,他們會根據(jù)各種提示來判斷,而AI目前還不會。你開始說話,然后它停下來,然后又開始,我們?nèi)祟悓W(xué)會了稍微打斷對方,然后根據(jù)各種暗示決定誰繼續(xù)說。我們在播客中一直在這樣做。 所以有這些細(xì)微的暗示會讓對話感覺非常真實。我們非常重視這一點,我認(rèn)為你會很快看到很多改進(jìn)。語音模式對我來說很棒,但還沒有達(dá)到它應(yīng)該有的水平,我非常有信心我們會達(dá)到那個水平,這將開啟更多可能性。你希望能夠以與人類互動的每一種方式與ChatGPT交流,有時是視頻,有時是語音,有時是打字,你需要能夠做到所有這些。
主持人:Kevin,有時候你看著你正在做的工作,你會想,也許這個問題的答案是一個實體產(chǎn)品。你有想過這方面的事情嗎?
Kevin Weil:我們開始關(guān)注機器人技術(shù),具體形式還有待觀察。可能是我們自己做一個大型機器人項目,或者我們只需要積累足夠的真實世界經(jīng)驗來構(gòu)建優(yōu)秀的視覺模型和現(xiàn)實世界理解模型。無論如何,我們知道機器人技術(shù)將是一個重要領(lǐng)域,我們希望為許多其他公司在機器人領(lǐng)域做出卓越成就提供技術(shù)支持。 對我來說,首先是讓數(shù)字世界運作正確,然后在數(shù)字世界中擁有人工通用智能幫助我們做各種事情之后,下一個明顯的方向就是機器人技術(shù)和對現(xiàn)實世界的影響。所以,如果你想成為我們希望成為的那種公司,你必須能夠在這兩個領(lǐng)域都發(fā)揮作用。
星標(biāo)公眾號, 點這里 1. 點擊右上角 2. 點擊"設(shè)為星標(biāo)" ← AI深度研究員 ? ← 設(shè)為星標(biāo)
參考資料:https://www.youtube.com/watch?v=SnSoMh9m5hc&t=88s&ab_channel=Overpowered
來源:官方媒體/網(wǎng)絡(luò)新聞
排版:Atlas
編輯:深思
主編: 圖靈
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.