新智元報(bào)道
編輯:英智
【新智元導(dǎo)讀】蘋果在2024年全球開發(fā)者大會(huì)上為Siri描繪了誘人的藍(lán)圖,承諾將成為iPhone的「超級(jí)大腦」。然而,僅僅九個(gè)月后,內(nèi)部技術(shù)方向的反復(fù)搖擺和高管間的矛盾讓這一愿景化為泡影。
去年6月,蘋果展示了AI版Siri。
隨后的幾個(gè)月,Siri團(tuán)隊(duì)對(duì)實(shí)現(xiàn)這些功能的基礎(chǔ)技術(shù)方案搖擺不定。
據(jù)一位知情的前蘋果員工透露,團(tuán)隊(duì)曾計(jì)劃打造一小一大兩種模型,分別命名為「迷你鼠」(Mini Mouse)和「大力鼠」(Mighty Mouse)。
小模型在iPhone上運(yùn)行,處理像設(shè)鬧鐘這類簡(jiǎn)單任務(wù)。大模型則在云端運(yùn)行,負(fù)責(zé)更復(fù)雜的任務(wù),比如幫用戶叫車,趕赴下一場(chǎng)會(huì)議。
但后來(lái),Siri負(fù)責(zé)人改變主意,決定構(gòu)建一個(gè)全能大模型。
這意味著Siri軟件得在云端運(yùn)行,與先前為保護(hù)用戶隱私,將大部分軟件部署在設(shè)備端的做法相悖。
技術(shù)方向大幅調(diào)整,讓Siri團(tuán)隊(duì)成員疲憊不堪,備受挫折,甚至有人因此離開。
這讓公司今年發(fā)布Siri新功能的目標(biāo),變得岌岌可危。
這種猶豫不決,導(dǎo)致蘋果上個(gè)月做出驚人決定:將Siri新功能發(fā)布時(shí)間推遲到2026年。
據(jù)知情人透露,蘋果將解除其AI主管John Giannandrea及負(fù)責(zé)日常運(yùn)營(yíng)的副手Robby Walker對(duì)Siri的管理職權(quán)。
蘋果的軟件工程主管Craig Federighi將主管Siri,此前領(lǐng)導(dǎo)Vision Pro開發(fā)的Mike Rockwell將接手Walker的工作。
演示,幾乎全是假的?
去年6月,蘋果發(fā)布一系列名為Apple Intelligence的AI功能,涵蓋寫作、圖像生成、全新的照片編輯、郵件功能,以及Siri升級(jí)。
一反此前的立場(chǎng),蘋果宣布與OpenAI合作,引入ChatGPT作為補(bǔ)充,用于其模型無(wú)法解決的問(wèn)題或任務(wù)。
發(fā)布會(huì)的現(xiàn)場(chǎng)演示中,一位蘋果高管問(wèn)Siri母親航班的降落時(shí)間。Siri通過(guò)訪問(wèn)其電子郵件和實(shí)時(shí)航班數(shù)據(jù),給出了到達(dá)時(shí)間。
接著,她又讓Siri提醒午餐計(jì)劃,Siri從短信中提取細(xì)節(jié),并規(guī)劃了從機(jī)場(chǎng)到餐廳的路線。
然而,Siri團(tuán)隊(duì)成員對(duì)此演示卻頗感意外。一位前蘋果員工稱,他們從未見(jiàn)過(guò)這些功能可以實(shí)際運(yùn)行的版本。
該員工還表示,當(dāng)時(shí)演示中唯一在測(cè)試設(shè)備上激活的新功能,是用戶喚醒Siri時(shí),iPhone屏幕邊緣出現(xiàn)的閃爍彩色光帶。
以往,蘋果在大會(huì)上僅展示已在測(cè)試設(shè)備上運(yùn)行、且經(jīng)營(yíng)銷團(tuán)隊(duì)審核確保能按時(shí)發(fā)布的功能和產(chǎn)品。
蘋果2024年開發(fā)者大會(huì)上對(duì)Siri新功能的演示
即便如此,仍給外界留下深刻印象。
宣布這些功能后的兩天內(nèi),蘋果股價(jià)上漲超10%,華爾街對(duì)蘋果推出AI計(jì)劃表示認(rèn)可。
一些前蘋果員工表示,他們對(duì)Federighi和Rockwell扭轉(zhuǎn)Siri局面充滿信心。
與更依賴下屬管理具體事務(wù)的Giannandera和Walker相比,他倆更傾向于親力親為。
Federighi對(duì)軟件項(xiàng)目技術(shù)細(xì)節(jié)的了解,有時(shí)甚至超過(guò)負(fù)責(zé)這些項(xiàng)目的初級(jí)工程師。
Rockwell被視為富有遠(yuǎn)見(jiàn)的領(lǐng)導(dǎo)者,既能為項(xiàng)目注入新思維,又能巧妙適應(yīng)公司文化。
Federighi已著手做出改變。
他指示Siri的機(jī)器學(xué)習(xí)工程師,要不惜一切打造最頂尖的AI功能,即使需要在軟件產(chǎn)品中使用其他公司的開源模型,而非蘋果自研模型。
AI熱潮興起
2022年11月,OpenAI發(fā)布ChatGPT,在科技界和公眾中引發(fā)轟動(dòng)。
然而,Giannandrea團(tuán)隊(duì)的前工程師稱,團(tuán)隊(duì)高層領(lǐng)導(dǎo)并未表現(xiàn)出緊迫感。
相比之下,F(xiàn)ederighi的軟件工程團(tuán)隊(duì)則反應(yīng)迅速。
多名前蘋果員工表示,Intelligent Systems團(tuán)隊(duì)領(lǐng)導(dǎo)者迅速分享LLM的論文,并公開探討如何用這些技術(shù)改進(jìn)iPhone。
Intelligent Systems團(tuán)隊(duì)向Federighi演示了AI在iPhone上的功能后,軟件工程團(tuán)隊(duì)內(nèi)部熱情高漲。
這些demo借助OpenAI模型,展示了AI如何理解用戶手機(jī)屏幕內(nèi)容,并能通過(guò)更自然的對(duì)話,操作應(yīng)用程序、執(zhí)行其他任務(wù)。
AI團(tuán)隊(duì)和軟件工程團(tuán)隊(duì)的高管們隨即開始爭(zhēng)奪LLM驅(qū)動(dòng)的新功能主導(dǎo)權(quán)。
憑借交付方面一貫的好聲譽(yù),軟件工程團(tuán)隊(duì)占據(jù)上風(fēng)。
盡管蘋果內(nèi)部試用了OpenAI模型,但在2023年,管理層告知工程師,最終產(chǎn)品不得使用外部公司模型,只能用于與自研模型對(duì)比測(cè)試。
打造旨在與OpenAI抗衡的蘋果大模型,是Giannandrea團(tuán)隊(duì)的職責(zé)。
然而,據(jù)多位在2023-2024年使用過(guò)這些模型的前蘋果員工稱,其性能表現(xiàn)遠(yuǎn)不及OpenAI。
AIMLess(漫無(wú)目的)
對(duì)全球市值最高的蘋果來(lái)說(shuō),如何有效利用AI,是當(dāng)下最為關(guān)鍵的挑戰(zhàn)之一。
這關(guān)乎iPhone和其他產(chǎn)品能否繼續(xù)保持技術(shù)領(lǐng)先地位。
Siri因創(chuàng)新遲緩飽受詬病,隨著OpenAI ChatGPT等AI產(chǎn)品爆火,外界的不滿愈發(fā)強(qiáng)烈。
僅僅九個(gè)月前,在開發(fā)者大會(huì)上,蘋果還向投資者保證,將通過(guò)Siri升級(jí)和其他功能,在AI領(lǐng)域迎頭趕上。
對(duì)蘋果而言,此次延遲發(fā)布極為尷尬。
這種困境部分源于其根深蒂固的企業(yè)價(jià)值觀。
蘋果對(duì)用戶隱私的高度重視,使其難以獲取大量數(shù)據(jù)用于模型訓(xùn)練,也難以驗(yàn)證AI功能在設(shè)備端的實(shí)際效果。
然而,多位曾在AI和軟件部門工作的人士透露,蘋果內(nèi)部高層的個(gè)性沖突,也是重要原因。
超過(guò)六位曾在Giannandrea領(lǐng)導(dǎo)的AI/ML團(tuán)隊(duì)工作的前蘋果員工表示,領(lǐng)導(dǎo)不力是問(wèn)題的根源。
他們指出,Walker不僅缺乏雄心,還缺乏承擔(dān)風(fēng)險(xiǎn)的魄力。
在蘋果內(nèi)部,AI/ML團(tuán)隊(duì)松散的氛圍和較差的執(zhí)行力,為其贏得了一個(gè)有諷刺意味的外號(hào)「AIMLess」(漫無(wú)目的,由AI/ML首字母組合變化而來(lái))。
蘋果內(nèi)部對(duì)AI/ML團(tuán)隊(duì)的負(fù)面評(píng)價(jià),與Federighi領(lǐng)導(dǎo)的軟件工程團(tuán)隊(duì)形成了鮮明對(duì)比。
軟件工程團(tuán)隊(duì)?wèi){借在操作系統(tǒng)、信息、照片、郵件和其他應(yīng)用上的出色工作,聲名遠(yuǎn)揚(yáng)。
耗時(shí)兩年,只為去掉「嘿,Siri」的「嘿」
實(shí)際上,Siri的問(wèn)題已存在多年。
2018年,Giannandrea從谷歌跳槽至蘋果,負(fù)責(zé)新成立的AI團(tuán)隊(duì),科技界普遍認(rèn)為蘋果挖到了一位關(guān)鍵人才。
知情人士稱,盡管當(dāng)時(shí)一些高管認(rèn)為Giannandrea可能對(duì)負(fù)責(zé)自動(dòng)駕駛更感興趣,但他卻對(duì)Siri格外關(guān)注。
彼時(shí),蘋果在2011年推出的Siri,發(fā)展已陷入停滯。它對(duì)常識(shí)性問(wèn)題表現(xiàn)不佳,對(duì)第三方應(yīng)用的支持也極為有限。
在Giannandrea接手之前,Siri團(tuán)隊(duì)的成員在蘋果內(nèi)部就感覺(jué)不受重視。
Siri工程師對(duì)軟件工程團(tuán)隊(duì)主導(dǎo)iOS更新不滿,認(rèn)為他們未優(yōu)先考慮修復(fù)Siri的問(wèn)題。軟件工程團(tuán)隊(duì)則認(rèn)為,Siri團(tuán)隊(duì)跟不上節(jié)奏,無(wú)法為Federighi團(tuán)隊(duì)推出的新功能提供支持。
Giannandrea曾表示,他有信心借鑒谷歌打造AI語(yǔ)音助手的方法,來(lái)改進(jìn)Siri。
他認(rèn)為蘋果只需獲取合適的訓(xùn)練數(shù)據(jù),并提升從網(wǎng)絡(luò)抓取信息,以回答常識(shí)性問(wèn)題的能力。
與Giannandrea共事過(guò)的人形容他隨和、安靜,不愛(ài)與人起沖突,這與蘋果高管團(tuán)隊(duì)中要求嚴(yán)苛、性格強(qiáng)勢(shì)(A型人格)者形成鮮明對(duì)比。
從左至右:Tim Cook、John Giannandrea和Craig Federighi
Giannandrea常向員工闡述他的理念,他堅(jiān)信機(jī)器學(xué)習(xí)能讓產(chǎn)品逐步改進(jìn),最終實(shí)現(xiàn)重大突破,他稱為「爬山」。
他也表達(dá)過(guò)不看好聊天機(jī)器人的觀點(diǎn),在ChatGPT發(fā)布后,還曾表示,他認(rèn)為聊天機(jī)器人對(duì)用戶價(jià)值不大。
Walker是一位經(jīng)常受到同事批評(píng)的Siri領(lǐng)導(dǎo)者。他于2013年加入蘋果,2022年底開始負(fù)責(zé)Siri日常運(yùn)營(yíng)。
在批評(píng)者眼中,Walker不愿進(jìn)行大刀闊斧的冒險(xiǎn),只關(guān)注性能提升有限的指標(biāo),缺乏革新Siri的長(zhǎng)遠(yuǎn)規(guī)劃。
他常為一些微小進(jìn)展沾沾自喜,比如將用戶向Siri提問(wèn)的響應(yīng)時(shí)間縮短幾個(gè)百分點(diǎn)。
Walker的一個(gè)得意之作,是去掉喚醒Siri的語(yǔ)音指令「嘿Siri」中的「嘿」字,這項(xiàng)任務(wù)耗時(shí)兩年多才完成。
Walker還否決了一個(gè)提案。團(tuán)隊(duì)計(jì)劃用LLM賦予Siri更強(qiáng)的情感感知能力,使其識(shí)別出處于困境中的用戶,并作出恰當(dāng)?shù)幕貞?yīng)。
然而,該項(xiàng)目的工程師繞過(guò)他,繼續(xù)與軟件工程團(tuán)隊(duì)的安全和定位小組合作開發(fā)這些功能。
更高的薪酬,更快的晉升?
Federighi領(lǐng)導(dǎo)的軟件工程團(tuán)隊(duì)和Giannandrea的AI/ML團(tuán)隊(duì),關(guān)系愈發(fā)緊張,時(shí)常陷入僵局。
從管理風(fēng)格來(lái)看,兩人截然不同。
Federighi管理嚴(yán)格、要求頗高,Giannandrea則更隨和。
開會(huì)時(shí),F(xiàn)ederighi常常連珠炮似地向同事發(fā)問(wèn),Giannandrea更傾向于傾聽(tīng)。
John Giannandrea
其他方面的不滿情緒也在悄然積累。
軟件工程團(tuán)隊(duì)部分成員對(duì)AI團(tuán)隊(duì)同事薪資高、晉升快感到惱火。
他們還憤懣于,一些AI團(tuán)隊(duì)工程師能享受更長(zhǎng)假期,周五還能提前下班,自己卻要面對(duì)繁重的工作安排。
兩個(gè)團(tuán)隊(duì)之間的不信任感日益加深。
今年早些時(shí)候,Giannandrea的副手要求詳細(xì)記錄一個(gè)聯(lián)合項(xiàng)目的開發(fā)過(guò)程,以防項(xiàng)目失敗后,F(xiàn)ederighi團(tuán)隊(duì)將責(zé)任歸咎于AI團(tuán)隊(duì)。
Federighi還組建了自己的機(jī)器學(xué)習(xí)團(tuán)隊(duì),這進(jìn)一步加劇了緊張關(guān)系。
Intelligent Systems團(tuán)隊(duì)成員達(dá)數(shù)百人,由其高級(jí)副手Sebastien Marineau-Mes負(fù)責(zé)運(yùn)營(yíng)。
他們訓(xùn)練了自己的模型,并構(gòu)建了多個(gè)demo,讓用戶通過(guò)語(yǔ)音指令控制應(yīng)用程序,且通常無(wú)需Siri團(tuán)隊(duì)協(xié)助。
在一次內(nèi)部演示中,一名團(tuán)隊(duì)成員展示了一張幻燈片,兩座山碰撞后夷為平地,一些人認(rèn)為這是對(duì)Giannandrea「爬山」理念的隱晦嘲諷。
2022年,Intelligent Systems團(tuán)隊(duì)開始與Walker以及負(fù)責(zé)Vision Pro的高管Rockwell合作,啟動(dòng)了一個(gè)代號(hào)為L(zhǎng)ink的項(xiàng)目,但該項(xiàng)目很快陷入困境。
項(xiàng)目旨在為混合現(xiàn)實(shí)頭顯及AR眼鏡開發(fā)語(yǔ)音指令,以控制應(yīng)用程序、完成任務(wù)。
Mike Rockwell
參與三方會(huì)議的工程師對(duì)Rockwell和Marineau-Mes對(duì)Walker公開表露的敵意深感震驚。
兩人常因Siri在支持Vision Pro方面進(jìn)展緩慢,對(duì)Walker表達(dá)不滿。
例如,Rockwell期望佩戴頭顯的用戶能用語(yǔ)音通過(guò)Siri瀏覽網(wǎng)頁(yè)、調(diào)整窗口大小。他還設(shè)想,在虛擬空間交流的兩人能共同與Siri互動(dòng),比如一起規(guī)劃度假。
但Siri團(tuán)隊(duì)的部分成員對(duì)此表示懷疑。最終,因Siri團(tuán)隊(duì)能力所限,Rockwell為Vision Pro設(shè)想的許多功能被削減。
參考資料:
https://www.theinformation.com/articles/apple-fumbled-siris-ai-makeover?rc=epv9gi
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.