技術(shù)創(chuàng)新的漫漫長路,總有人上下求索,用執(zhí)著和熱情推動著技術(shù)的洪流滾滾向前。
在張林華十幾年的職業(yè)生涯中,他始終保持著對新技術(shù)的敏銳嗅覺。從深圳中微電,到騰訊,再到洲明,一次次義無反顧地奔向新技術(shù)。始于計(jì)算機(jī),涉獵嵌入式、SoC、操作系統(tǒng)、音視頻、VR/AR、云計(jì)算、云渲染、XR虛擬制作,到如今炙熱的數(shù)字人、大模型、生成式AI、MR、空間智能等。
這種探索求知欲,在幼時已有顯現(xiàn)。小時候,他對新事物總是充滿好奇,家里的鬧鐘、玩具、小霸王都會被他拆開研究,再小心翼翼地安裝復(fù)原,以防被父母責(zé)備。
后來的一路經(jīng)歷和選擇,從互聯(lián)網(wǎng)大廠跳出舒適區(qū),轉(zhuǎn)投科技制造業(yè),也正是源于他這股喜歡折騰、不安于現(xiàn)狀的勁兒。
如今張林華最想做的,是打造出一款A(yù)I時代的現(xiàn)象級產(chǎn)品,結(jié)合算法、硬件、交互融合起來,讓過去十年的沉淀在這個產(chǎn)品上綻放。
他說,這將是自己職業(yè)燃燒的起點(diǎn)和一生的追求,希望能找到更多志同道合的人一起把這件事做得有意義。
▋ 帶著憧憬選擇芯片創(chuàng)業(yè)公司
2012年是中國移動互聯(lián)網(wǎng)爆發(fā)式增長的一年,移動網(wǎng)絡(luò)從3G向4G升級,移動設(shè)備用戶數(shù)超越臺式電腦數(shù)。這一年,張林華也結(jié)束了在中科大的讀研生活,進(jìn)入一家芯片創(chuàng)業(yè)公司:深圳中微電,促使他來到這的理由主要是兩個人:梅思行和周志德,中微電的兩位創(chuàng)始人。
兩位創(chuàng)始人(左:周志德 右:梅思行 )
梅思行是NVIDIA的主架構(gòu)師之一,在硅谷有超過30年的半導(dǎo)體從業(yè)經(jīng)驗(yàn)。他直接參與了數(shù)代NVIDIA圖形處理器芯片中的流處理器架構(gòu)和硬件設(shè)計(jì),是芯片設(shè)計(jì)領(lǐng)域不折不扣的大牛。
而周志德是梅思行多年好友,世界著名的編譯器專家,曾任MIPS首席工程師,也是編譯界普遍采用的Open64編譯器的首席架構(gòu)師。處理器大牛加上編譯器大牛,這個陣容深深吸引了張林華。
張林華在讀研時選擇了嵌入式方向。在他看來,軟件與硬件作為計(jì)算機(jī)系統(tǒng)中相互依存的兩部分,如同硬幣的兩面,自己都應(yīng)該去學(xué)習(xí)。而嵌入式系統(tǒng)的核心正是在于軟硬件的協(xié)同,能夠找到最優(yōu)解,實(shí)現(xiàn)更高效、更規(guī)范的系統(tǒng)運(yùn)行。
從讀研到就業(yè)看上去似乎一切都是水到渠成。在深圳中微電,他主要負(fù)責(zé)系統(tǒng)級音視頻編解碼相關(guān)工作,每天與行業(yè)前輩和技術(shù)大牛共事,他覺得很榮幸也很充實(shí)。
2014年至2017年期間,正值中微電成立以來面臨最大的發(fā)展危機(jī),團(tuán)隊(duì)瀕臨解散,大部分成員去了華為或創(chuàng)業(yè)。想起那段經(jīng)歷,張林華心中有些惋惜。中微電的技術(shù)很牛,在當(dāng)時中國或許是唯一一個能做出GPU的公司,但缺少好的落地場景,也沒有趕上AI的機(jī)會,技術(shù)的強(qiáng)大在當(dāng)時未能轉(zhuǎn)化為市場的成功。在經(jīng)歷了業(yè)務(wù)發(fā)展和團(tuán)隊(duì)變動的低谷后,中國電子注資入股。重整旗鼓的它,悄然調(diào)整了商業(yè)模式,如今再次綻放出國產(chǎn)處理器的光彩。
兩年后的一天,他離開了。
▋智能語音人機(jī)交互
人生的軌跡總是從某個不知名的岔路口開始改變。
互聯(lián)網(wǎng)公司騰訊正在悄然布局新興領(lǐng)域,設(shè)立了一個新中心:智能設(shè)備創(chuàng)新中心。張林華本身與硬件打了多年交道,再加上對智能硬件的強(qiáng)烈興趣,便在這個機(jī)緣下加入了騰訊。以微游戲主機(jī)miniStation首款智能硬件產(chǎn)品開啟了騰訊職業(yè)生涯的起點(diǎn)。
緊接著來到了VR元年2016年,當(dāng)時騰訊也開始著手頭戴式虛擬現(xiàn)實(shí)設(shè)備研制,期間張林華有參與部分VR項(xiàng)目,最終因?yàn)榧夹g(shù)瓶頸和VR內(nèi)容匱乏,該賽道后來也進(jìn)入了泡沫化。
有了智能硬件miniStation的技術(shù)沉淀,對標(biāo)主流語音助手亞馬遜Echo,他開啟了騰訊聽聽智能助手序幕。很快團(tuán)隊(duì)著手搭建Demo,構(gòu)建產(chǎn)品原型,把市面上所有產(chǎn)品都拿過來做測試對比,評測了市面上主流語音識別廠商,仔細(xì)分析它們的優(yōu)缺點(diǎn),力求找到最佳技術(shù)方案。
騰訊聽聽上線時,收到了不少正向的反饋。作為一個產(chǎn)品本身,騰訊聽聽是相對成功的,但這款產(chǎn)品最終未能實(shí)現(xiàn)規(guī)模化,張林華認(rèn)為這與公司戰(zhàn)略和市場環(huán)境有關(guān)。
從時間上,騰訊聽聽是2016年開始研發(fā),比阿里的天貓精靈要早,但在定價策略上,騰訊選了一條更為保守的路線。后起之秀阿里天貓精靈以399的售價推出,并通過300元的補(bǔ)貼將實(shí)際售價壓至99元,以此來打開市場局面,而騰訊聽聽未參與價格戰(zhàn)。
很快正值云計(jì)算飛速發(fā)展浪潮,張林華經(jīng)歷智能語音助手項(xiàng)目后對云端AI發(fā)展趨勢有了更深刻的理解,由此便與騰訊云AI產(chǎn)品團(tuán)隊(duì)結(jié)緣,以AI研究員身份投身于騰訊云產(chǎn)業(yè)互聯(lián)網(wǎng)的浪濤中。
▋產(chǎn)業(yè)互聯(lián)網(wǎng):云計(jì)算+AI
如火如荼的安防工程愈演愈烈,從公安天眼系統(tǒng)到智慧零售門店支付,再到社保人臉核身都跟人臉識別、圖像/視頻識別有著緊密聯(lián)系。AI技術(shù)讓人們從繁瑣的事務(wù)中解脫出來,并加速了工作流程,釋放了生產(chǎn)力。
云計(jì)算就像一艘巨輪駛?cè)敫餍懈鳂I(yè),在AI賦能下企業(yè)業(yè)務(wù)也隨之遍地開花。
張林華在這段職業(yè)過程中對人臉/文字/圖像識別有著更多的認(rèn)知,從人臉檢測與分析、五官定位、人臉比對、人臉?biāo)阉鞯酵ㄓ肙CR及場景化文字結(jié)構(gòu)化,進(jìn)而到圖像/視頻分析與理解等深度參與了技術(shù)選型、工程化、產(chǎn)品化全流程,也積極探索了人臉支付/門禁等應(yīng)用場景。同時對云計(jì)算三層服務(wù)也有更多的理解和實(shí)踐,通過客戶項(xiàng)目貫通了IaaS->PaaS->SaaS三層業(yè)務(wù)邏輯。
他說跟著AI學(xué)習(xí)最大的好處就是學(xué)會了跟AI一樣的結(jié)構(gòu)化能力,培養(yǎng)了結(jié)構(gòu)化思維,確實(shí)對后續(xù)工作和生活帶來莫大處理問題的能力。AI在學(xué)習(xí)人類的同時,人類也在學(xué)習(xí)AI。
在騰訊的第5年,張林華陷入了焦慮。
▋大廠內(nèi)容AI中臺
他很久沒有感受到那種新技術(shù)帶來的興奮了,好像突然找不到目標(biāo),不知道要做什么了。
在別人眼里,他是一個非常自律,善于自我激勵和做規(guī)劃的人。但很多人不知道,他還有一個“奇葩”的習(xí)慣,階段性的讓自己“保持饑餓”。
“Stay hungry”在他身上,具象化了,適度的饑餓感讓他更冷靜,堅(jiān)定。
也就是那會,騰訊發(fā)生了轟動業(yè)界的930變革。
2018年9月30日,騰訊進(jìn)行了自成立以來的第三次重大組織架構(gòu)調(diào)整,在原有七大事業(yè)群(BG)的基礎(chǔ)上進(jìn)行重組整合。原有七大事業(yè)群(BG)重組整合,新成立云與智慧產(chǎn)業(yè)事業(yè)群(CSIG)、平臺與內(nèi)容事業(yè)群(PCG)。
PCG的業(yè)務(wù)都是圍繞內(nèi)容做延伸的,騰訊的目的是想打造一個數(shù)字內(nèi)容的大生態(tài)。這場變革不僅影響了騰訊的整體戰(zhàn)略,也讓張林華看到了一個新方向:內(nèi)容AI中臺。
當(dāng)時,張林華以技術(shù)項(xiàng)目經(jīng)理(TPM)的身份來到PCG應(yīng)用研究中心,他過來最重要的工作是建設(shè)視頻理解中臺,圍繞眾多CV、Audio/Speech、NLP的AI技術(shù),開展內(nèi)容理解、內(nèi)容增強(qiáng)、內(nèi)容生成以及內(nèi)容審核四大板塊的AI能力協(xié)同輸出,這些能力服務(wù)于PCG主要的C端業(yè)務(wù),比如騰訊視頻、微視、QQ小世界、企鵝號、騰訊看點(diǎn)、騰訊體育、騰訊新聞等。
進(jìn)入到新的工作狀態(tài),焦慮感逐漸消退。在PCG三年,他對內(nèi)容和AI技術(shù)有了更深刻的理解。他感觸到數(shù)字內(nèi)容的形式遠(yuǎn)遠(yuǎn)不止于文本,特別是抖音等短視頻平臺崛起后,信息的傳遞變得更加可視化、直觀、多模態(tài),圖像和視頻賦予了數(shù)字內(nèi)容更強(qiáng)的傳播力和影響力,而AI則不斷加速內(nèi)容制作全流程。
回顧在騰訊的八年,他走了一條不一樣的職業(yè)路徑,輾轉(zhuǎn)于不同的部門和崗位,從MIG(移動互聯(lián)網(wǎng)事業(yè)群)智能設(shè)備創(chuàng)新中心,到SNG(后演變?yōu)镃SIG,云與智慧產(chǎn)業(yè)事業(yè)群),再到PCG(平臺與內(nèi)容事業(yè)群)應(yīng)用研究中心TencentARC,一次次拓寬職業(yè)邊界。騰訊職業(yè)生涯始于miniStation,止于AI中臺,橫跨了多個BG事業(yè)群。
當(dāng)時,擺在他面前的一個機(jī)會是去大廠造車,造車涉及從硬件到軟件到AI全流程,是一個難得的機(jī)會。如果不是一次偶然的機(jī)會遇見XR虛擬制作場景,他說不定真的會選擇去造車。
▋通往光顯AGI,遙望星空
站在巨大的屏幕前,張林華仿佛置身于另一個空間,眼前的奇異天空、無垠沙地、荒漠雪原,讓他有一瞬間,忽略了面前的屏幕。LED虛擬制作的開山之作《曼達(dá)洛人》展示了其美麗。
《曼達(dá)洛人》全LED虛擬片場
他被這個場景震撼了,第一次知道用屏幕還能拍出這么真實(shí)的科幻視效。跟以前的綠幕摳圖不同,三維LED巨幕能夠?qū)崟r把內(nèi)容渲染出來,屏幕能夠自由切換生成的場景,所見即所得。別說演員,就連自己也好像真的置身奇幻世界。如今得益于AI大模型智慧涌現(xiàn),內(nèi)容創(chuàng)意效率進(jìn)一步得到提升,加速著3D Production Pipeline全流程進(jìn)程。
經(jīng)過騰訊PCG,張林華已經(jīng)對數(shù)字內(nèi)容擁有敏銳的感知力,內(nèi)容無法脫離載體來呈現(xiàn),而此刻,他看到了一個極佳的載體,短視頻已成為廣大用戶習(xí)以為常獲取信息和知識的主要媒介。生成式AI給數(shù)字內(nèi)容帶來了更多想象空間,極大豐富了LED和內(nèi)容的供需關(guān)系。從過往技術(shù)棧來看,最大的區(qū)別:2D->3D,多了一維便有了空間想象力。
這一次他走進(jìn)了一家科技制造企業(yè),LED行業(yè)翹楚:洲明科技。
在洲明,張林華負(fù)責(zé)創(chuàng)新業(yè)務(wù)的產(chǎn)品研發(fā),包括虛擬制作、3D數(shù)字人、多模態(tài)垂直模型、跨模態(tài)生成、空間感知、多模態(tài)AI交互等多個技術(shù)產(chǎn)品。基于LED應(yīng)用場景需求布局虛擬制作、AI、數(shù)字人及技術(shù)生態(tài),推動洲明“LED+AI”商業(yè)化落地。圍繞洲明兩大照明和顯示業(yè)務(wù)板塊,基于多模態(tài)生成式AI技術(shù)帶來的全新交互范式變化,正向設(shè)計(jì)滿足物理世界情境感知能力的硬件載體,使AI具備人類同源信息感知能力,全面釋放光顯AI的龐大潛力。
他發(fā)現(xiàn)雖然過去洲明賣了很多屏,但傳統(tǒng)業(yè)務(wù)大多數(shù)停留在模組思維、工廠思維,事實(shí)上對客戶來說,他們不想要一塊冷冰冰的屏,而是場景化,是屏帶來的價值和體驗(yàn)。
接觸了LED行業(yè)發(fā)展史和市場應(yīng)用場景,結(jié)合當(dāng)下的AI技術(shù),張林華腦海浮現(xiàn)出了一個新公式(如下圖),圍繞元宇宙八大要素:身份、社交、沉浸感、低延遲、多元化、隨地、經(jīng)濟(jì)系統(tǒng)、文明,進(jìn)而大膽構(gòu)想了LED+AI三層服務(wù)IaaS(硬件即服務(wù))、MaaS(模型即服務(wù))、CaaS(內(nèi)容即服務(wù)),并在洲明AI發(fā)布會的圓桌沙龍上做了探討交流。通過算法端到端輸出內(nèi)容一步到位,給內(nèi)容帶來了無限的想象力和制作的時效性。
2024年洲明AI發(fā)布會
在他看來,近幾年元宇宙概念不是弱化了,而是更具體化了,且在悄無聲息演進(jìn)中,LED+AI成為元宇宙重要且關(guān)鍵的推動力,生成式AI必然會加速填補(bǔ)元宇宙所需要的大量內(nèi)容。
譬如位于杭州的全球首個王者榮耀I(xiàn)P電競酒店,張林華團(tuán)隊(duì)全流程參與了該項(xiàng)目創(chuàng)意數(shù)字人互動方案,通過主題形象設(shè)計(jì)、IP互動裝置以及NFC玩法的實(shí)施,實(shí)現(xiàn)了數(shù)字文化IP與線下空間的創(chuàng)意融合。在酒店的弧形LED屏幕互動區(qū),住客們可以與虛擬數(shù)字人進(jìn)行交互,了解酒店設(shè)施、王者榮耀以及KPL賽事等相關(guān)信息,讓沉浸式電競酒店達(dá)到了“Next Level”。
近期在德國的Adele阿黛爾慕尼黑演唱會,洲明ROE為舞臺提供巨屏,并以“史上最大戶外屏幕”的稱號載入吉尼斯紀(jì)錄,長220米,高20米,曲面屏。整個舞臺如膠卷鋪展,照亮慕尼黑這一隅星夜,把瞬間定格成永恒、讓靈魂在此刻共鳴。光顯給人們帶來了視覺盛宴和美好回憶。
Adele阿黛爾慕尼黑演唱會現(xiàn)場
沙特打造的“利雅得狂歡季”也有洲明的參與。“利雅得狂歡季”是沙特一年之中規(guī)模最大的娛樂盛會,對于這個產(chǎn)業(yè)結(jié)構(gòu)非常單一的石油王國來說,此舉是為了促進(jìn)經(jīng)濟(jì)社會多樣性。每年盛會期間,全球的游客都會涌入這里。
樂園中最奪目的景觀是一個直徑高達(dá)35米、鑲嵌在人工湖邊緣的巨大光球。沙特旅游局在官方網(wǎng)站上鄭重表示:這是世界上當(dāng)時最大的LED球幕,它與人工湖一起,打破了吉尼斯世界紀(jì)錄。
沙特“利雅得狂歡季”里的球型屏
一到晚上樂園里燈光點(diǎn)亮,熱鬧的夜生活就開始了。音樂會、足球比賽、戲劇表演、世界各地的美食,人們在此肆意游玩,盡情狂歡。
人間燈火天上月,光顯場景久縈繞。張林華腦中突然出現(xiàn)了一個天馬行空的想法:如果以后人類移民到外太空,那里是不是也需要一個光的樂園?
若真如馬斯克所說,20年內(nèi),就可能實(shí)現(xiàn)一批人移民火星。那到時候,LED屏也可以作為一種建筑材料,搭上馬斯克星艦送往外太空,構(gòu)建人機(jī)賴以生存的光顯空間。當(dāng)屏幕全部鋪開,它可以還原光線,可以模擬這個星球上所有不存在的東西,讓冰冷的空間變得溫暖,讓人類平滑過渡到外太空生活。
他想,這可能是未來LED行業(yè)最大的增量空間和光顯AGI最大的場景。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.