2025年2月20日,Science發(fā)布文章《什么是tinyML?全球南方對耗電、昂貴的人工智能的替代方案》,文章指出由于許多人工智能模型既耗電又昂貴,全球南方國家的研究人員正越來越多地采用低成本、低功耗的替代方案。啟元洞見分享文章主要內(nèi)容,為讀者提供參考。
一、tinyML的誕生背景
一架小型無人機繞著腰果樹轉(zhuǎn)圈,旋翼臂從其緊湊的機身上伸展開來,就像水黽的旋翼臂一樣。在上升過程中,無人機的攝像頭捕捉到了樹葉的鳥瞰圖,樹葉從底部的深綠色變?yōu)轫敳康淖暇G色。與此同時,無人機內(nèi)置的人工智能模型會根據(jù)黑色或棕色斑點來判斷樹葉是否有病,或者是否健康。如果需要,該系統(tǒng)有朝一日可以引導(dǎo)其他無人機飛向個別生病的植物,噴灑殺蟲劑治療它們的疾病。
該系統(tǒng)是印度欽奈韋洛雷理工學(xué)院計算機科學(xué)家巴拉?穆魯甘(Bala Murugan)的杰作。穆魯甘來自一個腰果種植農(nóng)戶家庭。“他們在腰果上使用了大量殺蟲劑,我想建立一個解決方案,盡量減少殺蟲劑的使用。”他說。但他需要一個不需要連接互聯(lián)網(wǎng)的解決方案,因為在印度農(nóng)村地區(qū),互聯(lián)網(wǎng)連接往往很難實現(xiàn)。
Murugan利用了自己的技術(shù)專長。在攻讀博士學(xué)位期間,他曾研究過小型廉價處理器。現(xiàn)在,他意識到在這種小型設(shè)備上運行的人工智能模型可以幫助像他家這樣的農(nóng)民快速識別和治療腰果病。他說:“這就是我最終使用tinyML(微型機器學(xué)習(xí))的原因。”
二、tinyML的優(yōu)勢
TinyML(Tiny Machine Learning)模型是一種低成本、低功耗的人工智能實現(xiàn)方式,越來越多地被資源匱乏地區(qū)所采用,尤其是在全球南部地區(qū)。大語言模型以其多功能性和驚人的類人表達技巧成為新聞焦點,與之形成鮮明對比的是,tinyML設(shè)備目前只有適度的專業(yè)能力。然而,它們卻能帶來變革。例如,印度欽奈韋洛雷理工學(xué)院計算機科學(xué)家巴拉?穆魯甘(Bala Murugan)開發(fā)的裝有微型語言模型的無人機能夠識別患有真菌病“炭疽病”的腰果葉,準(zhǔn)確率高達95%到99%。它們可以為農(nóng)民節(jié)省他們自己尋找病害跡象的時間。此外,它們還能對患病植物進行針對性治療,從而避免了不加區(qū)分地向所有植物噴灑殺蟲劑的做法,這種做法既昂貴又損害健康和環(huán)境。
Murugan是全球南部地區(qū)為tinyML尋找用途的眾多研究人員之一。這些設(shè)備可以作為人工智能技能教學(xué)的低成本輔助工具,但它們也為全球北方科技公司尚未充分解決的問題提供了本土解決方案,從檢測植物疾病到追蹤野生動物。2020年,微型機器學(xué)習(xí)設(shè)備的出貨量約為1500萬臺,據(jù)估計,到2030年,這一數(shù)字將增至25億臺。
吸引Murugan等人的部分原因是,一旦人工智能模型在個人電腦上訓(xùn)練完成,它通常可以在由日常電池供電的低功耗tinyML設(shè)備上運行數(shù)周,耗電量與普通激光筆相當(dāng)。這些設(shè)備不需要互聯(lián)網(wǎng)連接,而在世界上希望采用人工智能解決方案的資源匱乏地區(qū),互聯(lián)網(wǎng)連接可能非常稀缺。伊塔朱巴聯(lián)邦大學(xué)(UNIFEI)的數(shù)據(jù)科學(xué)家馬塞洛?何塞?羅瓦伊(Marcelo Jose Rovai)說:盡管功能有限,但我認(rèn)為tinyML是未來的趨勢。這對發(fā)展中國家來說太棒了。
與用于運行大語言模型等人工智能的芯片相比,微型機器學(xué)習(xí)(tinyML)設(shè)備要便宜得多,功耗也低得多。總的來說就是小但強大。且與大模型相比,TinyML模型通常使用較少的數(shù)據(jù),只需攝取數(shù)千張圖像或聲音,而大語言模型通常需要數(shù)百萬張圖像或聲音。
現(xiàn)在,TinyML模型所依賴的微控制器芯片與洗衣機、汽車安全氣囊等各種設(shè)備中的微控制器芯片類似。芯片本身很便宜,可以從幾家不同的制造商那里買到。因此,現(xiàn)在大多數(shù)tinyML設(shè)備的價格從幾美元到幾十美元不等,具體取決于它們的功能有多強大。這些設(shè)備通常不僅包括芯片,還包括用于檢測圖像和聲音的攝像頭和傳感器,以便人工智能模型進行解讀。研究人員開始使用tinyML時所需的大部分軟件、硬件和數(shù)據(jù)集都是開源的,這意味著他們可以自由訪問和修改它們。
三、tinyML的應(yīng)用領(lǐng)域
(一)農(nóng)業(yè)領(lǐng)域
2020年,山下若昂(Jo?o Yamashita )第一次接觸到tinyML,當(dāng)時他正在遠(yuǎn)程完成本科學(xué)位。山下是UNIFEI的一名電子工程師,COVID-19疫情期間他在位于巴西東南部咖啡種植區(qū)莫吉亞納保利斯塔的家中度過。山下意識到,許多小農(nóng)戶都在為診斷咖啡植株的疾病而苦惱。進行診斷的專家并不便宜,而且在疫情期間也不會出差。Yamashita向tinyML尋求可能的解決方案。在使用公共數(shù)據(jù)集訓(xùn)練了一個通用人工智能模型后,Yamashita去找農(nóng)民了解巴西特有的咖啡疾病。他說:起初,他們非常懷疑。他們中的很多人甚至都沒有手機,因此自動檢測疾病的人工智能模型非常新穎。
山下在家鄉(xiāng)山坡上的種植園里,從一排排咖啡植株上拍攝了健康和患病咖啡葉片的照片,以便對模型進行微調(diào)。他還收集了樣本,隨后在更可控的光線和背景條件下進行拍攝。由此產(chǎn)生的模型能以96%到98%的準(zhǔn)確率識別各種咖啡病害,包括真菌病害(如疫霉病、煙霉病和銹病)以及潛葉蛾。農(nóng)民可以將設(shè)備的攝像頭對準(zhǔn)一片葉子,屏幕上就會顯示病害名稱和表示模型可信度的分?jǐn)?shù)。山下說:當(dāng)我向(農(nóng)民)展示該設(shè)備的工作原理時,他們一臉驚訝。
研究人員在巴西開發(fā)了一種微小的ML設(shè)備,用于檢測咖啡葉片上的各種病害,包括銹病。
Yamashita說,這種設(shè)備對貧困農(nóng)民來說非常實用。它不需要互聯(lián)網(wǎng)接入,無需給電池充電就能使用一周或更長時間,而且成本不到20美元。這正是tinyML擅長的定制、自制解決方案,也解釋了為什么農(nóng)業(yè)一直是該技術(shù)的熱門用途。
(二)醫(yī)療保健領(lǐng)域
除了農(nóng)業(yè),研究人員還在開發(fā)用于醫(yī)療保健的tinyML設(shè)備,從檢測巴西的心房顫動(一種異常心律)到秘魯?shù)呢氀Y。多個研究小組利用這項技術(shù),通過蚊子翅膀的嗡嗡聲來區(qū)分蚊子的種類,這樣就不必用誘捕器收集蚊子,也不必手動識別每一只蚊子。這樣可以更快地發(fā)出警報,有助于控制傳播疾病的蚊種。
例如,羅瓦伊在一個概念驗證設(shè)備上訓(xùn)練了一個人工智能模型來識別兩種伊蚊,它們可以傳播登革熱、寨卡和基孔肯雅病毒,準(zhǔn)確率高達98%,該設(shè)備的電池可以在野外使用4天。他預(yù)計該設(shè)備在巴西將大有用武之地,因為巴西每年有100多萬人感染登革熱。在肯尼亞,類似的項目正在使用tinyML對攜帶瘧疾的蚊子進行自動分類。阿卜杜勒?薩拉姆國際理論物理中心(ICTP)的計算機科學(xué)家馬爾科?澤納羅(Marco Zennaro)說:能夠以自動方式對蚊子進行分類,對于在現(xiàn)場工作的人來說是一個巨大的優(yōu)勢。
(三)環(huán)境應(yīng)用領(lǐng)域
類似的設(shè)備也正在進入環(huán)境應(yīng)用領(lǐng)域。在阿根廷,研究人員在烏龜殼的背面粘貼了微小機器學(xué)習(xí)裝置,以追蹤這些動物的移動方式和地點。在馬來西亞,雙威大學(xué)的工程師羅斯迪亞迪?諾丁(Rosdiadee Nordin)正在使用tinyML設(shè)備監(jiān)測河流中的塑料垃圾,這些垃圾可能會阻礙嬌嫩的紅樹林的生長。他和一個志愿者團隊收集了9000張塑料垃圾圖片,對人工智能模型進行訓(xùn)練,直到他們能夠?qū)λ芰侠M行分類,將塑料瓶群和塑料袋群區(qū)分開來。他們計劃公開這些數(shù)據(jù),以幫助追蹤塑料垃圾的位置、數(shù)量和類型。Nordin說:這不僅有助于(撿拾垃圾的人),也有助于地方議會或環(huán)保機構(gòu)進一步規(guī)劃他們的垃圾收集活動。
一個在tinyML設(shè)備上運行的人工智能模型正在幫助馬來西亞的清理工作快速對阻礙紅樹林生長的不同類型垃圾進行分類。將鼠標(biāo)懸停在圖片上可突出顯示識別出的物體。
諾丁的工作延伸到馬來西亞東部的塔西奇尼湖(Tasik Chini Lake),該湖為當(dāng)?shù)赝林鐓^(qū)提供飲用水和魚類。Nordin部署了太陽能水質(zhì)傳感器來檢測湖中的污染情況,并將信息發(fā)送到tinyML設(shè)備上,人工智能模型利用這些信息對水質(zhì)進行預(yù)測。諾丁說:如果我們能讓社區(qū)獲取水質(zhì)數(shù)據(jù),他們就能了解自己飲用的水是否安全。
該湖缺乏向研究人員傳輸數(shù)據(jù)所需的互聯(lián)網(wǎng)和手機連接。為了避免前往每個設(shè)備并手動下載數(shù)據(jù),Nordin不得不隨機應(yīng)變。他求助于LoRa(一種遠(yuǎn)距離無線傳輸協(xié)議),與WiFi相比,耗電量和帶寬都相對較小,而且可以在數(shù)十公里的范圍內(nèi)工作。
其他tinyML研究人員也在研究用同樣的系統(tǒng)將農(nóng)業(yè)用tinyML設(shè)備的數(shù)據(jù)發(fā)送到農(nóng)民的電腦或手機上。阿波美?卡拉維大學(xué)(University of Abomey Calavi)計算機科學(xué)專業(yè)博士生詹姆斯?阿多拉(James Adeola)說:如果沒有遠(yuǎn)程下載數(shù)據(jù)的方法,農(nóng)民就必須翻閱所有這些設(shè)備;這既費時又乏味。如果這個解決方案能夠?qū)嵤r(nóng)民們將會非常高興。
四、tinyML的發(fā)展與挑戰(zhàn)
雖然tinyML設(shè)備看似簡單,但開發(fā)起來卻是一項挑戰(zhàn)。首先,它需要多種技能的專業(yè)知識。它結(jié)合了硬件、軟件和機器學(xué)習(xí),Basikolo說。很少有人能做到這一切,因此將所有這些技能結(jié)合起來也需要時間。
研究人員正試圖通過在摩洛哥、巴西、尼日利亞、南非、盧旺達、馬來西亞和全球南部的其他國家開辦微型機器學(xué)習(xí)課程和研討會來傳播這些專業(yè)知識。例如,2021年,哈佛大學(xué)和阿卜杜勒?薩拉姆國際理論物理中心啟動了tinyML促進發(fā)展學(xué)術(shù)網(wǎng)絡(luò),目前該網(wǎng)絡(luò)已覆蓋全球南部的50個學(xué)術(shù)機構(gòu)。包括澤納羅和哈佛大學(xué)計算機科學(xué)家維賈伊?賈納帕?雷迪(Vijay Janapa Reddi)在內(nèi)的組織者首先向合作機構(gòu)捐贈了tinyML工具包。Zennaro說:當(dāng)我們啟動這項計劃時,我們發(fā)現(xiàn)主要問題是如何把硬件送到人們手中,因為在美國,低成本的硬件在其他地方可能仍然很昂貴。
巴西研討會的一名與會者正在研究一種用于在田間檢測蚊子的微小ML設(shè)備。
在馬來西亞、沙特阿拉伯和其他國家的大學(xué)里,學(xué)生們利用這些工具包進行了培訓(xùn)。只需一兩個小時,學(xué)生們就能訓(xùn)練tinyML設(shè)備識別當(dāng)?shù)卣Z言的單詞和短語,“這對社區(qū)來說很有幫助,”Zennaro說。
從本質(zhì)上講,tinyML的功能是有限的。山下說:我認(rèn)為tinyML非常擅長解決微小的問題。運行這些設(shè)備的微控制器的內(nèi)存和計算能力極其有限,這使它們更適合高度特定的任務(wù),而不是通用的商業(yè)產(chǎn)品。一個設(shè)備可以很好地識別一種語言中的單詞或識別一種植物物種的病害,但它不太可能成為通用翻譯器或識別所有植物的病害。
然而,包括蘋果和微軟在內(nèi)的全球北方許多科技公司正在意識到直接在設(shè)備上運行的小型模型的吸引力。對于某些應(yīng)用,比如在麥當(dāng)勞點餐,可以在本地設(shè)備上而不是云端運行的專門的微小語言模型,成本和功耗都更低,可能比運行昂貴的通用語言模型更有優(yōu)勢。
與此同時,微型機器學(xué)習(xí)設(shè)備本身也在迅速變得更加強大。TinyML開放教育計劃成員、電子工程師彼得?英(Peter Ing)說,就在幾年前,在微控制器上運行先進的機器學(xué)習(xí)模型還被認(rèn)為是“荒謬的”。Warden已經(jīng)讓一個簡單的大語言模型在設(shè)備上運行,而這個設(shè)備的成本和功耗只比tinyML設(shè)備稍高一些。他設(shè)想將有更多的大人工智能模型遷移到這些更小、更省電的設(shè)備上,而不是僅僅依賴數(shù)據(jù)中心。
與此同時,隨著微控制器不斷變得更便宜、更強大,最簡單的tinyML設(shè)備可能會變得更加普遍,有些微控制器已經(jīng)被開發(fā)出來專門用于運行人工智能。雷迪說:它剛剛達到一個成熟點,我們現(xiàn)在看到的是可以商業(yè)化的解決方案和技術(shù)。他開設(shè)了一個關(guān)于tinyML的免費在線課程,并撰寫了一本關(guān)于tinyML的開源書籍。盡管每個tinyML設(shè)備可能相對較小且專業(yè),但許多這樣的設(shè)備相互對話,可以幫助解決更大、更復(fù)雜的任務(wù)。
免責(zé)聲明:本文轉(zhuǎn)自啟元洞見。文章內(nèi)容系原作者個人觀點,本公眾號編譯/轉(zhuǎn)載僅為分享、傳達不同觀點,如有任何異議,歡迎聯(lián)系我們!
轉(zhuǎn)自丨啟元洞見
研究所簡介
國際技術(shù)經(jīng)濟研究所(IITE)成立于1985年11月,是隸屬于國務(wù)院發(fā)展研究中心的非營利性研究機構(gòu),主要職能是研究我國經(jīng)濟、科技社會發(fā)展中的重大政策性、戰(zhàn)略性、前瞻性問題,跟蹤和分析世界科技、經(jīng)濟發(fā)展態(tài)勢,為中央和有關(guān)部委提供決策咨詢服務(wù)。“全球技術(shù)地圖”為國際技術(shù)經(jīng)濟研究所官方微信賬號,致力于向公眾傳遞前沿技術(shù)資訊和科技創(chuàng)新洞見。
地址:北京市海淀區(qū)小南莊20號樓A座
電話:010-82635522
微信:iite_er
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.