99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

亞馬遜搜索“寶藏團隊”利用深度學習賦能業務發展

0
分享至

在亞馬遜,有這樣一支負責搜索的團隊正在利用深度學習技術幫助公司內各個團隊從數據中獲取智能。它就是M5搜索團隊,正在構建大模型以支持亞馬遜的機器學習(ML)應用程序。



借助亞馬遜云科技的服務,M5搜索團隊能夠運行數百億參數模型的深度學習實驗。M5搜索團隊使用多種亞馬遜云科技服務構建、訓練和部署多模態的大型機器學習模型。

如今,M5搜索團隊整合了數據,簡化了創建大模型的過程,亞馬遜各個團隊都可以使用這些模型,為他們的機器學習應用程序帶來深度學習的強大能力。

01.利用深度學習賦能亞馬遜各團隊

作為一家擁有超過160萬員工的跨國科技公司,亞馬遜由許多不同的團隊組成,各團隊的業務重點和優先事項也都不盡相同。其中,亞馬遜搜索致力于開發產品和服務以提高亞馬遜網站上的終端用戶體驗。亞馬遜搜索應用科學和工程負責人Belinda Zeng表示:“亞馬遜搜索是連接不同產品的橋梁,能在不同產品中建立協同,助力業務發展。為了解釋豐富的數據集信息,我們構建了預訓練模型,從而利用深度學習來增強亞馬遜的搜索功能。”

M5搜索團隊負責亞馬遜的發現式學習策略,并構建多模態大模型,支持多語言、多實體和多任務。本質上很多工作是實驗性的。團隊需要能夠快速擴展實驗,并迅速進入生產階段,同時訓練數千個模型,每個模型都擁有超過2億參數,以及在亞馬遜云科技上有效地擴展基礎設施。要實現這些并不容易,因此M5搜索團隊在基礎設施解決方案中使用了Amazon EC2,該服務能夠為幾乎全部工作負載提供安全且可調整的計算容量。亞馬遜搜索首席工程師Rejith Joseph表示:“我們選擇Amazon EC2是因為它提供了海量最新硬件資源,且資源可輕松獲取。”此外,M5搜索團隊需要存儲許多大型數據集,每個數據集都有數百TB。他們利用Amazon S3處理存儲需求。Amazon S3作為對象存儲服務,具有行業領先的可擴展性、數據可用性、安全性和高性能。

02.每月擴展到數千個訓練任務

在2020年第四季度,M5搜索團隊開始使用亞馬遜云科技服務構建、訓練和部署其機器學習模型。截至2022年,團隊使用各種亞馬遜云科技服務,每月擴展至數千個訓練任務,涉及大量GPU集群上的PB級數據。除了使用Amazon S3進行數據存儲之外,M5搜索團隊還使用了Amazon FSx,在云中輕松啟動、運行和擴展功能豐富且性能優越的文件系統。該團隊還使用了全托管的批處理服務Amazon Batch,可在任何規模下高效運行批處理計算作業。亞馬遜搜索工程經理Roshan Makhijani表示:“通過廣泛使用Amazon FSx、Amazon EC2和Amazon Batch的服務,我們提高了實驗速度。在亞馬遜云科技上進行構建非常靈活,我們在不到3天的時間里就可以擴展到新區域,只要新區域有硬件可用。”

從一開始,M5搜索團隊就與亞馬遜云科技的產品團隊合作解決公司的棘手問題。例如,數據密集型訓練作業需要海量計算資源,使用跨區域計算是訪問這些資源的必要手段,但以前沒有實際解決方案能靈活實現跨區域計算。Belinda Zeng表示:“我們與亞馬遜云科技緊密合作,開發了一些新功能,實現了跨區域計算,成功解決了這一難題。”此外,團隊不斷增長的數據需求日益挑戰Amazon FSx的極限。通過與亞馬遜云科技合作,M5搜索團隊解決了所有性能問題,并為持續擴展打下了基礎。正是由于這些增強功能,M5搜索團隊現在僅需1-2周就可以擴展機器學習基礎設施。

團隊還使用C++庫開發了一種自定義解決方案,以建立跨流媒體的Amazon S3——即在一個區域存儲數據并在另一個區域進行流式數據傳輸——而不影響訓練作業的速度。Makhijani表示:“使用Amazon S3,我們實現了我們需要的高吞吐量流媒體解決方案。” 通過選擇最優的GPU、CPU以及亞馬遜云科技自研設計的高性能機器學習推理芯片Amazon Inferentia,M5搜索團隊成功在機器學習推理過程中降低成本并優化性能。Joseph表示:“不同模型在不同硬件上能提供的吞吐量有所不同,因此,硬件的選擇可以幫助我們擴展模型架構,并針對多種類型的硬件進行優化,同時控制成本。”此外,團隊在EC2 UltraClusters中部署了Amazon EC2 P4d實例,這些實例由云端高性能計算、網絡和云存儲構成,以獲得最佳的計算和通信吞吐量。亞馬遜云科技深度學習AMI和深度學習容器提供了優化且安全的機器學習框架和工具,使機器學習從業者能夠在云上加速深度學習,從而簡化了EC2實例的配置和部署,并實現了擴展。在解決方案中,團隊還使用了Amazon EC2實例的網絡接口Elastic Fabric Adapter(EFA),客戶可以借此在亞馬遜云科技上大規模運行需要高度跨節點通信的應用程序。

此外,M5搜索團隊在亞馬遜云科技上使用開源深度學習框架PyTorch,用以簡化機器學習模型開發并將模型部署到生產中。具體而言,團隊試驗了多種PyTorch庫,如分布式數據并行和Amazon S3插件,以及PyTorch Profiler和完全分片數據并行等工具進行分布式訓練。如今,亞馬遜各部門都可以利用深度學習的強大功能,以上能力的運用幾乎無所不在。例如,M5搜索團隊開發了一種機器學習模型,能夠準確更正客戶在搜索過程中的拼寫錯誤,從而改善搜索體驗。Zeng表示:“機器學習應用能夠幫助系統準確解讀客戶的真實意圖,并提供多樣化的相關推薦列表,這些功能都得益于我們預訓練模型中豐富而細致的信息。”

03.持續提升效率

亞馬遜搜索現在已經擁有了大規模構建機器學習模型的技術。下一步,團隊計劃持續改進其全球集群以提高生產力和使用效率。團隊還將使用新的Amazon EC2實例匹配不同的模型,既用于訓練,也用于推理。M5搜索團隊將繼續與亞馬遜云科技合作,優化其基礎設施的彈性,提高生產力,并降低訓練大型模型的前置成本。Joseph表示:“通過使用亞馬遜云科技持續提升效率,我們可以釋放深度學習和人工智能的無限潛能,最終讓我們的客戶從中受益。”

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
打起來了,巴鐵向印軍猛烈開火,巴鐵有多少中國武器:能不能打贏

打起來了,巴鐵向印軍猛烈開火,巴鐵有多少中國武器:能不能打贏

暖心的小屋
2025-04-26 10:17:48
TA官宣!曼聯不簽大牌!打造平民球隊!中小球隊2核心要下樹

TA官宣!曼聯不簽大牌!打造平民球隊!中小球隊2核心要下樹

卡靈頓分析師
2025-04-26 11:58:29
A股:預判還對!所有人都注意了,下周準備開啟降落傘了!

A股:預判還對!所有人都注意了,下周準備開啟降落傘了!

春江財富
2025-04-26 08:48:23
58歲劉嘉玲晨跑引爭議:穿緊身褲不遮臀部,被網友點評“沒一點老人樣”

58歲劉嘉玲晨跑引爭議:穿緊身褲不遮臀部,被網友點評“沒一點老人樣”

LadyDaily
2025-03-15 18:07:56
剛剛 | 天津預警升級!今9級大風+雷暴+降雨!

剛剛 | 天津預警升級!今9級大風+雷暴+降雨!

天津廣播
2025-04-26 09:53:04
愛德華茲談詹姆斯今日表現:簡直不可思議,能和他同場競技絕對是一種享受

愛德華茲談詹姆斯今日表現:簡直不可思議,能和他同場競技絕對是一種享受

雷速體育
2025-04-26 14:06:14
不可思議!被中國用核武器轟炸45次的羅布泊,現在變成這樣了!

不可思議!被中國用核武器轟炸45次的羅布泊,現在變成這樣了!

今日養生之道
2025-04-25 10:29:45
確認遇難!遺體已被發現,腳上綁有啞鈴......

確認遇難!遺體已被發現,腳上綁有啞鈴......

青城之窗
2025-04-25 06:04:58
于正回應多名藝人退圈:優勝劣汰,這是一個好事情

于正回應多名藝人退圈:優勝劣汰,這是一個好事情

魯中晨報
2025-04-25 17:04:08
方昊:哥哥正在經歷病痛的折磨,希望他早日戰勝病魔

方昊:哥哥正在經歷病痛的折磨,希望他早日戰勝病魔

直播吧
2025-04-25 22:08:16
董明珠攤上事了!間諜論持續升級,官媒點名狠批,胡錫進要求道歉

董明珠攤上事了!間諜論持續升級,官媒點名狠批,胡錫進要求道歉

二向箔
2025-04-25 14:53:38
2025紅土首秀出局!鄭欽文0-2遭遇一輪游,追平馬德里站最差戰績

2025紅土首秀出局!鄭欽文0-2遭遇一輪游,追平馬德里站最差戰績

侃球熊弟
2025-04-25 21:58:12
不到24小時超百萬播放!合肥六中神秘家長引爆全網

不到24小時超百萬播放!合肥六中神秘家長引爆全網

萬民說
2025-04-26 09:43:02
國民黨今上凱道,目標逾10萬人怒吼“戰獨裁”,馬英九韓國瑜將出席

國民黨今上凱道,目標逾10萬人怒吼“戰獨裁”,馬英九韓國瑜將出席

海峽導報社
2025-04-26 08:14:56
俄本土最后一戰,烏軍死守高地拒絕投降,俄3噸級炸彈炸平山頭

俄本土最后一戰,烏軍死守高地拒絕投降,俄3噸級炸彈炸平山頭

龍炎校尉
2025-04-25 11:28:17
真是天佑中華!中美博弈的關鍵時刻,中國又傳來重大喜訊!

真是天佑中華!中美博弈的關鍵時刻,中國又傳來重大喜訊!

洞悉評說
2025-04-25 15:29:07
世錦賽決出首位八強!中國名將8-8世界冠軍,趙心童連勝三局5-3反超

世錦賽決出首位八強!中國名將8-8世界冠軍,趙心童連勝三局5-3反超

慢歌輕步謠
2025-04-26 14:41:59
胡琳娜:是丁嘉麗的女兒,在沒有愛的環境里帶淚成長37歲仍未婚

胡琳娜:是丁嘉麗的女兒,在沒有愛的環境里帶淚成長37歲仍未婚

品茗賞娛
2025-04-25 19:50:07
皮爾斯:勇士奪冠窗口已關閉 因為巴特勒復出也不是100%狀態

皮爾斯:勇士奪冠窗口已關閉 因為巴特勒復出也不是100%狀態

直播吧
2025-04-26 06:40:10
飛象網項立剛:用人標準是企業自己的選擇,董明珠不用“海歸派”不是什么歧視!格力需要的人才,海歸的不多

飛象網項立剛:用人標準是企業自己的選擇,董明珠不用“海歸派”不是什么歧視!格力需要的人才,海歸的不多

和訊網
2025-04-25 16:52:40
2025-04-26 15:31:00
紫竹商業評論 incentive-icons
紫竹商業評論
科技金融消費體驗,行業觀察
376文章數 1038關注度
往期回顧 全部

科技要聞

李斌:對蔚來公司四季度盈利非常有信心

頭條要聞

巴基斯坦防長:我們曾給西方"干臟活" 為此付出了代價

頭條要聞

巴基斯坦防長:我們曾給西方"干臟活" 為此付出了代價

體育要聞

去更大的舞臺追夢 專訪中國男籃國手楊瀚森

娛樂要聞

金掃帚獎出爐,包貝爾意外獲“影帝”

財經要聞

韓國的"宇樹科技" 是怎樣被財閥毀掉的?

汽車要聞

充電5分鐘續航100公里 探訪華為兆瓦超充站

態度原創

本地
親子
房產
公開課
軍事航空

本地新聞

云游湖北 | 漢川文旅新體驗:千年陶藝邂逅湖光

親子要聞

孩子的教育要正確,家長和老師共同配合

房產要聞

逆勢大幅漲價!最高2.8萬/平!長天雲汀開盤又賣爆了!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

印巴交火 從“斷水”到“反制”

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 吉林市| 富蕴县| 平塘县| 扎兰屯市| 河北省| 望谟县| 商南县| 金平| 四川省| 芜湖县| 万载县| 鲁山县| 九寨沟县| 沙河市| 昭苏县| 水富县| 关岭| 崇州市| 兴国县| 图们市| 徐州市| 任丘市| 荆门市| 象山县| 顺义区| 麦盖提县| 老河口市| 永春县| 农安县| 苍溪县| 深水埗区| 湟中县| 定结县| 黑河市| 闸北区| 云安县| 台安县| 黑龙江省| 桐梓县| 元朗区| 富蕴县|