99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

存儲優化是 AI 算力瓶頸的破局之道嗎?

0
分享至


作者 | QCon 全球軟件開發大會

策劃 | Kitty

編輯 | 宇琪

大數據技術的飛速發展,揭開了基于海量數據實現深度分析與科學決策的新篇章,而以大語言模型為代表的人工智能技術的崛起,正以前所未有的速度推動大數據分析變得更具洞察力。那么,大模型訓練中數據存儲 IO 的瓶頸問題應該如何突破?數據智能新范式又是什么樣的呢?

近日 InfoQ《極客有約》X QCon 直播欄目特別邀請了大數據技術領域的資深專家趙健博擔任主持人,和北銀金科大數據開發部總經理助理李俊焱融科技 CTO張文濤數勢科技 AI 負責人李飛一起Qcon 全球軟件開發大會2025 北京站即將召開之際,共同探討 AI 算力瓶頸如何破局。

部分精彩觀點如下:

  • 大模型的出現,讓人和機器之間的交互界面逐漸消失,并使得 AI 應用呈現井噴式增長。

  • 固定的計算任務適合下沉到存儲層,而對于更復雜通用的計算任務,下沉可能會帶來復雜性和穩定性問題。

  • AI 訓練中的存儲需求需要實現的目標是,高吞吐和低延遲的數據訪問,同時確保 GPU 的算力得到充分利用。

  • 分布式存儲在架構設計上更靈活,而集中存儲在不同知識庫之間數據共享更便捷。

  • AI 的到來是為了提升我們的工作效率,而不是取代人。

在 4 月 10-12 日將于北京舉辦的 Qcon 全球軟件開發大會 上,我們特別設置了【AI 引領數據分析進化】專題。該專題將探討 AI 賦能大數據分析與決策的核心技術,以及各行業領先企業的創新實踐。期待聽眾能夠洞悉 AI 在數據分析領域的前沿動態,并將這些新技術化為推動自身企業發展的強大助力。
查看大會日程解鎖更多精彩內容:https://qcon.infoq.cn/2025/beijing/track

以下內容基于直播速記整理,經 InfoQ 刪減。

趙健博:AI 賦能的數據分析在多個領域不斷取得突破。那么,AI 給哪些具體場景下帶來了變化,以及 AI 究竟是如何實現這些變革的呢?它又為我們帶來了哪些新的機遇和挑戰?

李俊:隨著人工智能,尤其是今年以來 DeepSeek 技術的發展,銀行從業者的工作效率和能力得到了顯著提升。首先是信貸審批,利用大模型撰寫盡調報告,節省了至少 30% 的人工時間。其次是智能客服,通過大模型生成對話話術并結合情感分析,優化客戶體驗。第三是在合同審查,AI 自動識別合同條款,結合外部數據防范信貸風險,提升了 20% 以上的預警響應速度。最后是數據分析,我們推出了水晶球 Chat BI 工具,與指標引擎結合,降低了數據分析門檻,讓每個人都能輕松使用。

然而,我們也面臨一些挑戰。首先是數據安全,大模型可能繞過權限,訪問敏感數據。其次是大模型的“幻覺”問題,生成虛假信息可能導致用戶信任危機。最后是人才轉型的壓力,需要培養既懂業務又懂 AI 的復合型人才,同時幫助傳統員工適應新技術。

張文濤:第一個是自動駕駛,尤其是在 2022 年,自動駕駛技術蓬勃發展,AI 在其中的應用逐漸成熟。到了 2023 年和 2024 年,許多自動駕駛車型已經變得相對成熟,效果也越來越好。另一個是私募量化,這個行業對 AI 的應用非常廣泛,特別是通過 AI 根據特定算法進行訓練和模擬交易。其效果已逐漸顯現,許多股民在這個過程中被“割了韭菜”,這正是 AI 在小型量化投資領域的體現。

從存儲的角度來看,這兩個行業的挑戰在于對算法和數據的高要求,特別是數據質量。在私募量化領域,歷史數據至關重要,只有通過高質量的歷史數據,才能進行模擬分析并預測未來市場趨勢。因此,如何處理原始數據并從中提取有效因子,成為關鍵。最終,AI 模型的訓練對存儲提出了更高要求。

李飛:前段時間,谷歌剛開源了 AlexNet 的代碼,我相信大部分人其實都挺有感慨的,因為 AlexNex 對深度學習的發展具有里程碑意義。其實,深度學習很早就被提出來了,但直到 2006 年,通過反向傳播算法的提出,才逐漸讓落地成為可能性。在大模型出現之前,AI 雖然發展迅速,但多聚焦于小場景應用,如自然語言處理使用 RNN、LSTM,圖像識別用 CNN 等。然而,AI 的泛化能力一直未得到充分保障,也缺乏與人類最自然的交互方式。

大模型的出現,讓人和機器之間的交互障礙逐漸消失,變得更加自然和流暢,并使得 AI 應用呈現井噴式增長。交互界面的簡化降低了理解和使用成本,極大擴展了應用場景。近兩年,AI 在編程和分析等領域的應用廣泛,尤其是 AI 編程,它降低了用戶寫代碼的門檻,可以通過自然語言生成代碼,減少了人與機器之間的復雜交互。智能分析作為一個高門檻的應用,過去我們需要用 Excel 或專業軟件進行數據分析,技術要求較高,但現在,借助 AI,只需簡單的指令就能完成復雜的任務。這將大大降低分析的門檻,使得更多人能夠輕松完成高階分析任務。

趙健博:傳統的數據預處理通常在計算層完成,但隨著分布式存儲技術的發展,越來越多的聲音開始探討將數據預處理下沉到存儲層的可能性。那么,這種做法究竟是性能提升的捷徑,還是架構復雜性的陷阱呢?

李飛:將數據預處理和計算下放到存儲層,實際上是實現存算一體化或者說存算協同。傳統模式下,數據需要從存儲層傳輸到計算層,然后進行處理,這會涉及大量的網絡 I/O、序列化和反序列化操作。如果計算下放到存儲層,數據移動的開銷將大大減少。存儲層本身具備分布式特性,能夠增強并行處理能力,例如通過分片策略實現并行預處理,從而提升性能。此外,新型存儲系統和硬件,如全閃存分布式存儲,能夠提供較高帶寬,進一步加速計算過程。

但也有弊端,首先,存儲層同時承擔存取和計算任務,可能導致資源競爭,如何設計有效的路由和調度策略是一個挑戰。其次,數據一致性問題。存儲層缺乏像傳統計算層中的容錯機制,可能導致數據丟失或重復,這對分布式事務處理構成挑戰。此外,將計算和存儲能力下放到同一層,可能會增加開發和運維的復雜度和成本。

所以,必須根據場景進行權衡。例如,在 AI 高頻場景中,像 KB 緩存管理等,存儲層能夠直接過濾無效數據,減輕計算層負擔。此外,對于實時性要求較高的場景,比如銀行的交易數據預處理,存算一體化也是一種有效的解決方案。對于結果一致性要求極高的場景,或是涉及復雜計算任務的場景,如多表關聯和 ETL 等,存儲層的計算能力可能無法滿足需求。這類場景下,我們應根據具體需求謹慎選擇是否下放計算到存儲層。

李俊:將數據預處理下放到存儲層,可以提高性能,但也會帶來架構上的復雜性挑戰。首先,這種方式可以在數據讀取時直接獲取預處理后的數據,減少傳輸到應用層或計算層的延遲,是一種“以空間換時間”的方法。例如,在進行多維分析時,可能采用這種技術。

然而,這也增加了系統設計的復雜性,尤其是在硬件和數據鏈路設計方面。數據預處理下沉到存儲層要求系統具備強大的計算能力,并支持預處理操作。同時,數據鏈路需要加入處理調度、校驗、備份和恢復機制,這對系統設計提出了更高要求。

適合下沉存儲層的數據預處理的場景需要靈活處理和優化的數據分析,尤其是多維分析和熱點數據訪問。例如,使用維度減少技術處理頻繁訪問的熱點數據。在這些場景下,存儲層處理可以有效提高效率。

張文濤:將存儲分為專有存儲和通用存儲兩類,對于專有存儲,卸載計算任務到存儲層是可行的,在提升性能的同時還不會增加架構復雜度。在專有存儲中,我們可以構建極簡架構,專注于 AI 訓練和推理的存儲功能。DeepSeek 開源的 3FS 就是一個典型的專有存儲案例。

然而,如果是面向通用存儲的廠商,比如我們這樣的第三方存儲公司,情況就不同了。我們服務的用戶涉及多種業務,不僅限于某一特定業務。此時將計算下沉到存儲層會增加架構復雜度,因為存儲協議通常是通用的,我們需要在專有協議和通用協議之間找到平衡。

此外,存儲中的計算資源原本是為了應對峰值負載而預留的。如果將計算任務卸載到存儲層,可能會影響存儲性能。不過,解決方案也是存在的。比如,存儲設備可以將計算任務轉移到硬件中處理,如通過讀卡或專用的計算單元(DPU)來加速計算。盡管如此,如果存儲廠商不做這些工作,其他廠商就會先行一步,可能會形成行業壁壘。

因此,我們在設計架構時,必須謹慎考慮如何解耦專有計算能力。雖然不可能一個存儲架構解決所有問題,但我們必須在架構設計上做出選擇,這些選擇通常是為了實現戰略目標而做出的妥協。因此,是否進行計算下沉,如何選擇架構設計,最終取決于用戶的戰略方向。

趙健博:技術設計的最終決定往往依賴于業務需求發展的方向。關于計算下沉的技術已經提出一段時間了,并非特別新的概念。在大數據實時處理業務中,通常是從 Kafka 中獲取數據進行處理,然而受限于 kafka 的行存儲模式,在某些場景中不得不在客戶端進行過濾,這不僅浪費計資源還帶來了延遲的代價,所以針對這樣的場景,計算(過濾)下沉到 kafka 通常是比較好的選擇。

從通用方面看,我認為一些固定的計算任務,如壓縮、加密、過濾等,適合下沉到存儲層處理。而對于更復雜、更通用的計算,通常還是保持在計算層比較合適。此外,計算下沉到存儲層,但還可能會帶來穩定性問題。例如,大規模的數據掃描如果下沉到存儲層,可能會導致存儲服務節點過載;而同樣的作業在計算層,可以做到隔離,且隨時可以取消任務,這樣可以更靈活地進行控制。

趙健博:在深度學習領域中,數據是基礎,算力是引擎。訓練一個模型需要大量的數據和算力,并且需要反復迭代和驗證才能得到想要的模型。為了提升訓練效率,縮短訓練時間,所有組件之間都需要快速響應,這其中就包括了計算和存儲之間的交互。對于一個 AI 系統而言,模型的能力隨著模型尺寸和訓練數據的增加而顯著提升,但隨著數據集和模型規模不斷增加,訓練任務加載訓練數據所消耗的時間越來越長,進而影響了訓練效率,緩慢的 IO 嚴重拖累了 GPU 的強大算力。那么,在這樣的背景下,大模型訓練場景對分布式存儲提出了哪些新的性能挑戰?

張文濤:在多模態場景下,文件的數量急劇增加,面臨的挑戰主要是存儲系統能否容納如此大量的文件。因此,存儲的訪問性能也是一個挑戰,尤其是當文件較小時,數據訪問的開銷會顯著增加。第二種挑戰是數據集的隨機訪問。數據集的訪問通常是隨機的,且需要讀取整個數據集,這種訪問方式打破了緩存,導致緩存效率低下。

第三個挑戰是 checkpoint 操作。每隔一段時間,訓練模型會進行 checkpoint 保存,這個過程涉及同步寫操作,GPU 會暫停,直到寫入完成。這會增加存儲的開銷,并導致 GPU 空閑時間過長,降低計算效率。盡管異步寫操作能在一定程度上解決這個問題,但依然是存儲的挑戰。

還有計算節點方面,數據通常從 GPU 顯存傳輸到 CPU 內存,再到存儲,這個數據鏈路在數據量較小的情況下,內存拷貝問題不會凸顯,但數據量較大時,內存拷貝的開銷非常明顯,成為性能瓶頸。當單節點的數據需求很大時,例如每秒傳輸 80GB 或 150GB 數據,內存帶寬的限制會非常明顯。此外,大數據集的訪問容易導致緩存擊穿,緩存失效時,延遲會急劇增加,影響性能。

最后是網絡層面。傳統以太網的延遲較高,相比于 RDMA 網絡,延遲可能大兩到三倍。由于計算集群的規模通常大于存儲集群,計算節點可能同時向多個存儲節點請求數據,這種情況可能會導致網絡擁塞,尤其是在高速無損網絡環境下,這個問題更加明顯。

李俊:金融行業,在構建知識庫時面臨類似的取舍問題。分布式存儲雖然在架構設計上更靈活,但確實也面臨性能上的挑戰。而集中存儲的優勢在于不同知識庫之間數據共享更便捷。如何在這兩者之間找到平衡,是我們面臨的一個難題。

零售數據訓練時,我們會處理 PB 級別的數據集。數據讀取的吞吐量要求非常高,因此分布式存儲系統必須進行橫向擴展,通過多節點來提升帶寬。在大規模的分布式訓練中,數百甚至數千個計算節點可能同時訪問存儲系統,這會極大增加源數據服務的壓力。面對高并發,我們需要將源數據服務進行分布式化,避免單點瓶頸。

此外,訓練數據通常包含大量的小文件,如文本、圖片等樣本數據。傳統的分布式文件系統在處理小文件的讀寫時效率較低,因此我們需要對這些小文件進行合并處理,將其轉化為較大的對象。這一過程帶來了額外的工作負擔,進一步增加了性能挑戰。

李飛:大模型訓練的特性對訓練數據,尤其是海量數據,有著高要求。現在的大模型多采用自回歸的網絡結構,這對海量數據集有頻繁的順序讀取需求。盡管單次讀取的數據量較大,但在千卡或萬卡集群規模下,集群擴大將增加對 IOPS(每秒輸入輸出操作)的需求。

在大模型訓練中,checkpoint 保存是必須的,它可以在訓練出錯時進行回滾,確保模型的持續訓練。這一過程需要顯存到存儲系統的高帶寬寫入。特別是現在模型的參數量越來越大,甚至達到萬億級別,對存儲系統的寫緩存容量和吞吐量提出了更高要求。如果存儲系統無法提供足夠的提升,可能會導致訓練時間延長,從而增加訓練中斷的時間。

在推理階段,我們需要高效地將模型分發到 GPU 資源池。這要求存儲系統具有較強的高讀取緩存能力,并且網絡帶寬的性能要求也相對較高。為了優化這一過程,可以采用顯存、內存和存儲的分層緩存策略,減少數據訪問延遲,提高推理效率。

趙健博:針對 AI 訓練中的存儲需求,我認為需要實現的目標是高吞吐和低延遲的數據訪問,同時確保 GPU 的算力得到充分利用。GPU 算力停頓的幾個問題點如下:首先,在模型訓練中,checkpoint 的保存過程會導致計算停頓,直接影響 GPU 算力的釋放時間。其次,訓練過程中涉及大量小文件的加載,頻繁且大規模小文件訪問會導致 IO 路徑上出現瓶頸,導致計算停頓。第三,訓練過程中還會有大量的網絡交互,特別是在訓練作業進行參數同步時,網絡的 IO 瓶頸也會導致計算停頓。因此,如何從這些問題入手,解決瓶頸,優化存儲系統的整體性能,是我們面臨的核心挑戰。

趙健博:大模型訓練需要大量的數據和強大的算力,而存儲系統在其中扮演著至關重要的角色。隨著數據集和模型規模的不斷增加,訓練任務加載訓練數據所消耗的時間越來越長,進而影響了訓練效率。那么,如何優化計算和存儲之間的交互,以提升訓練效率和縮短訓練時間呢?

李俊:第一,利用分布式存儲系統。通過將數據分布在多個節點上,這種系統能夠提供高并發、高存儲量的訪問,同時具備數據冗余和容錯能力,從而增強系統的可靠性。第二,采用數據預取技術。這基于大模型訓練的數據訪問模式,通過智能預測算法,提前加載數據,減少 IO 等待時間。第三,采用數據并行和模型并行。在大模型訓練中,我們將訓練數據和模型分布到不同的計算節點,實現數據和模型的并行。這不僅提升計算效率,還優化存儲交互,從而減輕單個節點的存儲壓力。

李飛:對于 AI,特別是算法來說,訓練數據的預處理非常關鍵。例如,將訓練數據轉換為像 TF record 這樣的格式,是為了將多個小文件聚合成一個大的順序文件。這樣做的目的是優化數據的讀取方式,將隨機讀取轉化為順序讀取,從而減輕存儲系統的壓力。

另外,通過多節點并行寫入大模型文件,如 checkpoint 數據。清華大學和華為合作開發的高性能存儲系統大大降低了 checkpoint 的寫入時間,從小時級縮短到了分鐘級。這一優化在大模型訓練過程中,對存儲與計算之間的交互起到了重要作用,有助于提高訓練效率。

張文濤:計算和存儲之間的交互本質上是從 A 到 B 的數據傳輸,關鍵在于數據傳輸的速度是否足夠快。從存儲角度看,網絡必須是高速網絡。如果網絡本身存在瓶頸,那么無論如何優化效果也會受限。目前一般采用 200G 或 400G 的 InfiniBand 網絡,或 RoCE 網絡,確保網絡層面的高速傳輸。

此外,還需要提升存儲集群的整體性能,可以通過兩種方式實現:第一是橫向擴展(scale-out),通過擴大集群規模,提供更多的性能。第二是提升單節點的吞吐量和 IOPS(每秒操作數)。例如,使用高速磁盤(如 NVMe)代替 SATA 或 HDD,以提供更高帶寬,減少性能瓶頸。節點帶寬也非常關鍵,使用多網卡配置(如兩張 400G 網卡)可以大幅提升帶寬,從而提升數據傳輸效率。此外,避免跨 NUMA(非統一內存訪問)訪問內存,優化內存和存儲之間的數據傳輸,也是提升性能的重要措施。軟件層面,我們需要優化路由策略,采用并行方式減少串行寫入時間。此外,異步隊列和協程的應用也能有效減少存儲系統的負載。

從業務角度來看,主要是元數據的壓力。訪問小文件時,需要先查詢元數據,再打開文件,且訪問完后還需關閉。這些操作消耗了大量時間,因此小文件聚合(如 TFRecord)可以減少元數據訪問,提高效率。英偉達推出的 GPU Direct Storage(GDS)技術,通過繞過 CPU 內存來減少內存拷貝,提高數據訪問的穩定性和效率。業務上,還可以通過批量發送 IO 請求減少網絡連接的負擔,提高存儲系統處理能力。

對于 Checkpoint 的優化,異步是一個重要方向。例如,先將數據寫入 CPU 內存,再異步寫入后端存儲,減少 GPU 的阻塞時間。最后,數據預讀技術也能有效優化 IO 性能。通過預測訪問數據并提前加載,后續訪問轉化為內存訪問,從而顯著提升整體性能。

趙健博:AI 時代的到來對數據工程師提出了更高的要求。傳統的數據處理和分析技能已經不足以應對當前的復雜需求。那么,AI 時代的數據工程師需要哪些新技能?

李飛:我們常說“AI for data”和“data for AI”。前者是通過 AI 來生產或者清洗數據,后者則是將數據與 AI 結合,推動數據分析的發展。從 AI 開發者的角度來看,“AI for data”可以為數據工程師提供技能支持。例如,傳統的數據工程師經常進行數據清洗、ETL(數據提取、轉換和加載)和數據建模等工作。過去,數據開發者可能需要通過統計模型來實現這些工作,而現在,大模型可以大大提升在代碼能力和數學能力方面的表現,幫助快速發現數據中的問題,數據工程師可以利用大模型來提高數據清洗的效率。

此外,大模型也能幫助數據建模,特別是在表與表之間的關聯建模上。傳統上,數據工程師需要通過深入了解企業業務場景來建立這些關系,而大模型可以通過技術手段識別潛在的表關聯,并初步推薦建模思路。這種方式能大大提升工作效率,讓數據工程師能夠集中精力處理更復雜的建模和數據治理任務。隨著大模型在數學和編碼能力上的增強,我們的數據開發者也需要具備相關的思維和技能,更好地將大模型應用于日常工作,從而實現降本增效。

張文濤:對于我們從事 IT 行業的程序員來說,每個人都應該擁抱 AI,擁抱 AI 意味著充分利用其能力來輔助編程。如果我們不擁抱 AI、不借助 AI 進行輔助編程,那么我們的效率提升將會有限,團隊可能會落后。因此,我們要求團隊成員都應當使用 AI 來提升工作效率。當我們簡化了工作流程后,我們可以將更多時間投入到業務學習和理解上。

我認為大模型未來將成為像操作系統一樣的基礎設施,每個人都應了解大模型的基本原理,因為我們將基于這一基礎設施進行業務開發。我們不僅要知道如何使用它,還需要了解其背后的原理,這是我對未來發展的看法。

李俊:AI 時代的到來,使得數據的使用更加方便,特別是對于業務人員。比如我們公司得 Chat BI,它通過對話方式讓用戶直接提取數據并通過圖表展示趨勢和占比。傳統的數據工程師需要寫 SQL、調度任務和使用 BI 工具來配報表,而 AI 時代的到來讓這一切都簡化了。

AI 的到來是為了提升我們的工作效率,而不是取代人。雖然 AI 簡化了許多工作,數據工程師并不會被取代,但他們需要轉型。首先,數據工程師必須在數據和業務之間架起橋梁,既要懂數據,也要懂業務。其次,數據建模能力依然重要,特別是在業務需求的基礎上進行模型設計,AI 短期內仍難以取代這一部分。

其次,隨著 AI 的普及,數據標注的需求大幅增加。尤其是在非結構化或半結構化數據的處理上,像風險分析中的客戶畫像數據,經常是 PDF 或 Excel 文件,需要數據標注師從中提取標簽。數據工程師需要使用專業工具,標準化流程,確保標注的一致性和質量,這也是數據治理的一部分。

第三,數據工程師需要理解算法并與算法團隊緊密協作,數據工程師與算法工程師需要充分理解對方的工作,并共同推動項目進展。AI 時代要求數據工程師不僅僅具備數據處理能力,還要能理解和支持算法的實施。第四,AI 時代的到來帶來了數據權限和安全管理的新挑戰,數據訪問需要嚴格的權限隔離,確保不同層級用戶只能訪問相關數據。因此,數據權限管理和安全問題需要我們在 AI 應用中進一步解決。

最后,未來會使用 AI 的人將會勝過那些不使用 AI 的人。因此,數據工程師需要更多地利用低代碼或無代碼工具,以更高效地滿足業務需求,快速實現業務目標。

趙健博:AI 時代的到來確實給每個工程師帶來了很大的變化,無論是數據工程師還是其他工程師,都必須懂 AI,會用 AI,并將 AI 技術應用到工作中。雖然 AI 提高了工作效率,人的產出能力將得到提升,但要創造更高的價值,仍然需要對業務有深刻的理解。只有理解業務,具備業務洞察力和決策能力,才能真正做出有價值的工作。

從數據工程師或數據分析師的角度來看,工作重點也會發生變化。過去,我們更多關注解釋發生了什么、進行歸因分析,而未來,數據工程師與數據分析師將需要通過預測未來的趨勢,輔助業務做出決策,形成完整的業務決策閉環。這個轉變是數據工程師與數據分析師未來需要適應和發展的方向。

趙健博:在大數據分析中,非結構化數據如評論、日志等占據了數據的絕大部分。這些數據蘊含著豐富的信息,但傳統的分析方法往往難以高效挖掘其價值。那么,大模型技術如何幫助我們提升非結構化數據的挖掘與分析效率?

李飛:AI 大模型給我們帶來的是一種信息分發的新范式,這個信息包括結構化、非結構化的數據,以及從歷史數據中提取的“know-how”知識,大模型的作用在于能夠將這些知識進行有效分發。與過去的搜索引擎和推薦系統不同,大模型通過主動推送信息和工具,幫助我們更高效地獲取所需的內容。因此,信息和知識的分發已成為 AI 的核心價值之一。

在提升非結構化信息處理效率方面,已有許多技術應用,如 RAG 和視頻推薦等。然而,RAG 的實際應用盡管初步落地比較簡單,但要做好卻非常困難。RAG 的核心技術包括召回、增強生成、排序等技巧,但當處理企業內部復雜的、碎片化的信息時,會導致技術難度大大增加。企業內部的文檔可能包含多種形式的數據,如 PDF 文件中的圖像和表格。

此外,如何高效地索引文檔、去除冗余信息,并確保大模型在生成回答時不受到過多冗余信息的干擾,也是技術上的難題。即使使用現有的組件平臺或開源工具,也不能簡單地完成企業內部所有非結構化信息的挖掘工作。此外,語音、文本和圖像的處理單獨進行相對簡單,但如何將不同模態的數據進行有效串聯并進行聯動分析,以滿足用戶的需求,這是非常復雜的。做得好并不容易,尤其是在將 80 分提升到 95 分時,技術細節和優化過程是非常復雜的。

會議推薦

在 AI 大模型重塑軟件開發的時代,我們如何把握變革?如何突破技術邊界?4 月 10-12 日,QCon 全球軟件開發大會· 北京站 邀你共赴 3 天沉浸式學習之約,跳出「技術繭房」,探索前沿科技的無限可能。

本次大會將匯聚頂尖技術專家、創新實踐者,共同探討多行業 AI 落地應用,分享一手實踐經驗,深度參與 DeepSeek 主題圓桌,洞見未來趨勢。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
60票對25票,美參議院表決出爐,中美若爆發沖突,結局難逃8個字

60票對25票,美參議院表決出爐,中美若爆發沖突,結局難逃8個字

獵火照狼山
2025-04-14 13:45:08
一家三口被撞死后續:兇手太囂張,抽著煙指著死者嘲諷:頭太硬了

一家三口被撞死后續:兇手太囂張,抽著煙指著死者嘲諷:頭太硬了

游古史
2025-04-15 22:38:41
新冠變異株加速傳播!高風險人群應警惕新一輪感染潮

新冠變異株加速傳播!高風險人群應警惕新一輪感染潮

瀟湘晨報
2025-04-14 20:09:08
小米這7500mAh新機又是全球首發,賣1799元?

小米這7500mAh新機又是全球首發,賣1799元?

鋒潮評測
2025-04-15 18:22:05
迪拜王儲變女兒奴,出訪時不忘曬二胎嫡女照片,襁褓上的鉆石亮了

迪拜王儲變女兒奴,出訪時不忘曬二胎嫡女照片,襁褓上的鉆石亮了

原廣工業
2025-04-15 11:18:44
長和港口交易出新變化,港澳辦發聲:出賣國家利益,沒有好下場!

長和港口交易出新變化,港澳辦發聲:出賣國家利益,沒有好下場!

近史博覽
2025-04-15 16:44:13
最新!江蘇發病率第一的癌癥是……

最新!江蘇發病率第一的癌癥是……

句容日報
2025-04-15 21:43:11
沖上熱搜的馬拉松“私兔”事件,揭開了社會最現實的一面!

沖上熱搜的馬拉松“私兔”事件,揭開了社會最現實的一面!

知否大叔
2025-04-10 10:06:05
大衣哥前兒媳創業失敗,已從杭州搬回曹縣,婚姻終究不是獲利工具

大衣哥前兒媳創業失敗,已從杭州搬回曹縣,婚姻終究不是獲利工具

阿矗論古今
2025-04-14 16:21:44
受賄2.07億余元,江西省人大常委會原副主任殷美根一審被判死緩

受賄2.07億余元,江西省人大常委會原副主任殷美根一審被判死緩

界面新聞
2025-04-15 17:01:52
貴陽市消防救援支隊原支隊長李世永受審 被指控給25萬元謀求提拔

貴陽市消防救援支隊原支隊長李世永受審 被指控給25萬元謀求提拔

紅星新聞
2025-04-15 20:14:11
美媒曝若尼克斯季后賽失利 錫伯杜或被解雇!他用人過度遭質疑

美媒曝若尼克斯季后賽失利 錫伯杜或被解雇!他用人過度遭質疑

Emily說個球
2025-04-16 03:37:17
新中國第一屆國家領導人名單

新中國第一屆國家領導人名單

天地
2025-04-10 08:22:41
白色冰絲半袖、牛仔短褲、卡其色單肩挎包與白色旅游鞋的精致搭配

白色冰絲半袖、牛仔短褲、卡其色單肩挎包與白色旅游鞋的精致搭配

同學阿允
2025-04-16 01:18:36
全網熱議,美航母遭胡塞重創被迫退役?一覺醒來,美軍終于回應了

全網熱議,美航母遭胡塞重創被迫退役?一覺醒來,美軍終于回應了

獵火照狼山
2025-04-15 13:33:35
北京環球影城主題公園4月13日繼續閉園

北京環球影城主題公園4月13日繼續閉園

上觀新聞
2025-04-12 14:24:07
中越聯合聲明:推動中越跨境標準軌鐵路聯通 盡快開展老河海鐵路可研工作

中越聯合聲明:推動中越跨境標準軌鐵路聯通 盡快開展老河海鐵路可研工作

軌道世界
2025-04-15 22:41:03
58歲鄭伊健低調坐經濟艙,老人味十足,素顏出鏡臉上皺紋密布

58歲鄭伊健低調坐經濟艙,老人味十足,素顏出鏡臉上皺紋密布

農村教育光哥
2025-04-12 10:39:21
世界杯大冷門!王藝迪成國乒首位出局者!下一場4比0獲勝仍無用

世界杯大冷門!王藝迪成國乒首位出局者!下一場4比0獲勝仍無用

曉風說
2025-04-15 18:15:05
黑澤良平曬合照秀兄弟情,阿如那曬老婆秀恩愛,只有林志玲美翻了

黑澤良平曬合照秀兄弟情,阿如那曬老婆秀恩愛,只有林志玲美翻了

墨印齋
2025-04-15 12:25:05
2025-04-16 07:11:00
InfoQ incentive-icons
InfoQ
有內容的技術社區媒體
11017文章數 51223關注度
往期回顧 全部

科技要聞

小鵬汽車MPV車型改款上市,35.98萬起

頭條要聞

中國不理他特朗普破防了 稱中國為"敵對貿易國家"

頭條要聞

中國不理他特朗普破防了 稱中國為"敵對貿易國家"

體育要聞

惡性循環!錫伯杜的壓榨哲學是對是錯?

娛樂要聞

娛樂圈模范夫妻塌房?私生活曝光!

財經要聞

李強:以更大力度促進消費擴大內需

汽車要聞

19.99萬起 廣汽本田P7能在新能源分一杯羹?

態度原創

時尚
游戲
手機
親子
教育

春天穿“韓系少女風”的你,美到離譜!

IGN稱贊NS2磁吸手柄牢固引熱議 網友擔心磁性變弱

手機要聞

直屏黨狂喜!華為Mate80全系將采用直屏+超窄邊框?

親子要聞

寶寶為了吃冰淇淋有多努力,還會提前查看媽媽是否睡著。

教育要聞

剛剛,青島四區義務教育招生政策公布

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 嵊州市| 长治县| 资溪县| 泽库县| 巴林右旗| 绵阳市| 垣曲县| 寿光市| 苍山县| 澄城县| 泰来县| 临高县| 卓尼县| 宾阳县| 顺义区| 乡城县| 安庆市| 银川市| 常州市| 罗江县| 石狮市| 绥棱县| 视频| 喀喇| 江达县| 仪陇县| 微山县| 邹平县| 卢湾区| 邵武市| 义马市| 延吉市| 五大连池市| 绥宁县| 平和县| 库车县| 怀化市| 连云港市| 专栏| 上饶市| 米林县|