企業(yè)數(shù)智化轉(zhuǎn)型的過程是數(shù)據(jù)價(jià)值釋放的過程,數(shù)智世界加速而來,數(shù)據(jù)正在“覺醒”,成為越來越重要的新型生產(chǎn)要素,加速數(shù)據(jù)資產(chǎn)化。
“在AI的推動(dòng)下,數(shù)據(jù)正在經(jīng)歷五大變化:從冷數(shù)據(jù)到溫?cái)?shù)據(jù)的價(jià)值激活,從成本中心到利潤(rùn)中心的變現(xiàn)加快,從向量到張量的檢索精度提升,從10GB/s到100GB/s的讀寫吞吐率提升,從被動(dòng)安全到主動(dòng)安全的安全加固。”在華為中國(guó)合作伙伴大會(huì)2024上,華為數(shù)據(jù)存儲(chǔ)產(chǎn)品線總裁周躍峰如是說。
華為數(shù)據(jù)存儲(chǔ)產(chǎn)品線總裁周躍峰
邁向AI時(shí)代,數(shù)據(jù)的價(jià)值發(fā)生巨大變化,當(dāng)數(shù)據(jù)變成重要的生產(chǎn)要素,這意味著對(duì)數(shù)據(jù)要素的價(jià)值釋放提出更高目標(biāo)。
AI時(shí)代,從冷數(shù)據(jù)到溫?cái)?shù)據(jù)的價(jià)值激活
在數(shù)字化時(shí)代,我們常聽到一個(gè)詞:數(shù)據(jù)驅(qū)動(dòng)。數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)、數(shù)據(jù)驅(qū)動(dòng)決策等背后所代表的是對(duì)數(shù)據(jù)的收集和分析、沉淀,但這時(shí)對(duì)數(shù)據(jù)利用的深度和廣度并不足,也經(jīng)常以冷、溫、熱來區(qū)別數(shù)據(jù)的可用度。但進(jìn)入智能化時(shí)代,數(shù)據(jù)擔(dān)當(dāng)?shù)慕巧l(fā)生了巨大改變。
正如周躍峰所說,當(dāng)下企業(yè)有很多歸檔的冷數(shù)據(jù),隨著AI時(shí)代的到來,冷數(shù)據(jù)將不復(fù)存在,一定會(huì)變成溫?cái)?shù)據(jù),甚至熱數(shù)據(jù),數(shù)據(jù)的含義從過去僅僅是信息的記錄和保存,變成資產(chǎn)去進(jìn)行大模型訓(xùn)練、挖掘知識(shí)、產(chǎn)生新的服務(wù)。
例如,當(dāng)AI大模型作為新的先進(jìn)手段應(yīng)用于氣象預(yù)報(bào)后,大量的歷史數(shù)據(jù)需要參與AI模型的訓(xùn)練、調(diào)優(yōu),進(jìn)而提高模型預(yù)測(cè)的準(zhǔn)確率,在這個(gè)過程中,封存幾十年的歷史數(shù)據(jù)因此被激活、被喚醒。冷數(shù)據(jù)需要被隨時(shí)調(diào)用,變成了溫?cái)?shù)據(jù),AI促進(jìn)“數(shù)據(jù)覺醒時(shí)代”的到來。
數(shù)據(jù)要素投入生產(chǎn)數(shù)盡其用,從成本到“變現(xiàn)”
伴隨數(shù)智世界的到來,數(shù)據(jù)量快速增長(zhǎng)。根據(jù)IDC報(bào)告顯示,中國(guó)數(shù)據(jù)量規(guī)模將從2022年的23.88ZB增長(zhǎng)至2027年的76.6ZB,年均增長(zhǎng)速度CAGR達(dá)到26.3%,為全球第一,全球數(shù)據(jù)量規(guī)模預(yù)計(jì)增長(zhǎng)一倍以上,到2027年將達(dá)到284.3ZB。
高速增長(zhǎng)的數(shù)據(jù)量規(guī)模帶來巨大的硬件和維護(hù)成本,在AI時(shí)代之前,很多企業(yè)并沒有完全認(rèn)識(shí)到數(shù)據(jù)的價(jià)值,或者說沒有足夠的技術(shù)來充分利用數(shù)據(jù),因此,數(shù)據(jù)的價(jià)值常常無法得到最大化體現(xiàn),數(shù)據(jù)具有較高的存儲(chǔ)、計(jì)算和管理成本。
AI時(shí)代,從冷數(shù)據(jù)到溫?cái)?shù)據(jù),當(dāng)存在“角落”的冷數(shù)據(jù)創(chuàng)造產(chǎn)生新的價(jià)值,意味著其具備了“變現(xiàn)”能力,數(shù)據(jù)要素投入生產(chǎn)數(shù)盡其用,數(shù)據(jù)轉(zhuǎn)化為可量化、可交易、可持續(xù)增值的資產(chǎn),實(shí)現(xiàn)從成本中心到利潤(rùn)中心的變現(xiàn)加快。
例如,在醫(yī)療行業(yè),通過分析患者的醫(yī)療記錄和健康信息,醫(yī)療機(jī)構(gòu)能夠更精確地制定治療方案,預(yù)測(cè)患者的治療反應(yīng),提高診療質(zhì)量和效率。并進(jìn)而可以與保險(xiǎn)行業(yè)結(jié)合,通過分析個(gè)體的醫(yī)療數(shù)據(jù),保險(xiǎn)公司可以更準(zhǔn)確地評(píng)估客戶的風(fēng)險(xiǎn)等級(jí),從而合理定價(jià)保險(xiǎn)產(chǎn)品,包括定制化保險(xiǎn)產(chǎn)品等,加速數(shù)據(jù)“變現(xiàn)”。
從向量到張量數(shù)據(jù),理解復(fù)雜世界
進(jìn)入AI時(shí)代,數(shù)據(jù)處理的復(fù)雜度進(jìn)一步提升,如何從海量的、多維度的數(shù)據(jù)中提取有價(jià)值信息,以適應(yīng)各種各樣的業(yè)務(wù)場(chǎng)景已經(jīng)成為了至關(guān)重要的問題。
在傳統(tǒng)的數(shù)據(jù)處理中,數(shù)據(jù)一般被認(rèn)為是向量,向量是元素的一維列表,不適用于復(fù)雜的數(shù)據(jù)處理,以及容易造成信息丟失,并可能需要消耗大量的計(jì)算資源和時(shí)間。進(jìn)入AI深度學(xué)習(xí)領(lǐng)域,張量可以看作是高維度的數(shù)據(jù),它就像一個(gè)多維數(shù)據(jù)的數(shù)組。例如,一張彩色圖片可以看作是一個(gè)三維張量,前兩個(gè)維度表示圖片的長(zhǎng)和寬,第三個(gè)維度表示RGB的三個(gè)顏色通道和顏色強(qiáng)度。
從向量到張量的轉(zhuǎn)變,使得AI大模型能夠理解和表示更為復(fù)雜的模式和規(guī)律,從而在圖片、聲音、視頻等復(fù)雜數(shù)據(jù)處理上有了更好的性能,檢索精度提升,進(jìn)而對(duì)于真實(shí)世界的復(fù)雜性有更深的理解。
從10GB/s到100GB/s的讀寫吞吐率提升
從數(shù)字化到智能化,帶來的另一個(gè)顯著變化是對(duì)處理處理性能上的要求提升,最直觀的體現(xiàn)是數(shù)據(jù)存儲(chǔ)讀寫吞吐率的提升。
大模型訓(xùn)練涉及到大量的數(shù)據(jù)讀取和寫入,數(shù)據(jù)的讀寫速度能夠直接影響模型的訓(xùn)練速度和效率,所以需要數(shù)據(jù)存儲(chǔ)設(shè)備具有足夠的I/O性能。相比HDD,全閃存介質(zhì)支持高IOPS、低時(shí)延,更適用于AI大模型訓(xùn)練階段的隨機(jī)讀寫場(chǎng)景。
存儲(chǔ)內(nèi)生安全,守護(hù)數(shù)據(jù)安全最后一道防線
此外,安全是伴隨數(shù)智化、智能化發(fā)展的永恒話題。在全世界范圍內(nèi),勒索攻擊事件發(fā)生的頻率越來越高,大中型企業(yè)深受其擾。
根據(jù)區(qū)塊鏈數(shù)據(jù)分析機(jī)構(gòu)Chainalysis公布的一組數(shù)據(jù)顯示,2023年勒索軟件攻擊者從受害者處勒索的加密貨幣價(jià)值就超過10億美元,創(chuàng)下歷史新高。過去幾年間,針對(duì)能源、金融、制造等行業(yè)的勒索攻擊事件持續(xù)上演,日前勒索攻擊團(tuán)伙“國(guó)際獵手”針對(duì)日本豪雅株式會(huì)社攻擊索要1000萬美元贖金的事件又成為熱點(diǎn)。網(wǎng)絡(luò)勒索成為數(shù)字空間最大的威脅來源,針對(duì)此類攻擊的安全防護(hù)成為企業(yè)關(guān)注的重點(diǎn)。
存儲(chǔ)作為數(shù)據(jù)安全的最后一道防線,在勒索攻擊防護(hù)上扮演著重要的角色,存儲(chǔ)內(nèi)生安全應(yīng)當(dāng)成為未來存儲(chǔ)系統(tǒng)必須具備的基礎(chǔ)能力。存儲(chǔ)內(nèi)生安全體系架構(gòu)從存儲(chǔ)設(shè)備安全、數(shù)據(jù)安全防護(hù)能力,結(jié)合安全管理流程,補(bǔ)齊網(wǎng)絡(luò)安全能力,能夠?qū)崿F(xiàn)從被動(dòng)安全到主動(dòng)安全的安全加固,守護(hù)企業(yè)核心數(shù)據(jù)資產(chǎn)安全。
AI時(shí)代,數(shù)據(jù)覺醒,構(gòu)筑“以存強(qiáng)算、以存強(qiáng)訓(xùn)、以存強(qiáng)安”的領(lǐng)先數(shù)據(jù)基礎(chǔ)設(shè)施
AI促進(jìn)“數(shù)據(jù)覺醒”,作為數(shù)據(jù)保存的保險(xiǎn)箱和數(shù)據(jù)價(jià)值挖掘的發(fā)動(dòng)機(jī),面向未來的存儲(chǔ)要如何適配變化,才能充分激活數(shù)據(jù)資產(chǎn)潛能?
首要地,數(shù)據(jù)存儲(chǔ)技術(shù)一定是向著更高性能邁進(jìn),例如從以存算一體為代表的傳統(tǒng)存儲(chǔ)架構(gòu)向存算分離的新型架構(gòu)不斷演進(jìn),實(shí)現(xiàn)資源池化和極致彈性,推動(dòng)分布式數(shù)據(jù)庫進(jìn)核心生產(chǎn)系統(tǒng);其次,在AI訓(xùn)練中存儲(chǔ)不應(yīng)該僅僅起到對(duì)訓(xùn)練數(shù)據(jù)的支撐作用,更重要的是在整個(gè)資源消耗巨大的訓(xùn)練系統(tǒng)中,讓數(shù)據(jù)的可用性效率得到極大提升;再者,在存儲(chǔ)側(cè)多層聯(lián)動(dòng)勒索攻擊防護(hù),主動(dòng)守護(hù)數(shù)據(jù)安全。
面向AI時(shí)代,華為通過OceanStor Dorado全閃存和CANTIAN引擎,推動(dòng)分布式數(shù)據(jù)庫向“存算分離+統(tǒng)一存儲(chǔ)”的多主架構(gòu)升級(jí),實(shí)現(xiàn)以存強(qiáng)算;打造AI數(shù)據(jù)湖解決方案,實(shí)現(xiàn)AI訓(xùn)練數(shù)據(jù)全局可視、可管、可用,訓(xùn)練數(shù)據(jù)歸集、預(yù)處理和訓(xùn)練效率倍增,以存強(qiáng)訓(xùn);首創(chuàng)多層聯(lián)動(dòng)勒索攻擊防護(hù)(MRP)技術(shù),通過存網(wǎng)協(xié)同檢測(cè)、協(xié)同響應(yīng)和協(xié)同恢復(fù)三大核心能力,更好地應(yīng)對(duì)數(shù)據(jù)被勒索的風(fēng)險(xiǎn),實(shí)現(xiàn)以存強(qiáng)安。
總之,“數(shù)據(jù)覺醒”時(shí)代,AI加速數(shù)據(jù)資產(chǎn)化,數(shù)據(jù)引擎正在被注入巨大動(dòng)能。在加速行業(yè)數(shù)智化轉(zhuǎn)型的旅程中,助力行業(yè)企業(yè)打造領(lǐng)先的數(shù)據(jù)基礎(chǔ)設(shè)施,以存強(qiáng)算,以存強(qiáng)訓(xùn),以存強(qiáng)安,作為推動(dòng)者,華為正以先進(jìn)數(shù)據(jù)存力為AI激活數(shù)據(jù)資產(chǎn)潛能。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.