2025 年 4 月 10 - 12 日,QCon 全球軟件開發大會將匯聚全球 140+ 技術先行者及創新實踐者,直擊行業痛點,解鎖可復制的經驗與模式。這不僅是一場會議,更是一次對技術演進的集體探索。無論你是資深開發者,還是技術管理者,都能在這里有所收獲,為下一步的技術決策提供方向。
小紅書混合云資源管理負責人梁啟成已確認出席并發表題為《小紅書 FinOps 實踐:云成本優化與資源效率提升之道》的主題分享。眼下,云計算已成為眾多互聯網企業支撐業務運行的關鍵基礎設施,然而云計算的便利性和靈活性也帶來了一系列資源成本管理挑戰,包括成本增速過快、成本歸屬不清晰、缺乏有效成本控制手段、對云廠商高度依賴等。本次分享將重點介紹小紅書的 FinOps 實踐經驗,并通過技術優化手段提升資源使用效率,每年節省數億成本。
梁啟成多年 IT 資源管理與成本優化經驗,曾深度參與頭部互聯網企業上云、大規模在離線業務混部,并持續推進業財一體化以及精細化的混合云資源成本管理,2024 年參與了信通院《IT 基礎設施資源運營成熟度模型》標準制定,是 FinOps 文化的踐行者。他在本次會議的詳細演講內容如下:
演講提綱
小紅書用云概述
成本優化面臨的問題與挑戰
分攤云成本與實際資源用量存在偏差
資源規模不斷增長但利用效率持續低下
大模型的部署與運行成本高昂
成本洞察與優化實踐
技術商品化實現內外賬分離
大 Node 小 Pod 策略下的在線業務混部
工作負載性能瓶頸分析
機型收斂與 RightSizing
內容大模型的降本增效
多維并行提升訓練效率
量化蒸餾壓縮模型大小
算子優化提升推理速度
總結與展望
這樣的技術在實踐過程中
有哪些痛點?
常規按比例分賬方法能幫助測算出各業務部門的資源成本費用,但不一定能解釋清楚其背后的量價對應關系,進而影響了技術優化方向判斷。
云廠商硬件經過虛擬化后,不同規格大小虛擬機會存在跨 numa、共用一個 Socket 產生干擾,進而表現出內存性能差、業務 CPU 使用率明顯分層、服務 RT 抖動明顯等問題,云上客戶不得不開通更多資源降低容量水位來保證在線服務不受損,最終造成了成本浪費
高昂的訓練和推理成本、高硬件需求、資源利用效率低下,這些問題限制了內容大模型的廣泛應用和普及,需要通過技術創新和優化策略來解決
演講亮點
重點聚焦于建立清晰、透明的成本洞察機制以及配套系統能力建設,嘗試分別從買賣家視角梳理清楚各自團隊的資源用量、技術成本支出以及收入情況
看清、看準、分析出系統關鍵性能瓶頸,通過機型迭代、內核優化等措施確保各業務具備將 CPU 跑高的能力,進而執行縮容退機操作達到降低成本的目標
分別從數據、訓練、壓縮、推理等方面介紹小紅書對于內容大模型的降本增效實踐
聽眾收益
可以幫助相關從業人員了解或學習云成本優化的主要技術方案,并在日常工作中進行運用
除此之外,本次大會還策劃了多模態大模型及應用、AI 驅動的工程生產力、面向 AI 的研發基礎設施、不被 AI 取代的工程師、大模型賦能 AIOps、云成本優化、Lakehouse 架構演進、越挫越勇的大前端等專題,屆時將有來自不同行業、不同領域、不同企業的 100+ 資深專家在 QCon 北京現場帶來前沿技術洞察和一線實踐經驗。
目前,所有大會演講嘉賓已結集完畢,了解更多報名和詳情信息可掃碼或聯系票務經理 18514549229 咨詢。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.