近日,由中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)數(shù)據(jù)存儲(chǔ)專業(yè)委員會(huì)主辦的 2025 數(shù)據(jù)存儲(chǔ)產(chǎn)業(yè)大會(huì)正式揭曉了“2025 年度數(shù)據(jù)存儲(chǔ)典型實(shí)踐案例”名單,大普微聯(lián)合華瑞指數(shù)云:“三節(jié)點(diǎn)KVCache存算融合一體機(jī)案例”成功入選。
01
廣電行業(yè)AI升級(jí)
算力與成本的“雙重焦慮”
該案例的落地客戶是一家行業(yè)領(lǐng)先的智算服務(wù)提供商。隨著廣電行業(yè)全面進(jìn)入“智能化內(nèi)容生產(chǎn)”階段,AI 模型在內(nèi)容生成、視頻理解、語(yǔ)音識(shí)別、虛擬主持人、自動(dòng)編導(dǎo)等任務(wù)的應(yīng)用呈爆發(fā)式增長(zhǎng)。然而,在面對(duì)實(shí)際業(yè)務(wù)落地時(shí),傳統(tǒng)的GPU架構(gòu)正面臨嚴(yán)峻挑戰(zhàn):
極致實(shí)時(shí)性要求
視頻實(shí)時(shí)渲染、虛擬演播室交互、直播中的AI特效生成、以及虛擬主持人互動(dòng)等場(chǎng)景中。毫秒級(jí)甚至亞毫秒級(jí)的延遲會(huì)直接導(dǎo)致音畫不同步、動(dòng)作遲滯或交互卡頓,嚴(yán)重影響最終用戶的觀感和體驗(yàn)流暢度。
海量上下文數(shù)據(jù)處理瓶頸
支撐高質(zhì)量?jī)?nèi)容生成和理解(如長(zhǎng)視頻摘要、復(fù)雜場(chǎng)景理解、多輪對(duì)話虛擬主持人)需要處理128K+ tokens超長(zhǎng)上下文。這導(dǎo)致KVCache數(shù)據(jù)量激增,讀寫操作異常頻繁。傳統(tǒng)GPU架構(gòu)依賴的高帶寬內(nèi)存(HBM)容量有限且成本高昂,成為制約模型規(guī)模、會(huì)話長(zhǎng)度和并發(fā)能力的關(guān)鍵瓶頸。
高并發(fā)與高吞吐壓力
規(guī)模化推理任務(wù)并發(fā)數(shù)量的激增(如同時(shí)處理多個(gè)頻道的實(shí)時(shí)渲染、為大量用戶提供個(gè)性化內(nèi)容推薦或虛擬主播服務(wù))要求極高的計(jì)算吞吐量,更對(duì)系統(tǒng)IOPS和內(nèi)存/存儲(chǔ)帶寬提出了空前的要求。
容量與成本的矛盾
單純依賴高性能GPU搭配HBM的方案雖然算力強(qiáng),但顯存容量有限且單位成本極高。面對(duì)需要支撐多用戶長(zhǎng)會(huì)話、大模型多實(shí)例部署、以及歷史素材庫(kù)快速檢索調(diào)用的業(yè)務(wù)需求,純GPU方案在容量擴(kuò)展性和總體擁有成本(TCO)上均難以承受。
復(fù)雜模型與異構(gòu)負(fù)載支持
廣電AI應(yīng)用往往涉及多種模態(tài)(文本、語(yǔ)音、圖像、視頻)的融合處理,以及生成式模型與判別式模型的混合部署。基礎(chǔ)設(shè)施需要靈活支持Transformer, Diffusion等不同架構(gòu)和計(jì)算特性(計(jì)算密集型、訪存密集型)的任務(wù),避免資源浪費(fèi)。
高可用性與彈性擴(kuò)展需求
作為支撐核心業(yè)務(wù)的生產(chǎn)系統(tǒng),需要極高的穩(wěn)定性和可用性。同時(shí),需具備彈性伸縮能力,應(yīng)對(duì)業(yè)務(wù)波峰波谷(如大型直播活動(dòng)),在保障性能的前提下按需分配資源,優(yōu)化成本。
因此,客戶迫切需要一套能在極致性能、超大容量、靈活擴(kuò)展性以及可控成本之間取得最優(yōu)平衡的高性能智算基礎(chǔ)設(shè)施解決方案。
02
推理速度提升5-8倍
助力廣電行業(yè)真正實(shí)現(xiàn)AI智能化升級(jí)
“岳磐”KVCache 存算融合一體機(jī)方案是大普微與華瑞指數(shù)云聯(lián)合打造的一款為應(yīng)對(duì)AI與企業(yè)核心業(yè)務(wù)雙重挑戰(zhàn)而生的全棧解決方案。
該方案針對(duì)上述行業(yè)核心痛點(diǎn),采用高度集成的“交鑰匙”式設(shè)計(jì),將大普微高性能企業(yè)級(jí)SSD與華瑞指數(shù)云AI原生數(shù)據(jù)平臺(tái)軟件產(chǎn)品ExponTech WADP深度融合。通過硬件池化、網(wǎng)絡(luò)加速與框架調(diào)優(yōu),解決大模型推理中顯存瓶頸與高并發(fā)延遲問題,為高實(shí)時(shí)性的廣電行業(yè)AI應(yīng)用場(chǎng)景提供了 PB 級(jí) KVCache 擴(kuò)展能力與微秒級(jí)響應(yīng)保障。

● 岳磐方案架構(gòu)
自方案上線以來,在性能、成本、容量、兼容性等維度全面取得了顯著效果:
03
助力廣電行業(yè)建設(shè)“高性能、低成本、可持續(xù)”的 AI 智算中心
在高性能存儲(chǔ)底座的支撐下,“岳磐KV Cache”聯(lián)合解決方案已在客戶多個(gè)核心生產(chǎn)場(chǎng)景中實(shí)現(xiàn)了效率的質(zhì)變:
岳磐 KVCache 存算融合一體機(jī)方案以其存算融合的 KVCache 架構(gòu)、低時(shí)延互聯(lián)與高擴(kuò)展 NVMe 存儲(chǔ)體系,顯著提升了廣電行業(yè)的 AI 內(nèi)容生產(chǎn)效率,也推動(dòng)了節(jié)目制作、虛擬演播與智能渲染的算力革新,為廣電行業(yè)的智能化升級(jí)樹立了標(biāo)桿。
深耕高性能存儲(chǔ),共建 AI 產(chǎn)業(yè)新生態(tài)
“岳磐”KVCache 存算融合一體機(jī)的落地,是大普微將極致性能的 SSD 產(chǎn)品轉(zhuǎn)化為行業(yè)系統(tǒng)級(jí)解決方案的成功實(shí)踐。作為企業(yè)級(jí)存儲(chǔ)領(lǐng)域的深耕者,大普微不局限于單一硬件性能的提升,而是通過軟硬協(xié)同與架構(gòu)創(chuàng)新,為廣電、金融、互聯(lián)網(wǎng)等關(guān)鍵行業(yè)提供量身定制的存儲(chǔ)解決方案。憑借持續(xù)的技術(shù)迭代,大普微正不斷拓展存儲(chǔ)能力邊界,為各行業(yè)的數(shù)據(jù)應(yīng)用提供堅(jiān)實(shí)支撐。
工作時(shí)間:周一至周五 9:00-18:00
業(yè)務(wù)聯(lián)系人:袁經(jīng)理(0755-82964380)
業(yè)務(wù)郵箱:ex-channel@ex-channel.com
營(yíng)銷聯(lián)系人:郭經(jīng)理(0755-83273832)
營(yíng)銷郵箱:marketing@ex-channel.com
地址:深圳市南山區(qū)深圳灣科技生態(tài)園10A棟21樓01-02室
Address: NO.01-02 ,21/F, Building 10A, Shenzhen Bay Science and Technology Ecological Park,Nanshan District, Shenzhen City, Guangdong Province
