新年伊始,焱融科技再次在存儲(chǔ)性能領(lǐng)域取得突破。通過最新的實(shí)驗(yàn)室測(cè)試,焱融 AI 存儲(chǔ)產(chǎn)品——焱融追光全閃存儲(chǔ)一體機(jī) F9000X,搭載 4 張 NVIDIA 400Gbps NDR InfiniBand 網(wǎng)卡,并結(jié)合自主研發(fā)的 Multi-Channel 多網(wǎng)卡聚合技術(shù),實(shí)現(xiàn)了 1.6Tb/s 的網(wǎng)絡(luò)帶寬聚合。3 節(jié)點(diǎn)存儲(chǔ)集群的測(cè)試結(jié)果顯示,性能達(dá)到 480GBps 帶寬和 750 萬 IOPS,相較市場(chǎng)同類產(chǎn)品提升了 3 倍。
這一突破性方案不僅大幅提升了性能,還有效降低了企業(yè)的總擁有成本:每 GB/s 成本減少 75%,每 IOPS 成本降低 30%。焱融科技憑借業(yè)界頂級(jí)性能,為大規(guī)模 AI 計(jì)算提供了理想的存儲(chǔ)解決方案,加速了 AGI 時(shí)代的全面到來。
AI 技術(shù)發(fā)展催生存儲(chǔ)性能升級(jí)
近年來,AI 技術(shù)特別是生成式 AI 迎來了飛速發(fā)展的黃金時(shí)期,不斷刷新著能力邊界。伴隨而來的是不斷提升的對(duì)數(shù)據(jù)處理速度和效率的要求,這也在引發(fā)一場(chǎng)新的存儲(chǔ)技術(shù)革命,對(duì)存儲(chǔ)性能的要求不斷提高。
AI 模型復(fù)雜度不斷提升,存儲(chǔ)性能需求攀升
隨著生成式 AI 技術(shù)的持續(xù)創(chuàng)新,基礎(chǔ)大模型已邁入多模態(tài)時(shí)代,模型參數(shù)和計(jì)算復(fù)雜度均呈指數(shù)級(jí)增長(zhǎng)。這種發(fā)展顯著提升了對(duì)存儲(chǔ)帶寬、容量和計(jì)算性能的要求。此外,隨著模型規(guī)模和訓(xùn)練精度的不斷提升,Checkpoint 也變得更大,進(jìn)一步加劇了對(duì)存儲(chǔ)吞吐量的壓力。如果存儲(chǔ)性能無法匹配模型的復(fù)雜度,整個(gè) AI 訓(xùn)練鏈條將因“存儲(chǔ)瓶頸”而受阻,影響模型迭代的效率。
而在模型推理環(huán)節(jié),更大的數(shù)據(jù)量、更龐大的模型,以及更長(zhǎng)的上下文窗口能夠顯著提升人工智能的效能。然而,推理過程需要應(yīng)對(duì)大量并發(fā)請(qǐng)求且對(duì)響應(yīng)時(shí)間要求極高。同時(shí),AI 模型頻繁更新和快速部署的需求也在不斷增加。這使得存儲(chǔ)系統(tǒng)必須具備低延遲和高吞吐量,以滿足不斷增長(zhǎng)的應(yīng)用需求。
算力資源緊缺,GPU 利用率提升需求迫切
AI 技術(shù)的發(fā)展推動(dòng)了算力需求的急劇增長(zhǎng),GPU 等算力資源供需矛盾突出。隨著模型參數(shù)和復(fù)雜度的提升,模型訓(xùn)練所需的 GPU 算力也隨之增加,目前最高已擴(kuò)展到萬卡乃至十萬卡規(guī)模的大型 AI 算力集群。但現(xiàn)有基礎(chǔ)設(shè)施在算力資源的可用性和優(yōu)化方面仍存在諸多挑戰(zhàn)。頻繁的 CheckPoint 數(shù)據(jù)寫入和斷點(diǎn)續(xù)訓(xùn)造成算力資源閑置,算力集群的利用率偏低,增加了訓(xùn)練時(shí)間和計(jì)算成本。
在這種情況下,若能夠?qū)?GPU 利用率提升,就相當(dāng)于增加了額外算力,從而能在更短的時(shí)間內(nèi)完成更多的計(jì)算任務(wù),降低模型訓(xùn)練的時(shí)間成本和經(jīng)濟(jì)成本。而提升 GPU 利用率的關(guān)鍵之一便是存儲(chǔ)性能的升級(jí)。通過提升數(shù)據(jù)加載效率、加快斷點(diǎn)續(xù)訓(xùn)速度,顯著減少訓(xùn)練過程中的等待時(shí)間,提升算力資源的使用效率。
焱融存儲(chǔ)全面激發(fā)大規(guī)模 AI 計(jì)算集群效能釋放
作為國(guó)內(nèi)專注于 AI 存儲(chǔ)領(lǐng)域的領(lǐng)先存儲(chǔ)解決方案提供商,焱融科技針對(duì)日益復(fù)雜的 AI 模型訓(xùn)練和推理需求,不斷進(jìn)行存儲(chǔ)技術(shù)創(chuàng)新,持續(xù)帶來存儲(chǔ)性能突破,以滿足不斷提升的 AI 計(jì)算需求。此次,焱融科技推出的 4 張 NVIDIA 400Gbps NDR InfiniBand 網(wǎng)卡的存儲(chǔ)方案,依托于焱融追光全閃存儲(chǔ)一體機(jī) F9000X,通過公司自主研發(fā)的 Multi-Channel 多網(wǎng)卡聚合技術(shù),提供 1.6Tb/s 網(wǎng)絡(luò)帶寬接入能力,完美適配 PCIe 5.0 NVMe 閃存,大幅提升數(shù)據(jù)訪問速度和處理效率,釋放 AI 算力的全新潛能。
焱融全閃 F9000X 3節(jié)點(diǎn)存儲(chǔ)集群帶寬性能對(duì)比
上圖展示了焱融全閃分布式文件存儲(chǔ) F9000X 分別搭載 2 張和 4 張 NVIDIA 400Gbps NDR InfiniBand 網(wǎng)卡的 3 節(jié)點(diǎn)存儲(chǔ)集群的實(shí)測(cè)性能??梢钥吹?,采用 4 張 InfiniBand 400Gbps 網(wǎng)卡的焱融全閃 F9000X 存儲(chǔ)方案,3 節(jié)點(diǎn)存儲(chǔ)集群的帶寬性能達(dá)到了 480GBps, 相較于 2 卡方案性能提升了近 80%,相比市場(chǎng)同類產(chǎn)品性能提升 3 倍;同時(shí),其 IOPS 性能也達(dá)到了 750 萬,保持業(yè)界領(lǐng)先水平。
在性能大幅提升的同時(shí),用戶的成本效益也得到了顯著優(yōu)化,年省算力成本達(dá)到千萬級(jí)。每 GB/s 的成本降低了 75%,每 IOPS 的成本降低了 30%。這一成本優(yōu)勢(shì)意味著,企業(yè)在享受高性能存儲(chǔ)帶來的業(yè)務(wù)效率和競(jìng)爭(zhēng)力提升的同時(shí),還能夠有效降低總體擁有成本,是大規(guī)模 AI 計(jì)算場(chǎng)景下的理想全閃存儲(chǔ)解決方案。
先進(jìn)的 AI 存儲(chǔ)需要緊跟技術(shù)發(fā)展的步伐,滿足日益增長(zhǎng)的計(jì)算需求,提升用戶體驗(yàn)。繼在國(guó)際權(quán)威 AI 測(cè)評(píng)舞臺(tái) MLPerf Storage 中嶄露頭角后,焱融全閃 F9000X 再次實(shí)現(xiàn)性能飛躍。這不僅再次彰顯了焱融科技在 AI 高性能存儲(chǔ)領(lǐng)域的領(lǐng)先地位,也為行業(yè)樹立了新的標(biāo)桿,為不斷迭代的大規(guī)模 AI 模型訓(xùn)練和推理等各類復(fù)雜計(jì)算任務(wù)提供強(qiáng)有力的支撐。面向未來,焱融科技將繼續(xù)深耕 AI 存儲(chǔ)技術(shù)創(chuàng)新,持續(xù)提供領(lǐng)先的 AI 存儲(chǔ)產(chǎn)品,為 AI 大模型、智算中心、自動(dòng)駕駛、生信分析、金融量化等領(lǐng)域提供更強(qiáng)大的數(shù)據(jù)存儲(chǔ)基座,推動(dòng)這些領(lǐng)域的持續(xù)發(fā)展和創(chuàng)新。
2018-2022 Copyright © Stor.com.cn