當前,國內大模型百花齊放,據統計,中國10億以上參數大模型已發布79個。近日,天津GPT產業發展計劃在濱城啟動,將構建百億GPT產業價值鏈。
與此同時,GPT大模型海量計算,也對存儲提出了更高要求。而三大存力痛點,制約大模型計算發展:一是數據加載慢,導致訓練時間長;二是數據訪問協議多樣性,要求數據訪問效率更高;三是數據生命周期管理不完善,數據安全風險亟需關注。
高新區企業中科曙光基于這些存儲痛點,曙光存儲大模型解決方案日前升級迭代,攜全新業內首創技術XDS,提供增效、降本、安全的體驗。
增效-首創XDS技術,存算協同優化提升效率
此次大模型解決方案升級迭代,曙光ParaStor首創實現XDS多層級智能加速技術,集算力端、存力端各維度各層級加速引擎為一體,打造高效的存算協同。
以往AI訓練中,智能芯片若想讀取數據,則需先將數據存到緩存中,再由CPU發往智能芯片讀取。CPU與緩存的轉運,導致數據調取速度變慢。而XDS技術可實現將數據直接加載到智能芯片中,提高訓練過程中數據集的加載及處理速度。XDS技術創新在于,支持多種智能芯片的直接存取,除了GPU,也支持多款算力端智能芯片直接存取數據。XDS技術簡化了存取過程,降低了CPU與緩存壓力,更節省硬件資源。
在存力端,XDS技術內嵌ParaBuffer加速引擎,在AI訓練計算節點與存儲系統之間構造大內存池,將系統整體I/O性能提升數倍。存算協同優化,使得訓練時間大幅降低,可由數十天降低至幾天。
降本-多存儲協議與智能分級,數據管理省心可靠
此外,針對數據訪問協議多樣性痛點,曙光ParaStor同時支持文件、對象等多種存儲協議,可為大模型提供統一的存儲底座。為實現數據全生命周期管理,曙光ParaStor具備熱溫冷數據智能分級流動,支持給數據自定義標簽,過期后自動刪除。
對于AI數據存儲的安全可靠,曙光ParaStor憑借全棧自研能力,從操作系統、存儲架構、軟件核心模塊、存儲介質等多層面保障數據安全。提升存儲可靠性,降低數據管理成本,讓用戶省心省力。
目前,曙光存儲為國內某AI新經濟獨角獸大模型平臺構建了PB級NVMe全閃存高性能存儲池,從硬件設施到軟件系統,性能、可靠性、安全性皆滿足需求指標,為多個領域帶來增效降本、可靠安全的存儲方案。
作為國內高端計算領軍企業,高新區企業中科曙光目前擁有自持的海量原生算力資源。上半年,濱海新區聚焦自主創新,戰略性新興產業實現集群發展。“中國信創谷”聚集了以飛騰、麒麟、曙光、360為代表的1000余家上下游企業,實現了從CPU、操作系統、數據庫、超算、網絡安全到整機終端信創全產品鏈條。