首頁 導報現場 正文

存儲必須更懂業務和場景

2024-06-28 16:09 中國發展網
存儲 算力 數字經濟 數字基礎設施 人工智能

中國經濟導報、中國發展網  記者崔立勇報道

“存儲是在最底層的基礎和關鍵。”中科曙光存儲科技有限公司總裁何振日前在接受本報記者采訪時表示,存儲是數據基礎設施的重要部分,如果發生風險,各類應用就會隨之出現問題,數據丟失更是不能接受的。

數字經濟蓬勃發展,當數據創造出巨大價值的時候,存儲的重要性日益凸顯。何振說,雖然用戶對存儲的直接感知不多,但是身處“背后”的強性能、高可靠、易管理的智能化存儲底座至關重要。

圖片1

向覆蓋全行業全場景努力

“沒有一個通用設備可以一成不變地長期支持用戶的業務發展。”深入業內多年的何振有著深切的感受——存力平臺必須場景化,存力必須和用戶的業務場景緊密結合起來。

中科曙光存儲科技有限公司副總裁張新鳳分析,不同行業、不同場景對存儲的功能需求存在差異,對存儲性能指標的要求也完全不同。只有深耕行業,才能解決用戶在不同業務場景下的痛點。

從為大型算力中心做存儲的配套服務,到逐漸向各個通用場景推進,曙光存儲已經在電信運營商、AI、醫療、金融、政府、能源、制造等多個領域獲得突破。

張新鳳舉例,在自動駕駛領域,曙光存儲和應用伙伴一起,給自動駕駛的企業提供符合安全監管、性能更優的數據處理平臺解決方案。與之類似,在通信、氣象、石油等領域,曙光存儲也在努力將自身的技術優勢和行業的應用深度綁定,通過代碼級的深度優化來支撐業務。

針對不同的應用場景,曙光存儲的解決方案團隊首先要充分理解應用場景,然后根據用戶特定需求完成架構方案。“這個階段拼的是綜合實力。”何振說,近期曙光存儲受到自動駕駛和國內AI大模型的青睞,原因就在于曙光存儲可以根據用戶需求靈活調整,優化性能,將存儲價值更加充分地發揮出來。

因為曙光存儲在產品研發之路上已經率先走過艱苦的一段,所以在“最后一公里”就變得相對容易。“從第一行代碼開始,都是自研的。”何振表示,正因為曙光存儲的產品是自研完成,所以面對不同行業的定制化需求時,響應就主動而快速。

“曙光存儲將向覆蓋全行業全場景努力。”何振表示,存力平臺更懂業務是發展趨勢,只有實現這一目標才能在行業中保持競爭力。

一行一行代碼去研發

中科曙光總裁歷軍在曙光存儲的新品暨品牌發布會上表示:“新技術新應用快速迭代,而算力和存力是不變的兩大底層支撐,先進算力和先進存力也是曙光長期投入研發的重要業務之一。”

曙光存儲是中科曙光自主開發的第二大產品線。從最早的5名工程師發展到上千人規模的團隊,成為國內存儲行業的領頭羊,擁有多個領先業界的自研存儲產品,曙光存儲走過了整整二十年的奮斗歷程。

“一行一行代碼去研發,一行一行地去優化。”何振表示,從底層代碼直到各類應用產品上市,曙光存儲始終堅持全棧自研。

曙光存儲為什么不選擇更加短平快的路徑?面對行業的疑問,何振表示,這源自企業的基因——中科曙光一路坎坷一路過關斬將,攻堅克難,多年來一一解決卡脖子難題,站在了國家信息技術產業的最前列。

曙光存儲日前推出了完全具有自主知識產權的全球首個億級IOPS集中式全閃存儲FlashNexus。這不僅是全球首個億級IOPS集中式全閃存儲,還是業界唯一有百控級擴展能力的集中式存儲產品,穩定性保障首次突破7個9,綜合性能領先同類產品50%以上。

曙光存儲“強存”——重磅發布FlashNexus集中式全閃新品

曙光存儲“強存”——重磅發布FlashNexus集中式全閃新品

成為“更懂AI”的存儲

AI大模型蓬勃發展,隨之而來的根本訴求是將GPU等芯片的資源效率充分發揮出來——在訓練和推理的過程中,存儲跑得更快,讓前端的計算資源不等待,并確保整個過程中數據的安全可靠。

張新鳳表示,隨著AI技術的發展,大模型發展非常迅速,參數從百億計到千億計甚至萬億級別。AI應用對存儲的要求不止于量的增加。她進一步分析,在AI大模型開發中,訓練階段和推理階段對存儲的要求并不一樣。訓練階段標準更高,一般是先對數據集完成初步的清理,再導入存儲和顯卡。在這個數據加載的過程中,業界碰到的最大難題是加載的小文件數量龐大。很多訓練依靠大量100K左右的文本和圖片。對存儲來說,傳輸大量小文件的速度遠比傳輸一個大文件慢,當千萬數量的KB級小文件集中出現,提高加載速度就成為難題。

張新鳳介紹,針對這些AI需求,曙光存儲拿出了一套“辦法”:為用戶提供強性能的全閃存儲,實現端到端的NVMe全閃的技術優化;分布式存儲升級以后成為“更懂AI”的存儲,根據AI應用的特點將存儲和應用融合起來,利用更多級緩沖的加速機制,進一步把I/O的時間縮短;第三,通過自有的液冷技術,在綠色節能方面為AI應用賦能。

張新鳳所說的升級是指曙光推出了新一代ParaStor分布式全閃存儲,全平臺性能提升超過20倍,單節點帶寬最高達到130GB/s,320萬IOPS,成為國產化、x86、ARM等平臺的理想選擇。作為AI存儲加速利器,升級后的ParaStor全閃存儲具備五級數據加速技術,包括本地內存加速、BurstBuffer加速層、XDS雙棧兼容、網絡加速與存儲節點高速層,搭配全路徑AI親和機制,讓數據無需等待。

曙光存儲“智存”——ParaStor分布式全閃系列全面升級

曙光存儲“智存”——ParaStor分布式全閃系列全面升級

讓數據流動起來

何振分析,存儲行業在此前兩年處于低潮期。2024年,整個市場行情開始上升。他認為,市場需求的增加一方面來自AI大模型、自動駕駛等對存儲的剛性需求,另一方面企業數字化轉型進入關鍵階段,對存儲需求增多。

“從上半年的市場表現分析,今年存儲行業的表現將比去年好很多。”何振告訴記者,過去兩三年,各地掀起了建設智算中心的熱潮,很多企業購置了大量GPU、服務器等產品,與此同時存儲常常被忽視。智算中心建成后,首要問題就是補上存儲的欠賬,讓存力和算力配套起來。

曙光存儲的產品集中于分布式和超融合,曙光存儲最新發布的FlashNexus系列補齊了集中式全閃產品的產品線。據介紹,在我國的分布式存儲、超融合和集中式存儲三類中,集中式存儲占比超過50%。推出集中式存儲產品,意味著曙光存儲將進入另一半存儲市場,由此打開新局面。

張新鳳解釋,集中式存儲和分布式存儲是相輔相成的關系,兩者長期共存,不會出現彼此的簡單取代。她說,集中式存儲拓展能力相對較低,但是憑借高性能、高可靠性、低延遲的優勢,獲得了金融、醫療等行業的青睞,目前集中式存儲在國外的占比也更高,而AI對存儲的大部分需求指向分布式存儲。

“讓數據流動起來。”張新鳳表示,用戶的數據開始或放在集中式存儲上,或放在分布式存儲上,但是伴隨各類應用的發展,兩個地方的數據必須集中起來,以便進一步分析挖掘。

張新鳳解釋,將集中式和分布式的數據匯聚到一個設備的過程將遇到新的問題,跨域存儲集群組合管理、數據冷熱分級感知、數據跨域網流動及跨域無感知訪問等關鍵技術亟待攻克。傳統的解決方法包括將集中式的數據通過應用層緩慢地拷貝到分布式上面。

集中式和分布式兩大存儲模式之間的障礙已經被曙光存儲打通。曙光存儲首創“通存”解決方案,借助同根同源的集中式存儲資源池與分布式存儲資源池,讓數據無界流動,實現跨平臺一鍵式容災恢復、跨形態熱溫冷數據無感流動和跨域資源池全維度視圖。當擁有了將集中式和分布式打通的技術,就可以在存儲層完成這項工作,充分提升存儲資源利用率,大大減輕了用戶后續系統升級包括數據匯集的難題。

曙光存儲首創“通存“方案

曙光存儲首創“通存“方案

“以前是將數據流動的工作留給用戶,現在基本上不需要用戶費心,用戶可以把問題交給曙光存儲來解決。”張新鳳說。

相信通過像曙光存儲這樣的國產企業的技術突破和業務崛起,中國存力將再上一個臺階,助力中國企業迎接更光明的AI時代!

責任編輯:崔立勇


返回首頁
相關新聞
返回頂部
国产福利一区二区麻豆