在技術創(chuàng)新論壇上,優(yōu)刻得高級技術經理吳成斌發(fā)表了主題為《數(shù)據(jù)中心智能化的實踐與思考》的精彩演講。
吳成斌介紹,優(yōu)刻得烏蘭察布智算中心是公司緊貼“東數(shù)西算”國家戰(zhàn)略、按照國際A級數(shù)據(jù)中心標準所自建的“西部”智能算力中心,位于全國一體化算力網絡國家樞紐節(jié)點集寧大數(shù)據(jù)產業(yè)園,整體建筑面積約14萬平方米,總計可容納12000個機柜,能夠提供高性能、靈活、安全可靠的算力支撐和技術支持,幫助用戶解決算力資源不足、成本高昂等問題,為用戶帶來更高價值。
優(yōu)刻得烏蘭察布智算中心支持機房模塊布置、基礎設施配置的靈活部署、深度定制,可全面提供從數(shù)據(jù)中心、服務器、到計算、存儲、網絡、安全、架構設計的一整套AIGC解決方案,將產品能力轉化成差異性的服務交付給客戶,為企業(yè)構建穩(wěn)定可靠的大模型算力底座。目前,優(yōu)刻得烏蘭察布智算中心已經形成可支持萬億參數(shù)、千卡集群的大模型訓練能力,以高性能算力服務于大模型訓練和推理任務。
談及智算中心的“智能化”改造,吳成斌表示,數(shù)據(jù)集中管理是智能化的基礎,而監(jiān)控系統(tǒng)是智能化的核心。優(yōu)刻得智能算力中心充分運用RFID資產管理、機器人智能巡檢、DCIM系統(tǒng)監(jiān)控、AR遠程運維、數(shù)字孿生等技術,實現(xiàn)了自動化運維、智能化巡檢、數(shù)字化管理。優(yōu)刻得積極投入數(shù)據(jù)中心創(chuàng)新技術研究,并作為參編單位參與了《數(shù)據(jù)中心浸沒液冷系統(tǒng)碳氟類冷卻液技術要求和測試規(guī)范》的標準制定。當前也正不斷探索運用與人工智能相結合的先進技術,實現(xiàn)AI節(jié)能控制、故障自動診斷與預測。
在算力基礎設施之上,優(yōu)刻得還構建了智能、一體化的智算解決方案,基于優(yōu)刻得的云主機、裸金屬、高性能存儲和低延遲網絡等基礎設施,結合了“孔明”智算平臺和UModelVerse模型服務平臺,能夠為大模型開發(fā)者、應用廠商、高校和科研機構等提供一站式的AI計算開發(fā)服務。其中,優(yōu)刻得孔明智算平臺具備多用戶管理、分布式訓練、斷點續(xù)訓和智能運維等功能,面向眾行業(yè)用戶,提供一站式管理的算力資源和運營服務,使得模型開發(fā)者能夠更專注于模型開發(fā),無需擔心底層訓練環(huán)境的部署。
大會期間,優(yōu)刻得混合云業(yè)務中心總經理唐立參與探討了“算力租賃是否一門好生意”的圓桌對話。他表示,優(yōu)刻得作為中立的云廠商,自身不做大模型業(yè)務,但能夠對外全面輸出一站式的智算服務平臺能力,幫助用戶提升算力使用的便捷性,這種租賃的方式會極大地降低用戶的算力使用成本。
基于高性能計算和大規(guī)模數(shù)據(jù)處理能力,智算中心不僅成為科研、金融、制造、醫(yī)療等行業(yè)領域的關鍵基礎設施,也將成為數(shù)字經濟發(fā)展的新引擎。作為云計算領軍型企業(yè),優(yōu)刻得將不斷加強技術創(chuàng)新與應用實踐,持續(xù)推進智算中心建設,為人工智能和大模型產業(yè)發(fā)展提供強大堅實的數(shù)字底座支撐。