全國首個國產單池萬卡液冷算力集群正式啟用,天翼云以科技創新加速算力普惠
2024-03-23
3月22日,中國電信宣布,天翼云上海臨港國產萬卡算力池正式啟用,八家合作伙伴宣布將作為首批用戶入駐臨港國產算力池。這是國內首個投入正式運營的國產單池萬卡液冷算力集群,也是業內領先的全國產化云智一體公共智算中心。通過中國電信天翼云打造的人工智能公共算力服務平臺,將以公共普惠、創新領先的算力供給,算、存、運一體的綜合算力服務模式,全面賦能上海千行百業,成為上海“新算力”的重要一極。
作為數字中國建設主力軍、云服務國家隊,中國電信天翼云積極落實國家政策要求,深耕算力基礎設施建設,于今年年初在上海臨港智算園區投建15000卡公共智能算力中心,這是全國規模最大的運營商級智算中心,將助推上海搶占全國算力發展制高點。經過緊張的建設,3月22日,上海臨港智算園區的首個國產單池萬卡液冷算力集群正式交付,并投入商業運營。此次啟用的天翼云上海臨港國產單池萬卡液冷算力集群創新性地采用網絡中置、算力分層的“魔方”型,實現了單一集群內萬卡高速互聯,滿足萬億級參數大模型訓練所需的多機多卡并行、高吞吐無損通信等需求。同時,為了實現綠色低碳的目標,全面采用融合液冷服務和IDC基礎設施的新一代智算液冷DC艙,實現了數據中心的能效和智算集群的算效雙提升,為“人工智能+”提供智能、彈性的綠色算力。
目前我國人工智能產業正處于高速發展階段,此次正式運營的公共智算中心,以中國電信天翼云自研TeleCloudOS4.0為底座,承載天翼云算力分發網絡平臺“息壤”、智算基礎設施平臺“云驍”、一站式智算服務平臺“慧聚”,構建算力聚合分發的新模式,實現全棧能力自主可控、安全可信,多項技術指標領先,可為大模型企業提供從算力供給、算力輸送、算力調度到模型訓練及推理應用的一站式服務。“慧聚”可針對大模型訓練微調場景,提供訓推一體化算力服務,實現萬卡資源調度;“云驍”支持多款國產芯片以及上層框架,可以對萬卡規模智算集群進行納管,算力、存儲、網絡多層次算力加速,全方位監控、故障自動感知,實現超大規模集群長穩運行;“息壤”算力網絡盤活上海區域零散的通算、智算和超算算力,目前已納管多個算力廠商,為企業提供普惠的智算調度服務。
作為引領新一輪科技革命和產業變革的戰略性技術和重要驅動力量,人工智能產業機遇正在加速涌現,算力服務對于推動產業轉型升級的賦能作用日趨顯著。天翼云將持續堅持科技創新,不斷夯實國云智算底座,推動人工智能技術成果轉化,為數字經濟發展蓄能添力,助推數字中國建設。