AC米兰技术文章

article

AC米兰官网-中国信息通信研究院:智算运维产业发展研究报告(2025)

更新时间:2026-02-20点击次数:

  AC米兰·(中文)官方网站-Milan brand-

AC米兰官网-中国信息通信研究院:智算运维产业发展研究报告(2025)

  《智算运维产业发展研究报告(2025)》系统梳理了我国智算运维产业发展现状、核心挑战、能力建设体系及未来趋势,并结合典型实践案例给出落地参考,指出智算运维作为AIOps在算力领域的垂直深化,已成为保障智算基础设施稳定高效运行的核心支撑。

  当前智算运维产业呈现“政策牵引、产业扩张、技术跃迁、应用深化”的发展态势,国家与地方政策体系持续完善,推动智算中心建设落地,我国智能算力规模持续攀升,大模型向垂直行业深耕,智算系统向超节点形态演进,政务、金融等行业的推理场景需求爆发,驱动运维模式从人工向智能化、平台化、自治化转型。

  同时,产业发展也面临多重核心挑战:多用户多场景训推并行引发资源失衡,超节点形态对运维的可靠性、可观测性提出更高要求,运维语料多源异构制约智能运维大模型训练,系统与业务面临多重安全威胁,节能调度优化压力大且液冷技术带来连锁失效风险。

  针对上述挑战,报告提出需构建五大核心服务能力:通过虚拟化、池化技术及差异化调度算法实现算力高效调度;从可观测性、故障根因分析、自愈及主动运维四方面打造智能运维能力;建立统一数据规范,实现数据融合与场景化标注,夯实数据治理基础;构建覆盖硬件、系统、数据、模型的全链路安全防护体系;从设施、设备层面发力,结合算电协同打造能效保障能力。

  报告展望,未来3-5年智算运维产业将迎来深度变革:技术上多要素协同演进,向纵深智能化发展;市场从“拼规模”转向“拼效率、拼服务、拼价值”,垂直场景运维能力成增长点;生态上产业链协同加深,标准体系持续完善,形成开放融合的新格局。

  此外,报告还展示了中国移动、联想燧弘、科大讯飞的落地实践,三者分别在超大规模集群运维、异构算力统一调度、AI节能优化等方面形成技术创新与实践成果,验证了智算运维能力建设的可行性,为产业发展提供了可复制的技术范式与实施标准。