日前,全球权威调查机构IDC发布厂商追踪报告《IEIT SYSTEMS Focuses on Full-Stack Innovation, Data, and Industry Collaboration》 ,报告指出浪潮信息通过全栈创新、数据驱动以及产业协同等三大举措来落实业务战略,充分把握AI以及其他领域的重大机遇,并将中国市场获得的经验扩展到全球其他地区,保持了业务的快速增长。
根据报告摘要,三大战略举措如下:
全栈创新,包括计算、存储和网络等IT基础设施,数据中心技术,数据处理和算法开发等领域的全面创新;
数据驱动,面向行业数据构建有效的数据流,解决人工智能应用的数据挑战;
产业协同,全面支持开源开放技术,发展元脑生态,推进AI行业应用;与客户携手探索了JDM模式,共同成长。
以下是报告具体内容
全栈创新
浪潮信息在计算/存储/网络等IT基础设施、数据中心技术、数据处理和算法开发等领域全面创新,成功将技术创新与人工智能模型开发结合,并用更少的计算资源训练出更大参数的源系列大模型。凭借全栈创新,特别是在液冷和大模型技术的大力投入,浪潮信息可以有效应对市场波动,保持竞争优势。
服务器和计算平台
丰富产品线:AI 应用的普及给IT 基础设施带来了挑战,传统企业、CSP等不同用户的需求持续变化,并且进一步分化。浪潮信息服务器产品线十分丰富,主要分为专为各种使用案例和部署场景设计的通用服务器(涵盖机架式、塔式和多节点等不同形态),以及用于 AI、边缘和其他使用案例的专用服务器和计算平台;
存储系统
面向AI的存储产品布局:浪潮信息在 AI 战略的背景下确定了两种主要类型的存储解决方案:面向分布式非结构化数据的软件定义存储,适用于数据收集、准备和模型训练,以及以闪存为主的主存储,适合模型推理和应用程序。浪潮信息将性能、效率和弹性确定为其存储产品主要的技术升级方向,引入了多核并行处理、智能缓存优化和数据预取等技术,可以减少数据副本的数量并增强跨全局命名空间的数据移动;
互连
专为AI训练的X400:为了满足AI工作负载,特别是 LLM 工作负载的网络需求,浪潮信息推出了一款支持 128 个 400GbE 端口的 X400 以太网交换机。该产品可以将 LLM 模型训练性能提高 1.6 倍,实现自适应路由、多租户流量隔离、低延迟和高带宽利用率。预计到 2027 年,40% 的企业将部署 GenAI 网络交换矩阵,以便在自己的数据中心为 GenAI 工作负载提供成本和性能优化的支持。浪潮信息X400等产品是构建公司 AI 结构的基础元素。
数据中心基础设施和可持续性
液冷走向标准化:AI普及带来了高密度计算需求,并对数据中心的电源使用效率提出了挑战。电力将成为未来 GenAI 部署的主要瓶颈,如果该行业要直面可持续发展挑战,液冷解决方案的共同开发和标准化将至关重要,许多专注于 GenAI 的公司正在积极采用液体冷却技术解决方案,尤其是冷板方案。浪潮信息正在与英特尔等合作伙伴密切合作,大力推动液冷的标准化,积极参与行业标准的开发制定,同时推出各类产品方案,推动液冷的普及;
全栈液冷产品布局:浪潮信息的液冷产品分为三个层次,计算节点级、机架级和人工智能数据中心(AIDC)级,其中AIDC方案在风冷模式下单机柜功率 48kW,液冷模式下高达130kW,已在四川、河北和辽宁等等众多地区部署应用;
算法开发
源系列大模型:浪潮信息成功将IT软硬件技术创新与人工智能模型开发有机融合。浪潮信息过去三年在LLM开发和训练中投入了大量资金,源1.0于2021 年完成,有 2457亿个参数。源 2.0(2023 年完成)和源2.0-M32(2024 年完成)。Yuan 2.0 获得了数学和逻辑增强功能,以提高模型的准确性。Yuan 2.0-M32采用混合专家 (MoE)架构,使用时仅激活 37 亿个参数,计算资源消耗更低。
Neo Cloud
持续增长的本地化AI部署需求:企业、政府等组织正在部署专用云和本地化GenAI方案,以满足应用过程中的数据隐私要求和对平台的高性能要求,这类行为推动了硬件投资的增长。2024年一季度的云计算市场调查结果显示,75% 的全球化云计算买家正在投资 GenAI,他们总支出的 15% 用于本地环境中的硬件投资;
一体化GenAI方案:浪潮信息推出一种新的专用云解决方案Neo AI Cloud,以帮助组织更快地采用 GenAI。Neo AI Cloud 可以完全交付给企业自建,也可以以模块形式提供给互联网服务提供商。该方案是 AI 原生集群,可以实现租户自动管理和计费,并让租户具备裸金属访问能力,集成的EPAI 大模型开发平台让用户可以访问业界主流模型和各类开发工具链,以便更轻松地构建商业 GenAI 解决方案。
数据驱动
浪潮信息推出了大模型应用开发平台元脑企智(EPAI),该平台为加速客户LLM应用落地而设计,涵盖了数据驱动方法和系统优化的所有要素,并具备数据保护和安全功能,同时配有API、智能体以及对话式AI界面。
三大工具集:为了确保高质量数据的可用性,浪潮信息发展了数据管理、模型微调和RAG三大工具集,数据管理工具集数据提取准确性超过95%,微调工具集可对 20 多个开源 LLM 进行无代码优化,RAG工具集应用于私人知识库系统,准确率超过 90%;
EPAI平台:上述工具集统一集成到了大模型开发平台元脑企智 EPAI,该平台具备数据保护和安全功能,同时配有API、智能体以及对话式AI界面,可以让用户轻松完成数据处理到模型训练、应用部署等每一项AI应用工作。
产业协同
开放趋势:未来12个月内,64%的组织已经或计划在本地环境部署AI基础设施,面对CPU速度、内存到网络、电力及冷却要求等多方面挑战。这些组织更希望采用开源的IT基础设施技术来解决这些挑战,以保持IT基础架构的灵活性。
拥抱开放计算:浪潮信息坚定拥抱开源开放技术,参与了OAM、OTII等开放计算项目,向社区捐赠了UBB设计,正在投资开发新一代 OAM 和 UBB 2.0 标准,并预计明年发布相关参考设计;
源大模型开源:浪潮信息利用其在开发和使用 LLM 方面的专业知识,与客户分享这些专业知识并帮助他们开发自己的 LLM 项目。在 浪潮信息为模型训练收集的 5TB 高质量数据已全部开放,这些数据已用于 50 多个大型模型的开发。
JDM模式:JDM 是一种现代企业合作模式,强调供应商与其客户在产品设计、开发、制造和交付过程中的密切合作。浪潮信息与客户一起探索 JDM 运营的最佳商业模式,并不断创新以与客户共同成长;
元脑生态:汇聚咨询、开发、集成和服务提供商,涵盖从算法、计算、数据、互连到模型和框架的每一个产业环节,为金融、运输、健康、科研、能源、商业、水利和电信等一系列行业提供解决方案。
分析师建议投资前沿,加快海外拓展
据IDC数据,到2028年,全球AI支出将以每年29%的速度增长,包括AI驱动的应用程序、基础设施和相关IT服务,预计整体规模将达6320亿美元,其中GenAI以59.2%的年复合增长率超越了整个AI市场的增长。
2024年上半年,浪潮信息的全球服务器和存储系统销售收入保持高速增长,增长动力主要来自于AI业务。IDC 预计AI服务器的需求将保持强劲,虽然不排除会出现一些波动。分析师建议浪潮信息采取以下措施,以更好抓住加速服务器市场机遇,应对市场波动。
需要对区域市场需求和偏好有广泛的了解,扩大区域技术合作伙伴和专业服务提供商的生态系统;
利用提供针对特定行业和或工作负载优化解决方案的经验应对全球竞争;
可持续性和能源消耗相关的需求因地区而异,浪潮信息应加深对行业标准制定的参与,并为全球技术社区做出贡献。