以AIGC为代表的人工智能应用、大模型训练快速崛起,智能算力需求激增,成为推动经济发展和科技创新的新引擎。同时,大量的能源消耗问题也随之日益凸显,为数智化与绿色化转型带来挑战。绿色电力和算力作为经济社会全面绿色化、数智化转型的核心生产力,正逐步向融合共生发展,以电力带动算力绿色升级,“算电协同”成为构建绿色高效数字经济基础设施的关键路径。
近期,西北地区某智算中心项目顺利落成,充分利用当地风电新能源优势,采用元脑42kW风冷智算算力仓,打造新一代“高密低耗“的风冷智算中心,是西北地区发展“算电协同”的一次成功创新实践,将为本地高精尖科技企业与研究机构等提供绿色高效的综合算力服务,促进以大模型应用为主的人工智能产业生态萌芽发展,推动人工智能技术与工业制造、能源等行业的创新融合。
元脑42kW风冷智算算力仓是为AI服务器定制的支持高算力密度部署的新一代基础设施,集计算、存储、网络于一体,具备高密部署、节能降耗、智能运维等优势。在西北某智算中心应用中,相比传统风冷数据中心,算力密度提升8-10倍,节省60%机房空间,降低电能损耗30%以上,风冷PUE值小于1.19,年节省用电320万度。目前该产品已在山东、河北、四川等地实现批量化应用落地。
西北地区发展 “算电协同”,智算中心建设需破解“高密低耗“难题
在 “双碳” 目标引领下,绿色能源发展成为时代命题。我国西北地区风能、光能等新能源资源富集,风电资源可开发量占全国三分之一,已建成千万千瓦级风电基地、百万千瓦级光伏发电基地。但当下,西北地区电力消纳能力有限,难以消化大规模新能源发电;同时,电网建设滞后,输电线路布局不合理,长距离输电过程中损耗大,绿色能源在并网和传输环节效率低下,导致绿色能源浪费,未能充分转化为经济发展的强劲动力,如何高效利用这些资源成为亟待解决的关键问题。
在此背景下,让算力靠近电力,在西北地区建设智算中心,推动“算电协同“,不失为一条破局的可行路径。在西北地区布局算力产业,将算力设施建在新能源发电场附近,能够实现电力与算力的高效对接,新能源所发电力可就近直接供应给算力设备,极大缩短电力传输距离,减少传输损耗,提高绿色能源利用效率,让电力更便利地转化为算力。而要实现“算电协同”,在西北地区建设智算中心面临着降低能耗、提升算力部署密度、数据中心高效运维等方面的挑战。
电算转化效率较低,能耗居高不下:丰富的风电新能源为西北地区发展“算电协同"提供了得天独厚的自然条件,但在实际操作中,如何高效利用绿色电力为算力提供动力,进而将算力转化为智力,是亟需解决的议题。当前的算力设备在将电力转化为算力的过程中,能效比存在上限,大量电力会以热能等形式损耗。特别是步入 AI 时代,高密度高性能的智算中心,为了维持设备的稳定运行,需要投入大量电力用于制冷散热,从而降低了电力到算力的实际转化效率,同时也使智算中心的能耗问题愈加突出。
有限空间内部署更高算力,算力密度亟待提升:随着服务器单机功耗和单机柜功率密度不断攀升,1台AI服务器就需要占用两个机柜的电力和散热资源,机柜资源、机房空间严重浪费。西北某智算中心的机房可用面积仅为200平米,为满足大模型应用需求,相比其前期采用传统风冷模块化方案建设的机房,算力密度直接提升至5倍,这意味着客户需要在更有限空间内部署更大规模更高算力,智算中心建设面临高密度部署的严峻挑战,需要将计算资源和电力资源进行高效整合与优化配置,以在有限空间内实现算力和电力供应的最大化利用。
传统运维无法统一管理,运维效率低:智算中心设备众多、系统复杂,传统运维方式效率低、成本高,难以满足智算中心的高效运维需求。IT 基础设施和动力环境的运维管理是两套系统,无法实现统一管理和远程调控,影响运维效率。同时,管理软件也不能及时依电力供应和任务优先级合理分配算力,导致电力浪费、算力利用不充分,电力转化效率低,难以保障智算中心高效稳定运行。加之西北地区受地理环境和经济发展水平等条件限制,在建设和运维过程中的硬件成本、资源成本更为突出,专业运维人才短缺,因此更需要在有限的资源下实现高效运维。
变“绿电”为“绿算”,42kW风冷智算算力仓打造“高密低耗”的新型智算中心
为发展“算电协同”,解决AI时代智算中心建设面临的低部署密度、高能耗、运维低效等挑战,西北某智算中心创新采用元脑42kW风冷智算算力仓,以AI算力为核心,兼容国内外主流的CPU和异构加速芯片,集计算/存储/网络于一体,高效融合机柜、配电、UPS、空调、监控、消防等系统,具备高密部署、节能降耗、智能运维等核心优势,是面向西北地区风电资源优势,变“绿电”为“绿算”,打造新一代“高密低耗”风冷智算中心的最佳方案。
节能降耗,年节省用电320万度:为充分利用西北地区丰富的绿电资源,创新将光伏、储能、余热回收等多种绿色节能技术有机结合。项目采用光伏发电技术将太阳能转换为电能,为数据中心提供清洁的电力来源,减少对于传统化石能源的依赖,降低碳排放;同时采用储能技术,让数据中心在电力需求低时储存能量,在高峰时段使用储存的能量,从而平衡电网负荷,降低耗电成本;并通过智能调度,根据光照强度和智算中心的电力需求预测,自动调整储能设备的充放电策略,提高能源利用效率。此外,元脑42kW风冷智算算力仓中的供配电系统创新采用了全功率简链路供电+高效UPS一体设计,实现兆瓦级一体解决方案,供电效率大幅提升,有效降低电能损耗30%以上,风冷散热PUE可降至1.19以下,远低于传统风冷智算中心,让绿色电力最大化的转换为算力,年节省用电320万度。
高密部署,节省60%建设用地:元脑42kW风冷智算算力仓采用独创的冷热通道封闭和制冷双群控策略实现高效散热,保障智算中心高密度部署,将风冷机柜的单机柜功率密度由传统的10kw以下提升至42kw以上,单台机柜即可支持4-6台GPU服务器上架运行,相比传统微模块建设方式,节省了60%机房占地面积,最终实现在200平米的机房内部署了4套算力仓,可同时容纳128台GPU服务器及配套管理服务器、交换设备、存储设备的上架运行,降低了近30%机房建设成本,并节省IB组网成本500万元。
智能运维,运维效率提升一倍:元脑42kW风冷智算算力仓采用AI基础设施管理平台,解决IT基础设施管理和动力环境管理两套独立软件平台的数据不互通问题,可直接集成动环监控参数,实现了智算中心的统一纳管,并进行高密单排微模块2D/3D可视化、核心制冷部件远程调控等5大功能创新,实现智能管理、精准运维,运维效率提升一倍,大幅提升电力转化效率,安全可靠性提升30%,为大模型训练与推理提供稳定的运行环境。同时,采用AIStation智能业务生产创新平台,能够有效提升大模型算力平台的使用效率,加速AI大模型开发与部署。
该智算中心的顺利落成,为西北地区发展“算电协同”,打造高密度、低能耗的新型智算中心建设提供了样板,目前已为多家科研院所、企业提供算力测试和商用服务,支撑西北地区及北京、重庆等多地的大模型训练和推理等应用,服务智慧城市发展,推动人工智能与工业制造、生物医学、金融商贸等行业的创新融合,推动西北地区从传统能源化工向人工智能产业转变,吸引数据、算法、算力各相关领域,特别是算力应用企业落地,实现基于绿色能源与AI算力联动的算力创新与应用,推动区域经济转型升级。