首页 > 关于我们 > 新闻中心 > 服务器带内管理软件首个开源项目!开放计算标准工作委员会(OCTC)发布

服务器带内管理软件首个开源项目!开放计算标准工作委员会(OCTC)发布

2024-10-10

在大数据、云计算、人工智能等技术的推动下,各行业对算力的需求迅速增长,数据中心的服务器数量骤增,服务器管理软件的种类也随之增加。但不同管理软件缺乏标准接口和统一的管理规范,协同工作困难,导致管理效率低。为此,开放计算标准工作委员会(OCTC)正式发布了服务器带内管理软件首个开源项目,旨在为服务器带内管理提供一套功能全面、高性能、易扩展的标准化管理软件,支撑海量设备的精细化、智能化运维,全面提升数据中心运维管理的质量与效率。

1.jpg开源地址:https://gitee.com/OCTC_OM/InManageDriver

服务器管理标准化的需求日益急迫

随着AIGC等应用的推动,数据中心算力基础设施正向多元化、规模化方向发展。要实现大规模异构、多厂商算力设备的高效稳定运行,传统闭源的服务器运维管理系统面临诸多挑战:一方面,一般的服务器管理系统缺乏标准接口和统一的管理规范,无法快速适配和管理多厂商异构设备,系统之间的数据共享与集成困难,管理方式粗放、效率低;另一方面,闭源代码限制了用户对管理软件的使用和二次开发,阻碍了技术创新,同时潜藏安全风险。因此,数据中心服务器管理迫切需要更为开源、开放的生态标准,简化多品牌、多类型设备的运维流程,提升效率、降低成本,并增强安全性,推动服务器运维管理技术的创新发展。

当前数据中心服务器的管理分为带外管理和带内管理,两者相辅相成。带外管理(Out-of-Band Management)是通过独立于服务器主处理器和操作系统的管理方式,利用专用的网卡或管理口对服务器进行7X24的远程实时监控、配置和控制。带内管理(In-Band Management)依托服务器本身的操作系统,管理数据与业务数据共享相同的网络通道,更容易对业务系统的核心性能如CPU使用率、内存使用率、存储IO、网卡速率等指标进行实时监测,帮助用户快速识别风险,并能够方便的进行固件配置和升级。带内与带外管理的管理路径各异,但各有优势,互为补充,覆盖了数据中心广泛的运维管理场景,保证数据中心高可用性,并提升运维管理效率。

针对带外管理,大规模数据中心用户、系统厂商、芯片厂商等产业上下游伙伴共同建立了开源生态 OpenBMC。OpenBMC采用先进开放的软件架构,功能模块之间通过一致的系统总线接口协议进行交互,扩展性高,能够实现灵活的模块化开发,已经成为大规模数据中心服务器带外运维管理的首选。但在带内管理方面,目前仍然缺乏明确的标准规范,鲜有能够统一纳管不同品牌和不同类型的设备的管理软件,影响了数据中心整体管理效率。

此次OCTC发布服务器带内管理软件首个开源项目,旨在基于开放的系统架构,为服务器的带内管理提供一套标准化、规范化的管理软件,同时对服务器标准化管理展开积极探索与实践,持续推动数据中心基础设施管理标准化、规范化发展。

OCTC发布服务器带内管理软件首个开源项目

此次OCTC发布的服务器带内管理软件是面向数据中心服务器全方位、全生命周期管理的带内管理工具。这款带内管理软件不仅具备全面、精细化的带内管理功能,包括数据采集、监控分析与配置管理,也对齐了带外BMC的现有功能,加速数据中心服务器的标准化、精细化和智能化管理。

2.png服务器带内管理软件系统架构

开源管理软件,更精细更智能:在功能上,开源带内管理软件基于IPMI驱动打通带内带外管理,能实时收集带内带外关键性能指标,为更精细的管理运维奠定基础。同时该软件提供基于监控项阈值、智能日志分析、性能趋势分析的监控告警机制,实现服务器各部件与关键指标的秒级监控与故障智能预警。管理软件基于模块化的架构设计,提供插件化的扩展方式,用户可按需扩展功能。

资源占用率超低,性能卓越:在性能上,带内管理软件基于优化的时序数据库对性能数据进行持久化处理,在提升查询效率的同时有效节省存储空间。管理软件的平均CPU消耗不超过3%,内存占用低于200MiB,居于行业领先水平。同时,管理软件具备自动熔断能力,在超过CPU或内存特定限制时,自动降频,确保对操作系统的影响最小。

兼容多架构、系统,灵活扩展:在兼容性上,带内管理软件采用Go语言交叉编译,支持主流服务器架构与操作系统,并通过标准化北向接口(如Redfish、SNMP、HTTP)与第三方系统无缝集成,可作为BMC Agent实现BMC带内功能扩展,为数据中心运维平台提供全面而灵活的纵向和横向功能扩展。此外,在安全上,管理软件具备完善的安全策略与隐私保护机制,有效防止敏感数据泄露。

开源开放的标准化管理是数据中心管理的必然趋势。OCTC热忱欢迎产业上下游伙伴一同加入,汇聚开源力量与智慧,为业界提供开放标准、安全易用的带内管理软件,以提高数据中心的运维效率和质量,降低运营成本,同时也为后续数据中心服务器管理的标准体系建设奠定坚实基础,助力数据中心管理生态的优化与升级。