KeyarchOS与AMD Turin基础的软硬融合解决方案

概述

在云计算和数据中心日益增长的运维需求中,软硬融合以充分释放硬件能力成为其核心资源优化方式。KeyarchOS作为一款面向构建应用和数据优化的云原生操作系统,在AMD Turin平台上进一步改善了计算资源的分配和高仿真提供。这样一个平台解决方案帮助企业在最低成本下充分释放AMD Turin的构件优势,释放极致性能。

浪潮信息云峦服务器操作系统 KeyarchOS

云峦KeyarchOS是浪潮信息基于Linux内核、龙蜥等开源技术自主研发的一款服务器操作系统,支持x86等主流架构处理器,具备成熟的CentOS迁移和替换能力。产品具备稳定可靠、高效软硬协同、智能运维、安全可信等特性,增强了对云计算、人工智能等场景的支持,性能稳定性领先,生态完善,符合金融、能源、交通、通信、教育、医疗等关键行业的应用要求。                     

                        1.png                        

浪潮信息云峦服务器操作系统KeyarchOS系统架构


第五代 AMD EPYC™ 处理器

第五代AMD EPYC™处理器是AMD为现代数据中心、云计算和人工智能工作负载设计的高性能服务器CPU。

以下是关于第五代AMD EPYC™处理器的一些关键特性:

·       充分提升每台服务器性能:使用AMD EPYC(霄龙)9005处理器,在机架数量减少多达86%的情况下仍能实现与原有硬件相当的整数性能,大幅减少了物理占用空间、功耗和所需软件许可证数量,从而为运行全新或扩展的AI工作负载腾出空间。

·       卓越的AI推理性能:基于AMD EPYC(霄龙)9005 CPU的纯CPU型服务器能够高效处理大量AI工作负载,如具有130亿个及以下参数的语言模型、图像和欺诈分析或推荐系统。与上一代产品相比,运行两个第五代AMD EPYC(霄龙)9965 CPU的服务器可实现高达2倍的推理吞吐量提升。

·       业界卓越的整数性能:基于AMD EPYC(霄龙)9005 CPU的服务器借助全新“Zen 5”核心在主要性能指标上表现出色,其中整数性能是同类产品的2.7倍。

·       专为云计算而生:AMD EPYC(霄龙)9005系列处理器兼具卓越密度和性能,非常适合云计算工作负载。旗舰级AMD EPYC(霄龙)9965处理器拥有192个核心,能够支持更多的虚拟CPU(vCPU)(1个vCPU对应1个核心)。

·       非凡性能、密度和能效:AMD EPYC(霄龙)9005系列处理器配备多达192个“Zen 5”或“Zen 5c”核心,具有出色的内存带宽和性能。创新的AMD小芯片架构成就高性能、高能效解决方案,并且根据不同计算需求进行全面优化。

解决方案概述

1. KeyarchOS云原生操作系统

KeyarchOS面向多核和多线程环境优化设计,按需装载,支持计算力和访问比例优化:

·        核心优化框架:KeyarchOS支持自动分配和加载功能,应用层可根据应用需求优化对硬件的使用。

·       计算和内存加速:通过并行线程的分布和操作标准化,最大化利用内存带宽和核心。

·       I/O优化:构件性操作和自动间连,降低应用、存储和实时操作的延迟。

2. AMD Turin基础硬件能力

AMD Turin提供了以下重要标志性能力:

·       Zen 5核心和混合和件的构件优化:支持多核和高密度。

·       PCIe Gen5和CXL 2.0高速连接:助力高宽带和优化内存。

·       自适应计算力分配:根据操作的应用随时动态分配计算资源,优化充分利用率。

3. 软硬互动设计:释放极致性能

·       构件完美协同KeyarchOS使用功能模块化和标准化设计,将AMD Turin的核心和门带应用到最大化。

·       全自动运维和加载:使用KeyarchOS的源码钥量分析和征集器,能动态选择最优计算过程和硬件完成。

·       AI助力分析和监控:KeyarchOS基于AMD Turin的实时分析和自定义分类助力添加团队和工作流。

4. 企业应用框架和配置框架优化

·       最低入门成本:用于个人用户和中小型企业和数据中心。

·        高质量与集成性能:在自动化运维和集成层面,通过超大量和较低完整自完成功能。

5. 兼容性测试和EDAC特性验证

·       兼容性测试:完成在安装KeyarchOS 5.8SP2-U1镜像的A8机器上进行兼容性验证,ancert测试通过。

·       EDAC特性验证:完成对AMD Turin处理器EDAC特性验证。使用AMD RAS Error Injection Tool工具进行EINJ-based的注错,验证了7项注错,主要包括NBIO-IOHUB、GMI3/xGMI3、DRAM ECC、DRAM Parity、DRAM UECC、UMC SRAM、USB/SATA。