首页 > 关于我们 > 新闻中心 > InService托维平台推出智能诊断本地版,打包您的 “贴身故障专家”

InService托维平台推出智能诊断本地版,打包您的 “贴身故障专家”

2024-10-18

近日,浪潮信息InService托维平台推出智能诊断本地版,支持私有云环境下运行。依托于独有的“专家规则+AI算法”,智能诊断系统通过本地分析设备运行信息,实现对服务器“部件级”故障快速且精准地诊断,并给出解决方案建议,帮助运维人员在面对设备隐患和故障时快速进行响应。

1.jpg智能诊断系统架构

服务器作为数据中心的核心IT基础设施,一旦出现问题,轻则造成业务性能下降,甚者将引发业务中断,带来不可估量的损失,如何快速的进行故障诊断、准确定位问题并恢复业务就显的至关重要。运维就像“永无休止的战争”,时刻面临挑战。

故障定位难:复杂故障发生可能涉及硬件、操作系统及上层应用多达几十种日志类型、上百个日志文件、数十万条日志数据,同时需要综合分析故障发生时间、频次以及报错记录间的复杂逻辑关系。即便是老练的技术专家也需要大量时间做故障定位。

私有化环境:对于金融、通信等客户而言,考虑到数据安全的因素,数据中心多采用私有云部署模式,无法使用在线托维纳管服务,对人员调配和技能素质的要求更高。

自平台运维:为了提高整体IT运维管理效率,大型数据中心客户往往会选择使用自有运维管理平台集中运维管理设施,更希望用灵活接入的方式,迭代和优化自有平台能力,而非全替代方案。

针对上述情况,浪潮信息InService托维平台提供可本地运行的智能诊断系统,为客户提供更优质、更智能化的诊断故障服务。智能诊断本地版支持通过API对接方式,灵活集成在本地自有运维管理平台。

2.png智能诊断系统数据看板

当发生设备异常或业务中断时,智能诊断系统只需要秒级时间,即可全面分析设备带内/外的日志数据,把整个硬件系统“摸排”一遍,并给出故障分析与解决方案,帮助运维人员进行快速故障定位,极限时间内抢修。同时,客户也可以将智能诊断系统融入到日常设备健康巡检的过程中,进行定期“体验”,提前识别故障风险隐患,并采取计划性地停机修复措施,减少意外宕机的概率。

智能诊断系统的专家规则库是基于浪潮信息20多年服务器维护经验,结合百万例故障诊断实例总结而成,包含诊断规则20000多条,覆盖95%以上的各类基础硬件故障场景,可以根据不同报错的关键词、时间、频次进行综合诊断并定位具体故障部件。另外,通过引入Word2Vector、XGBoost、神经网络等AI算法,利用海量服务器维修数据进行训练并生成最优智能诊断模型,进一步增强整体故障诊断能力,主要部件诊断准确率超90%。

3.jpg智能诊断系统具体诊断实例

除此之外,浪潮信息推荐在线的InService托维平台,为接入公有云的客户提供包括7*24主动托维、智能故障/性能预测、自动化微码版本推荐、智能机器人问答、生命周期管理等更多服务,实现全场景一站式的主动智能服务。