近日,浪潮信息G7服务器全新上市,并发布NVH技术和智能听音诊断技术两项服务器新技术,为全新上市的G7算力平台提供极致的性能、可靠性和易维护性支撑。
服务器NVH(Noise噪声、Viberation振动、Harshness平顺性)技术让服务器计算满负载时的磁盘读写性能翻倍,并且防止数据中心各类高频噪音对磁盘产生不可逆的损失;
智能听音诊断技术让服务器风扇的故障预警准确率达到95%,将这一会引发服务器故障和数据中心事故的安全隐患降到最低。
雕刻声音:以严谨的实验精神破解“金丝雀”难题
早在17世纪,英国人便将金丝雀放入矿井进行空气质量检测,鸟儿停止唱歌即意味着空气已达到致人中毒的水平。这是在科学无法破解空气成分变化机制的情况下,被迫做出的“浪漫主义”选择。
服务器里的声音,同样是个“黑盒子”,甚至“金丝雀”已经叫了很久,人们才意识到它的存在。四五年前,很多厂商几乎同时遇到了一个问题:风扇转速越来越快,硬盘可能出现性能波动,严重时还会直接掉线——最开始以为振动是罪魁祸首,后来才发现声音才是始作俑者。
通过实验观察可知,众多高转速风扇产生的噪音能达到120dB,极易造成硬盘磁头偏移、读写效率下降,进而导致扇区失效乃至硬盘报废、服务器宕机,带来难以估量的损失。
锁定了故事的主角,依然挡不住后续情节的扑朔迷离。在尝试过正弦波、1/3倍频程等走不通的路径后,浪潮信息研发工程师找到了最合适的噪音带宽,并以混频、扫频的模式模拟出多样化的噪声源,能够测量硬盘在500Hz~10000Hz噪音刺激下的共振频率和声压阀值。
基于大量机理性研究和测试,浪潮信息还发现硬盘性能损失与声压强度间的数学规律,构建出业界首个硬盘敏感度模型,量化出不同硬盘受到各类噪声影响后的性能表现。
尤值一提的是,在机箱振动噪音测量系统中,浪潮信息与上游厂商合作专门设计了“硬盘假体”,采集服务器机箱内的噪声和振动,并将假体获取的频谱和硬盘敏感度模型融合匹配,精准计算出硬盘内部的共振频率以及由此产生的损失率。
服务器里声音的“黑盒子”就这样被打开了。在确定机箱内真正影响硬盘工作的噪音频谱的基础上,浪潮信息的工程师对服务器系统展开全方位的优化设计。首先从噪声振动的源头入手,通过CFD流体动力学仿真改进风扇的叶片形态,抑制扇叶表面因涡流脱落形成的高频噪音;其次,在机箱内通过设计40多种歌院式的消音结构,有效消除特定的高频噪声;此外,还对硬盘固件中的伺服控制算法进行调整,让硬盘磁头的噪声共振摆动控制在10纳米以内,在提升读写效率、性能翻倍的同时,实现服务器安全运行。
曾经在汽车界被称为“玄学”的NVH(noise vibration harshness),没想到在服务器领域觅得破解之道。科学实验、数学模型再叠加研发团队的倾情投入,终究可以超越古典意义的“金丝雀”效应。
闻风听诊:以智能化方式为服务器“治未病”
“治未病”的理念最早记载于《黄帝内经》,其首次提出“上工治未病,不治已病,此之谓也”。扁鹊推崇大哥医术的故事,将“治未病”的方法论进一步升华,以“望闻问切”的方式觉察病情苗头,成为防患于未然的关键。
就服务器而言,良好的散热是保障系统稳定可靠运行的根基。散热风扇虽然仅有1%的可能发生故障,但其一旦“掉链子”,将给数据中心业务带来巨大的不确定性风险。因此,提前预测风扇的健康问题,以便为服务器“治未病”,一直是业界的梦想。
那么,风扇有“疾”的信号藏在哪里呢?谜底就在谜面中。浪潮信息的研发工程师发现,服务器风扇运转时产生的气动噪声中,携带着风扇性能状态的信息,可借此剖析其健康情况。与中医里的“悬丝诊脉”类似,服务器领域也可以“闻风听诊”,将风扇的“病灶”扼杀于萌芽。
不过,数据中心通常有上万台服务器,若采用一般的声音分析方法,嘈杂的声纹特征很容易被混淆,难以精准识别。借助人工智能技术从风扇噪音中提取特征信息,预测风扇故障,也许是不错的解题思路。
答案飘在风中,唯有打造利器方能读懂声音的含义。浪潮信息利用机箱内噪声的特征信息,建立了业界首个基于声学探测的服务器风扇故障智能预警系统。该系统融合了长达200个小时的服务器故障音训练集,可对声纹信息抽取40维MFCC特征,基于多级深度学习神经网络,精准辨别噪音背后潜在的服务器风扇故障。
更为重要的是,有了这套系统的加持,服务器可通过内部的麦克风阵列、音频处理芯片,采集系统的多维噪音,并进行声学信号处理,基于主板BMC芯片中的风扇故障智能诊断模型仅需10秒钟“听音”,就可准确预警风扇故障位置及类型,精准度达95%,从根源上解决了服务器系统风险难题,扫除了数据中心的后顾之忧。
不管是NVH技术的“雕刻声音”,还是人工智能加持的“闻风听诊”,都为重塑服务器系统之美树立了标杆,它们的诞生历程与演进路径具有示范效应。
NVH、智能听音诊断技术正是浪潮信息G7算力平台催生的研发成果。据了解,G7采用开放、多元的架构设计,整个系统需要经过30多个开发流程,使用150多种加工制造工艺,对280多个关键过程控制点的质量进行严格把控。围绕G7算力平台的技术微创新涵盖多个领域,为业界探索平台型技术的演进提供了参考的方向。