本站点使用Cookies,继续浏览表示您同意我们使用Cookies。
Cookies和隐私政策>
3月25日,浪潮信息宣布元脑企智DeepSeek一体机推出“双模”版,单机可同时部署、运行671B参数的DeepSeek R1与V3模型,并可高性能支持2000用户并发服务,结合领先的元脑企智EPAI企业大模型应用开发平台,将为各行业用户提供强大、好用、易部署的大模型应用系统。
“快思考”与“深度思考”并行,赋能企业效率提升
DeepSeek V3 与 DeepSeek R1 模型均基于混合专家架构(MoE)与多头潜在注意力(MLA)技术底座,但在技术路径与应用定位上展现出差异化发展方向。
■ DeepSeek V3 (671B/685B):以低成本和高通用性见长,适合广泛的应用场景,如智能客服、多语言翻译、内容生成等,能够高效处理各种文本生成、摘要和对话任务。最新的DeepSeek V3-0324模型在长文本理解、多轮对话与通用问答等方面表现提升明显;
■ DeepSeek R1 (671B):通过强化学习实现了专业领域的推理突破,专注于复杂逻辑推理任务,如数学证明、代码生成和决策分析,支持“思维链”输出,展示推理过程,提升透明度和可信度。
DeepSeek一体机作为一种高效、经济、安全的私有化交付方式,已逐渐成为企业用户快速实现本地化部署DeepSeek R1 671B或DeepSeek V3 671B/685B模型的重要途径。企业在实际业务运行中,简单和实时任务要求快速推理,复杂逻辑、跨领域、创造性任务则需要深度思考。如何通过一台DeepSeek一体机同时实现“快思考”和“深度思考”,企业根据任务特性合理分配两种推理模式,显著提升问题解决的效率与质量,充分发挥DeepSeek在实际业务场景中的最大价值,这也成为了业界更为关注的研究方向。
元脑企智DeepSeek一体机,支持671B R1和V3同机运行
浪潮信息团队针对用户的这一迫切需求,从AI 服务器、推理框架、大模型应用软件等多个方面开展适配与优化工作,推出元脑企智DeepSeek一体机,已适配支持DeepSeek R1 671B、DeepSeek V3 671B/685B模型,实现了“快思考”与“深度思考”能力的全面融合,助力企业用户在全场景下充分释放DeepSeek大模型能力。
元脑企智DeepSeek一体机NF5698A7原生支持FP8计算引擎,以1536GB HBM3显存、5.3 TB/s 内存带宽实现了显存容量与通信效率的黄金组合,完美适配 DeepSeek R1模型“短输入长输出、显存带宽敏感”的技术特性,单机支持全量DeepSeek R1与V3模型推理情况下,仍保留充足的KV缓存空间,配合896 GB/s P2P带宽的高速通信架构,在保障单机部署张量并行效率的同时,实现大模型推理解码阶段的极致加速,为DeepSeek R1与V3模型提供强劲算力支撑与稳定运行保障。
此外,得益于超大显存,NF5698A7能够同时部署、运行DeepSeek R1与DeepSeek V3模型,为用户带来了“开箱即用”的解决方案,降低了DeepSeek模型部署的技术门槛,快速实现大模型在业务中的应用。
∆元脑企智DeepSeek一体机
支持671B R1和V3模型同时运行
浪潮信息技术团队对DeepSeek大模型的MoE架构与MLA 注意力机制进行了专项工程优化,并应用于最新版本的SGLang (Version: 0.4.3.post2) 推理框架中。SGLang是开源推理框架领域的新兴力量,凭借其高性能后端运行时、可扩展前端语言生态及对主流大模型的原生支持能力,持续获得行业高度关注。在使用NF5698A7同时部署DeepSeek R1与V3两个大模型的情况下,单用户场景达到44 tokens/s推理速度,多用户并发场景下支持超过2000路的服务能力,保障对外服务的效率与稳定性。
全面适配元脑企智EPAI平台,高效支持业务
与此同时,NF5698A7已与元脑企智EPAI大模型开发平台完成适配,全面兼容DeepSeek R1与V3大模型,通过四大核心工具显著提升DeepSeek模型的回答准确率、降低模型幻觉,为企业提供高效、安全的一站式开发平台。
■ 基于端到端优化RAG pipeline和冠军级中文嵌入模型Yuan-EB的知识检索模块,结合混合检索与结果重排技术,使检索精度超90%;
■ 插件管理实时对接企业知识库,智能体编排实现多模型协同决策,最终将企业应用回答准确率提升至95%
■ 平台采用“低代码+可视化”开发环境,集成主流框架支持DeepSeek全参数模型分钟级上线,并通过拖拽式工作流编辑器将复杂应用的开发周期缩短80%(如质检系统开发从3周降至3天);
■ 在安全稳定性方面,采用多层防护机制涵盖输入过滤、输出审核及数据加密,确保企业数据隐私与生成内容安全,助力企业快速构建高准确、高稳定、深度融合业务数据的专属智能应用。
∆借助EPAI平台
将“快思考”与“深度思考”能力在复杂业务流程中相结合
在构建复杂业务流,如产品项目管理或会议助手等场景时,用户可以通过元脑企智EPAI平台巧妙融合DeepSeek V3 和 DeepSeek R1的独特能力,以实现高效且专业的业务支持。
DeepSeek V3具备“快思考”的特性,使其成为复杂业务流中处理各类文本交互的理想选择。在产品项目管理中,它能够高效应对内容生成任务,如撰写项目计划、需求文档、进度报告等。在会议助手场景下,它可以快速生成会议纪要、整理发言摘要,还能提供多语言翻译服务,打破语言障碍,确保信息的准确传达。其在长文本理解、多轮对话与通用问答任务上的表现显著提升,能够更好地与用户进行深入交互,理解复杂的业务需求,为项目管理和会议组织提供全面的信息支持。
DeepSeek R1的“深度思考”能力则在复杂业务流的逻辑推理环节发挥关键作用。在产品项目管理中,涉及到资源分配、进度规划、风险评估等复杂决策时,DeepSeek R1可以进行精确的逻辑推理和分析,通过“思维链”输出展示推理过程,帮助项目团队成员理解决策依据,提升决策的透明度和可信度。在会议助手方面,当遇到需要解决的复杂问题时,它能够进行深度分析和推理,为会议参与者提供科学的解决方案。
∆元脑企智DeepSeek一体机
为企业智能化转型提供一站式”双模“支持
借助元脑企智EPAI平台,用户可将 DeepSeek V3 的“快思考”能力与 DeepSeek R1 的“深度思考”能力相结合,构建出功能强大、全面且专业的复杂业务流系统,为企业业务的智能化转型进而实现提质增效提供强大的一站式智能大模型支持。