近日,浪潮信息AIStation人工智能平台助力某省人工智能工程师竞赛,快速构建了一站式部署的竞赛实操平台,实现了对计算资源的动态、高效管理,让众多选手同台训练大模型,助力高技能“数字工匠”培养。
本次竞赛共设置人工智能理论考试和实操技能竞赛两个比赛科目,理论考试主要考察计算机视觉、自然语言处理等方面理论知识,实操技能竞赛则要求参赛人员在竞赛平台完成数据处理、业务分析、智能训练、智能系统设计等技能操作。
竞赛筹备过程中,在实操竞赛平台构建方面遇到较大挑战。人工智能训练对算力资源需求大,涉及数据处理、开发环境构建、模型训练等多个环节,特别是基础AI开发环境的构建繁琐且耗时。如何充分利用算力资源,满足数十名参赛人员同时使用且保证无故障?如何快速构建比赛环境,并降低竞赛平台的学习成本,让选手专注于比赛?如何保证参赛人员的数据安全并防止作弊?这些都是竞赛组织方需要解决的问题。
对此,浪潮信息AI团队联合竞赛组织方,借助AIStation将原有算力平台快速改造为竞赛平台,实现了精细化资源管理、快速共享资源、秒级创建开发环境、数据隔离。AIStation具备显存隔离功能,最小支持申请1G显存。竞赛期间,AIStation助力竞赛组织方在单节点8卡服务器上创建了56个开发环境,满足多人共享算力资源的诉求。
赛前,竞赛组织方通过AIStation统一构建了PyTorch、TensorFlow等比赛镜像。竞赛期间,参赛人员通过比赛镜像创建开发环境,在Jupyter交互工具完成语音数据处理、图像分类、大模型微调等竞赛题目。
此外,AIStation通过精细化设置共享目录权限,让参赛人员可同时获取竞赛题目,但无法共享数据到其他目录,保证数据安全,并设置普通用户不能同时登录平台,防止作弊。竞赛结束后系统管理员可以同时登录平台,快速阅卷。
竞赛组织方表示:“AIStation支持细粒度切分AI算力资源,仅用一台服务器,就能支持多人多地竞赛,节约了赛事成本。AIStation自定义的AI开发流程,非常简单易用,参赛人员可以快速上手,顺利完成比赛。此外,AIStation的租户权限管理和数据安全能力保障了比赛公平公正。”
浪潮信息AIStation是面向企业级训练与推理场景开发的人工智能开发平台,实现从模型开发、训练、部署、测试、发布、服务的全流程一站式高效交付。通过统一管理计算资源、数据资源、深度学习软件栈资源,以及支持大模型业务全链条,AIStation能够为企业用户提供敏捷高效的一体化AI平台,加快AI开发应用创新落地。