趋动科技携一体化GPU资源池化解决方案亮相GTC大会

2020-12-21

近日，AI行业年度盛会GTC中国线上大会拉开帷幕，来自人工智能和深度学习领域的高科技企业云集线上，在为期5天的大会上共同呈现一场AI科技创新盛宴。北京趋动科技有限公司（以下简称“趋动科技”）作为元脑生态伙伴受邀参加GTC元脑生态技术论坛，发布了基于“浪潮元脑+猎户座（OrionX计算平台）”的一体化GPU资源池化解决方案，获得了广大观众的一致认可和点赞。

深度整合 形成一体化GPU资源池

据IDC研究预测，中国人工智能基础设施市场规模在2020年达到39.3亿美元，同比增长26.8%。人工智能市场的高速增长得益于AI算法的突飞猛进，越来越多的模型训练需要巨量算力支撑才能得到快速、准确的结果，算力已成为未来人工智能发展的决定性因素。

趋动科技技术总监王亮

趋动科技技术总监王亮在谈到现阶段AI客户面临的普遍痛点时表示：“居高不下的算力成本和有限的算力资源，给AI应用部门与AI基础架构部门带来了诸多挑战，算法工程师与算力资源的配比难题、资源分配不够灵活，额外的运维和调优工作、传统应用架构下GPU资源整体利用率低、无法动态智能支撑上层云环境、资源分散难管理等诸多难题长期困扰着AI用户。

图：“浪潮元脑+猎户座”部署架构

针对上述难题，趋动科技与浪潮联合打造了一体化GPU资源池化解决方案，基于浪潮元脑+猎户座部署架构搭建的GPU云平台，实现了AI应用和物理GPU的解耦。通过OrionX软件层为AI应用提供OrionXvGPU，实现了资源的按需分配，随取随用。解决方案不仅支持推理、训练和教学实训等小模型场景的训练，也支持大模型的训练场景。同时通过支持分布式网络挂载的动态资源调度和回收，使用较少的物理AI加速器资源，即可满足数量庞大的开发人员的AI算力需求。

近日，一体化GPU资源池化解决方案基于浪潮NF5488A5服务器进行了测试。 NF5488A5是浪潮自研的新一代AI服务器，MLperf单项测试性能全球第一。在4U空间内支持8颗第三代NVLink全互联的NVIDIA A100 GPU，搭载2颗支持PCIe4.0 的AMD EPYC 7742 处理器，NF5488A5能够为AI用户提供5 petaFLOPS的极致单机训练性能和超高数据吞吐，面向图像视频、语音识别、金融分析、智能客服等典型 AI 应用场景。

本次测试采用TensorFlow框架的Benchmark，测试小模型推理，大模型训练等多种AI应用场景，验证平台对A100的兼容性和性能。测试表明，浪潮NF5488A5服务器性能优异，可充分发挥NVIDIA A100 GPU性能，部署OrionXvGPU方案后，本机性能损耗<1%,对比过往服务器的GPU性能，数据提升近50%。

目前，趋动科技的一体化GPU资源池化解决方案已应用于图像识别、语音识别、智能/无人驾驶等场景，带来了显著的客户价值，“我们的解决方案能够帮助客户提高GPU资源利用率；确保与直接使用物理GPU性能无差的高性能；在应用无感知的情况下弹性扩容或者缩容GPU资源池的大小，实现灵活调度；提供外部API接口和上层调度平台、监控平台对接，实现全局管理；简化算法工程师的工作负载，”王亮肯定道。

随需而变 三大场景释放AI算力潜能

“AI算力已经席卷了从服务器到移动处理器在内的几乎所有产品线，同时将AI正式带入场景化、商用化的大规模落地阶段，成为数字社会新基建的关键部分。一体化GUP资源池化方案的问世，通过提高GPU利用率、弹性扩展、按需调度和开放共享的模式，为不同场景构建出了一个AI算力的能源输出与控制中心。”王亮在演讲中指出，“随需而变”是这一解决方案的最明显特征，为AI场景化应用提供了隔空取物、化零为整、化整为零的管理优势。

图：“浪潮元脑+猎户座”典型应用场景

n隔空取物：一体化GPU资源池允许AI应用部署在任何一台服务器（纯CPU）上，可根据AI算力资源需求的变化，通过网络去调取GPU服务器上的AI算力资源，从而去支撑训练、推理等灵活应用场景。

n化零为整：用户可以根据需求聚合单设备，甚至多台设备上面的AI算力资源，以容器或者是虚拟机的形式调度，从而支撑多卡的训练,并且通过统一平台管理多源、多场景模型, 实时掌控全局资源。

n化整为零：工作在本地虚拟化环境下的一体化方案可以轻松实现资源分割、显存分割以及算力的细粒度精准分割，用多卡GPU服务器支撑更多的小模型，如推理、开发环境，教学等场景的需求。

王亮表示：“在智能化需求的推动下，很多AI技术的碎片化应用也开始被广泛使用，几乎所有行业在与AI融合时，都必然要面临算力、平台、应用开发，以及算法、模型训练方面的技术挑战。趋动科技在力争成为业界领先AI应用企业的同时，携手元脑生态合作伙伴，共同推动数据中心级AI加速器资源池化应用，共赢AI时代。”

-实现算力平民化-

OrionX 社区版
new

OrionX 商业版

Gemini

趋动云

教育科研行业

自动驾驶行业

运营商行业

金融行业

公司简介

博客与新闻

渠道合作

资讯详情

Information for details

趋动科技携一体化GPU资源池化解决方案亮相GTC大会