业务挑战:
随着国家“东数西算”工程在算力建设方面的逐步展开,运营商成为算力建设的主力军,智能算力通过算网辐射全国,使算力资源成为社会级服务。然而,由于传统的算力通过硬件方式进行资源分配,无法实现算力资源使用服务化,存在颗粒度粗、调整难度大、形式单一、成本高、门槛高等问题。
方案简介:
OrionX 通过软件定义各类异构算力,实现统一调度,统一管理的数据中心级异构算力资源池,帮助运营商企业更好的管理与分配算力资源。OrionX改变算力资源传统使用方式,应用以算力1%,显存1MB为基本单位进行异构算力资源申请。针对多卡应用,屏蔽底层资源分布细节,通过声明式资源申请,将资源池内可用算力资源快速整合到虚拟机或容器中。软件定义异构算力资源,算力、显存弹性伸缩,动态挂载,虚拟机或容器无需重启。应用部署无需关心所在服务器是否配置异构算力芯片,异构算力资源可通过网络远程调用。
方案价值:
通过软件定义算力,实现算力弹性使用,通过随需应变、化整为零、化零为整、隔空取物帮助各类业务实现算力自由。
业内领先能实现多厂商算力池化并将国产芯片与英伟达芯片统一纳管统一调度的异构资源池化解决方案。
实现在多种云环境下的GPU共享能力。
大幅提升GPU资源使用灵活性。
无需改变当前AI应用代码和使用习惯,通用性强。
实现虚拟GPU、物理GPU、国产芯片统一调度和共享使用。
提高GPU资源的利用率和使用灵活性,降低运维复杂度,提升人效。
弥补开源方案技术短板(池化能力优先,无法支持国产,安全隔离性低等)。
解决方案架构图