浙江移动

趋动科技OrionX GPU池化方案帮助浙江移动完成云边GPU资源统一池化调度管理

项目背景

浙江移动致力于移动改变生活,成为数字化创新的全球领军企业,基于边缘算力为浙江的客户提供移动看家、行业大视频等服务,同时作为中国移动算力网络的重要组成部分,通过接入移动算网大脑“天穹”为整个移动的算力网络提供可靠的算力支撑。


项目挑战

1.整体使用效率低:GPU服务器分配率很高,但是卡资源经常不够用,GPU的综合利用率不高,整理利用率低于30%。

2.现有方案不灵活:基于VMware虚拟机GPU单卡直通的方案无法满足客户细粒度资源的需求,同时内部业务部门无法充分的利用整卡资源。

3.开源方案不成熟:基于GPU Manager的开源方案无法实现精准的算力控制,同时代码维护和产品可商用性存在风险。


趋动解决方案

谐云科技观云台构建数据中心统一的资源管理和服务平台,并与趋动科技OrionX构建的统一GPU资源池化平台进行深度集成,实现AI应用和GPU服务器硬件解耦,GPU资源的统一调度、运维管理、灵活分配、弹性扩展等云化能力,满足不同业务对于资源的细粒度需求,为企业客户提供可靠稳定的GPU算力底座。


客户成功

通过多个业务容器基于同一张GPU卡进行部署,将一张卡切分成4份,同时支持4个推理任务,且相互隔离,相较于传统单卡直通的分配方式资源利用效率提升至4倍。


用户反馈

趋动OrionX解决方案帮助移动算力平台承接更多的业务量,不同业务可以共享同一块显卡,目前是将卡切成4份,使得原本不需要整块显卡的业务可以合并共用一块卡,相较于原来的方案提升至4倍的部署密度,从而避免了资源的浪费,提升了资源利用率。

———施佩琪丨云资源部运维负责人