提升业务高可用性,优化运维能力
有效避免资源争抢,实现资源的公平分配。
简化旧卡利用流程
设置算力和显存的超分比,将单个GPU资源超越物理限制分配给多个应用
GPU API级别的自动排队
按需跨机聚合GPU给开发者
开发者透明即时调用与释放GPU
支持远程调用、任务排队、资源超分
显存、算力独立切分,提升资源利用率
多机多卡快速聚合,合理利用碎片资源
应用与硬件解耦合,物尽其用
资源按需分配,满足差异化需求
内存补显存,保证突发高优先级任务QoS
无感运行,秒级调用,提升工作效率
支持全局优先级设定,资源匹配更合理