趋动科技与青云达成合作伙伴关系,联合推动AI算力资源池化和虚拟化
2020年6月29日,初创科技公司趋动科技 (VirtAITech.com) 宣布与企业级云服务商青云QingCloud(qingcloud.com)达成深度合作,联合推动GPU资源池化和虚拟化解决方案的研究及部署,并共同推向市场。
人工智能是全球近年来快速发展的战略新兴产业,基于AI技术的产品及解决方案在计算机视觉、语音识别、自然语言处理等领域取得突破性进展。以深度学习为代表的AI算法不断发展成熟,正在深入到更多的行业、场景和产品中,让产品更智能,场景更智能。麦肯锡预测:到2030年,70%的企业将至少采用一种AI技术,AI届时将为全球经济贡献13万亿美元。
青云QingCloud 是一家具有广义云计算服务能力的平台级混合云 ICT 厂商和服务商,以软件定义为核心,致力于为企业用户提供自主可控、中立可靠、性能卓越、灵活开放的云计算产品与服务。经过多年发展,青云QingCloud 已经具备了全维度的云产品与云服务交付能力:在技术层次上,自主研发形成跨越智能广域网、IaaS 和 PaaS 的云网一体技术架构体系,拥有全面的 ICT 服务能力;在交付形态上,以统一技术架构形成云产品、云服务两大标准化业务模块,根据客户需要满足私有云、公有云和混合云的部署需求,并针对多个行业形成了完善的行业云计算解决方案;在场景纵深上,正着力布局发展集云、网、边、端于一体化的综合服务能力,实现更广义的数据互联。
趋动科技由多位具有世界500强中国研究院负责人背景并且具有共同远大理想的高科技人才创立,专注于为全球用户提供国际领先的数据中心级AI加速器资源池化和虚拟化软件及解决方案。其旗下主要产品OrionX GPU资源池化解决方案(猎户座GPU资源池化解决方案)可以在几乎零性能损失的情况下,提供对于物理GPU的细粒度、可远程、运行时动态可配置的虚拟化方案。通过高效的通讯机制,使得AI应用、CUDA应用可以运行在云或者数据中心内任何一个物理机、容器或者VM内,而无需挂载物理GPU,同时为这些应用程序提供在GPU资源池中的硬件算力。
青云科技率先在其QingCloud企业云平台和KubeSphere容器平台上,推出基于趋动科技OrionX GPU的联合解决方案,为客户提供vGPU资源池化方案,高效利用现有GPU资源,实现GPU资源的“切分”,“聚合”,“动态调度”等,满足客户多样化的需求,大幅提高GPU利用率,快速部署AI应用。该联合解决方案能够为用户提供资源调度的单一平面,允许用户在青云平台,轻松调度,管理,配置,监控GPU资源池的vGPU资源。
青云客户实际需求案例:
随着国家新基建战略的迅速推进,人工智能在各行业开始迅猛发展。与此同时客户在AI的发展中普遍存在诸多痛点。从人员痛点上看,公司如何确定AI应用部门的算法工程师与GPU卡的配比是首要解决的问题。如果按1:1配比,必然会损失GPU的利用率,GPU在很多时候是无人使用的闲置状态;如果让GPU无空闲满载使用,例如按照5:1的配比,必然会因为算法工程师需要排队,会大大浪费算法工程师的人力。而部署了趋动科技的OrionX之后,解锁GPU的独占访问方式,可以按需为每一位算法工程师分配vGPU,不但提高了5倍GPU利用率,还让每一位算法工程师体验到“独占”vGPU的快乐。
其次,算法工程师日常有多达95%的单机多卡的调研模型需要测试效果,而公司只有多机多卡的环境可供使用,因此算法工程师每日要耗费大量的时间把模型从单机多卡改成多机多卡,需要花费80%时间在做硬件不匹配带来的额外工作,大大影响高学历的算法工程师的人力效益和成就感。最后,算法工程师的日常训练模型需要的CPU与GPU的比例变化很大,而公司的GPU服务器是固定的CPU/GPU占比,为了能让训练模型顺利运行,算法工程师必须花大量的时间按公司现有环境优化模型,同样需要花80%时间在做硬件不匹配带来的额外工作,影响算法工程师的士气。而部署了趋动科技的OrionX GPU资源池化解决方案之后,算法工程师完全不需要考虑具体的GPU设备的情况,只需把资源使用需求提交给公司的AI基础设施部门,AI基础设施部门从资源池中按需分配即可。