资讯详情

Information for details

优秀!趋动科技再获光合组织解决方案大奖

近日,历经数月的【第三届光合组织解决方案大赛】成功落下帷幕,获奖榜单正式出炉。在本次大赛中,趋动科技凭借《位置无关、支持热迁移的异构加速卡算力方案》斩获了赛事的争先奖

图司机-20231206-38170685 (1).png

第三届光合组织解决方案大赛由光合组织举办,聚焦聚焦人工智能、智慧教育及信息安全等热门场景。大赛基于海光优势技术,设置集智计划、桃李计划、堡垒计划“三大计划”,以期挖掘更多优质的产品与解决方案,营造融合、协同、共享的创新生态环境,为产业链的良性发展提供更强大的动力。


方案介绍



伴随大模型时代的到来,算力需求持续增长而资源利用率低下的矛盾日益凸显。同时,国家高度重视人工智能芯片产业生态发展及国产化替代。在此背景下,如何实现异构算力卡的统一纳管调度,向用户提供灵活、稳定、高效、低成本的AI算力资源,变得越来越重要。


趋动科技《位置无关、支持热迁移的异构加速卡算力方案》,通过软件定义的方式,将物理异构算力硬件资源进行池化管理,将应用与物理硬件资源解耦合,实现业务按需调度异构算力资源及跨厂商异构算力资源精细化管理和灵活调度。


最近OrionX增强了海光异构加速卡的资源聚合、交叉拉远、热迁移等的特性,能够更好地支撑海光异构加速卡服务于多样化的业务需求。


资源聚合


通过OrionX的 “化零为整” 的特性,多机碎片化资源聚合后做训练。方案价值如下:


1、突破单节点算力卡资源上限,提供跨节点的单机多卡能力,简化分布式训练的环境部署,缩短训练时长,提升开发训练的效率;


2、碎片化资源整合利用,打破深度学习框架对多机多卡的资源均衡配置限制。


交叉拉远


通过OrionX的 “交叉拉远” 的特性,AI业务可访问整个集群算力池中的所有不同厂商不同类型的AI算力资源。方案价值如下:


1、提升AI业务的灵活性,允许使用不同卡类型的AI业务在集群中随意调度,而无需关注物理节点上是否安装了物理卡或者使用了哪种类型的物理卡;


2、CPU和AI算力资源弹性配比,AI算力空闲的节点,均可运行AI业务,充分释放节点CPU算力资源。


热迁移


通过OrionX的 “热迁移” 的特性,用户可以将算力硬件上正在运行的计算任务和数据,不中断地从一个物理算力设备无缝迁移到另一个物理算力设备。方案价值如下:


1、各节点算力均衡使用,无需容器或虚机重启,避免重新加载程序和模型造成的时间浪费;

2、合并资源碎片,以提升整个数据中心的资源利用率;


3、在业务不中断情况下,对服务器进行下线维护,保障业务连续性,实现对AI算力资源的动态管理和优化。





软硬解耦、供应链解锁是该方案的核心。趋动科技相信,经过不断地业务和技术创新,AI算力池化软件对硬件的价值会越来越明显。加之光合组织生态的赋能,该方案必将成为支撑企业数字化转型和提升我国核心竞争力的重要技术。