智慧升级:格灵深瞳如何利用AI平台推动行业创新
引 言
格灵深瞳成立于2013年,2022年3月在上海证券交易所科创板挂牌上市(股票代码:688207),成为A股第一家AI计算机视觉上市公司。
格灵深瞳通过引入趋动科技的OrionX AI算力池化软件+Gemini AI开发训练平台,搭建私有化的AI算法开发训练管理系统,解决了因为业务增长带来的算力资源不足、算力资源管理难的问题。
关于格灵深瞳
在AI 2.0时代,作为行业领先的人工智能公司,格灵深瞳始终坚持技术创新和场景落地协同发展,致力于为客户提供高效、安全、易用的人工智能产品和解决方案。格灵深瞳目前落地的场景主要集中在泛安防、工业检测和人机交互领域,具体包括智慧金融、城市管理、智慧商业、轨交运维、体育健康、元宇宙等。
目前,格灵深瞳的产品方案在智慧金融领域已覆盖某国有银行全国各省市的上万家网点,包含智能安保、智能运营、智能风控等多个金融业务场景;城市管理领域已覆盖全国多省市的公安局、公安交通管理局、政法委员会等政府机关或企事业单位;轨交运维领域格灵深瞳自研的列车智能检测解决方案已在高铁和地铁项目中通过验收,实现落地应用,同时在底检机器人和线路巡检场景积极进行试点合作;格灵深瞳的智慧校园体育相关产品方案已在全国多个校园试点应用、销售,并为刚刚结束的京津冀多个区的体育中考提供了技术和产品支撑,覆盖考生人数近5万人。此外,格灵深瞳在元宇宙领域进行了前瞻性的布局,开发了多种类型的交互内容,未来考虑通过多种方式,探索针对青少年群体线下娱乐以及文旅、教育、培训、党建、会展等场景的新型沉浸式体验业态。
格灵深瞳在各个领域落地的人工智能应用
合作背景
尽管市场环境充满挑战,格灵深瞳以创新驱动、以技术立身,始终坚持高研发投入,在2023年共投入约1.84亿元用于研发。研发投入占营业收入的70.14%,同比增长39%。格灵深瞳AI算法研发团队和AI算力资源快速增长的同时,也遇到了各种智算算力管理的挑战。
随着格灵深瞳业务扩展,业务增长和算力资源紧张的矛盾日益凸显:
(一) 业务扩展与资源需求增长,格灵深瞳业务的扩展导致研发人员数量增加,随之对算力资源的需求也在快速增长。
(二) 算力资源的独占式使用,研发人员习惯于独占式地使用算力资源,这导致资源一旦被占用后难以回收。
(三) 资源分配的不灵活性,所有GPU算力以整卡方式分配,缺乏灵活性,不能根据任务大小按需分配资源。
以上这些问题也是AI算法研发公司普遍面临的问题。
随着趋动科技OrionX+Gemini平台的引入部署,格灵深瞳在内部搭建了一套基于云原生的人工智能服务平台,实现了硬件集群平台化管理、开发团队的平台化管理以及算力资源的按需分配和快速回收,实现了公司AI算法开发训练管理系统建设。
格灵深瞳AI平台部署架构图
方案收益
趋动科技OrionX+Gemini平台的投产,为格灵深瞳创造了以下收益:
首先,为格灵深瞳的算法工程师团队和运维团队提供一套“一站式”人工智能训练平台。针对模型开发训练场景,整合算法、算力、数据,构建一体化平台,提供强大的AI资源管理服务以及高效的算法开发和训练支持,能够提高开发人员的工作效率,缩短开发周期,帮助企业建好AI平台、管好AI资源、用好AI服务。
其次,通过该平台为研发团队提供开箱即用的开发训练环境。通过平台的调度能力实现计算任务的高效调度及任务结束后资源的快速释放,整体提升了算法研发团队的开发效率。
第三,在底层算力资源调度方面,实现了CPU、GPU、内存等算力资源统一管理和运维。所有集群资源可被共享、共用,提升了集群管理能力,通过趋动OrionX软件定义GPU算力池建设,实现集群GPU算力池的搭建,为开发人员弹性供给GPU算力,大幅提升昂贵GPU资源使用效率,降低了算力资源投入的成本。
格灵深瞳OrionX+Gemini平台上线一年时间,降本增效收益显著。平台上线前,平台下集群的资源只能满足2个项目组十几位工程师的使用。OrionX+Gemini平台正式上线后,该集群资源支撑了11个项目组,近70+位工程师的算法模型开发、训练资源诉求。
OrionX+Gemini平台基于集群有限的算力资源,在不到一年时间内支撑了6000+开发训练任务,大幅度提升了算力资源的使用效率,同时也提升了团队人员的工作效率,帮助格灵简化了硬件环境运维的复杂度。
结 语
未来,随着国内人工智能技术成熟度持续提升、服务种类不断丰富、企业经营管理各环节的价值显现,各算法研发公司对AI平台的要求也会越来越高。趋动科技在做好服务的同时,也响应格灵深瞳以及其他用户的需求,丰富了更多平台功能。
当前,OrionX+Gemini平台已经实现曙光、寒武纪、华为昇腾、天数等国产卡的异构算力资源纳管和调度、算力集群自动化运维等能力,满足用户敏捷开发、降本增效、绿色低碳的需求。