眸深智能自主研发的Motion GPT系列、LL3DA等核心大模型,拥有PAGCP、MADTP等独创压缩框架,技术指标超越同行实验室,曾斩获ICCV冠军、IJCAI2025最佳论文、全国颠覆性技术创新大赛等多项国际国内大奖。项目已与腾讯、字节跳动、阶跃星辰、华为、小米、英伟达、国家人形机器人中心、杭州具身中试基地等头部企业合作落地,商业化聚焦制造业柔性生产环节、巡检、物业服务、零售服务、家庭服务、养老护理等场景的落地应用与不断迭代。Motion GPT系列大模型,是集三维具身感知与推理决策一体化、多模态模型轻量化的大模型,实现了包括文本驱动的动作生成、动作描述、动作预测和动作衔接等多个动作任务上最先进的性能。
LL3DA是可直接采用点云数据作为输入,并对第一人称视角的文本指令和视觉提示作出具身反应的大模型,其在三维密集描述和三维问题回答的任务取得了业界较好的结果。