应用介绍
具体而言,「智在无界」提出了多模态姿态模型,通过互联网上丰富的视频资源,包括如行走、舞蹈等人体全身运动,抓取物体、工具使用等第一人称视角的手部精细操作数据,能够为模型提供丰富且多元的动作样本。通过这些视频-动作数据,模型可学习到各种动作在不同环境下的表现形式,能依据实时的环境信息与任务要求,实现具有泛化性的端到端运动操作。
具体而言,「智在无界」提出了多模态姿态模型,通过互联网上丰富的视频资源,包括如行走、舞蹈等人体全身运动,抓取物体、工具使用等第一人称视角的手部精细操作数据,能够为模型提供丰富且多元的动作样本。通过这些视频-动作数据,模型可学习到各种动作在不同环境下的表现形式,能依据实时的环境信息与任务要求,实现具有泛化性的端到端运动操作。