应用介绍
使用两种类型的泛化来评估所提出的ViGaL:(a) 分布外泛化,即在我们的视觉游戏上训练的模型在未见的Atari游戏上进行测试;以及(b) 领域外泛化,即仅在游戏任务上训练的模型在多种多模态推理任务上进行评估,包括数学推理、几何问题解决、CLEVR+上的3D理解以及MMMU系列上的多学科推理
使用两种类型的泛化来评估所提出的ViGaL:(a) 分布外泛化,即在我们的视觉游戏上训练的模型在未见的Atari游戏上进行测试;以及(b) 领域外泛化,即仅在游戏任务上训练的模型在多种多模态推理任务上进行评估,包括数学推理、几何问题解决、CLEVR+上的3D理解以及MMMU系列上的多学科推理