斯坦福大学教授李飞飞及其团队的研究揭示了多模态大模型在空间智能方面的初步能力,展示了它们在记忆和回忆空间的潜力。
研究开发了VSI-Bench工具,评估视觉空间智能,尽管模型表现仍低于人类,但在某些任务上已接近人类水平。
研究团队推出VSI-Bench工具,评估视觉空间智能,包含5000多个高质量问答对。
多模态模型在某些任务上已接近人类水平,Gemini-1.5Pro在房间大小估计任务中表现突出。
李飞飞创办的World Labs专注于开发具备空间智能的AI模型,已获得多家知名机构投资。