Transformer一作Ashish Vaswani所在的AI公司Adept发布了多模态大模型Fuyu-8B。这一模型具有80亿参数,可理解各种图像类型,包括照片、图表、PDF和界面UI。
Demo试玩:
不仅如此,Fuyu-8B还能以出色的速度进行图像处理,提供快速响应。与其他大型模型不同的是,它采用了一种纯解码器Transformer架构,不需要图像编码器,可以支持任意图像分辨率,从而在多项任务中表现更加出色。
Adept公司的目标是打造一个AI Copilot,这意味着大模型需要具备出色的图像理解能力,能够理解用户屏幕上的内容,帮助人类快速完成各种工作,如阅读网页、PPT、PDF和图表等。
该公司已经获得4.15亿美元的融资,并估值超过10亿美元,展现出其巨大的潜力。
这一新工作的团队由业内大佬共同创立,包括Transformer一作Ashish Vaswani、前OpenAI工程副总裁以及其他资深专业人士。他们已经在多个项目中展现出强大的技术实力,包括GPT-2、GPT-3、CLIP和DALL-E等模型的开发。
此外,Adept公司还非常注重开源工作,推出了多个开源项目,包括Persimmon-8B和Fuyu-8B。这一创新团队的目标是利用大模型的能力来提升人机合作,使得人类能更高效地完成各种任务。