继 8 月语言模型 GLM-4-Flash 免费后,智谱 AI 在今天上线第一款免费的多模态模型 —— GLM-4V-Flash。GLM-4V-Flash 不仅基于 4V 系列模型的各项优秀能力,更在图像处理上实现了精确度的提升。
据介绍,GLM-4V-Flash 模型拥有图像描述生成、图像分类、视觉推理、视觉问答(VQA)以及图像情感分析等高级图像处理功能,并且支持包括中文、英语、日语、韩语、德语在内的 26 种语言。
在企业应用中,GLM-4V-Flash 能够针对特定垂直行业提供精准的场景解决方案,以低成本投入助力开发者迅速融入大模型时代,无需顾虑大模型图像处理的高昂成本。
官方举例:
1、解读图片生成社交媒体文案
2、识图答题支持教育创新
3、肤质图片测试建议
4、安全检测
5、OCR 保险单信息提取
6、工单质量检测
7、电商商品描述生成
8、多模态数据标注