科技魔方

智谱首个免费多模态模型 GLM-4V-Flash 上线,支持图像描述生成、视觉问答等

更多动态

2024年12月10日

  继 8 月语言模型 GLM-4-Flash 免费后,智谱 AI 在今天上线第一款免费的多模态模型 —— GLM-4V-Flash。GLM-4V-Flash 不仅基于 4V 系列模型的各项优秀能力,更在图像处理上实现了精确度的提升。

  据介绍,GLM-4V-Flash 模型拥有图像描述生成、图像分类、视觉推理、视觉问答(VQA)以及图像情感分析等高级图像处理功能,并且支持包括中文、英语、日语、韩语、德语在内的 26 种语言。

  在企业应用中,GLM-4V-Flash 能够针对特定垂直行业提供精准的场景解决方案,以低成本投入助力开发者迅速融入大模型时代,无需顾虑大模型图像处理的高昂成本。

  官方举例:

  1、解读图片生成社交媒体文案

  2、识图答题支持教育创新

  3、肤质图片测试建议

  4、安全检测

  5、OCR 保险单信息提取

  6、工单质量检测

  7、电商商品描述生成

  8、多模态数据标注

+1

来源:IT之家

延展资讯