商汤科技今日发布公告,拟配售 B 类股份,总筹 20.08 亿港元(当前约 18.71 亿元人民币)。据《科创板日报》报道,商汤本次配售有多家战略投资人及头部海外基金入股,现有股东增持,募集资金将用于大模型研究及产品开发等。
报道称,商汤将于 7 月 5 日世界人工智能大会上发布日日新 5.5 大模型。官方没有透露关于日日新 5.5 大模型的更多信息,而此前有国内媒体报道称,商汤日日新大模型“近期”将迎来重大升级。在长文本处理能力上,升级后的商汤大模型将最新支持 100 万字以上超长文本,同时最多一次支持 50 多个文件问题解析。
另外,商汤今年 4 月 23 日发布了日日新 5.0 大模型。据IT之家此前报道,该模型采用 MOE 混合专家架构,在知识、数学、推理和代码能力方面大幅提升。该模型基于超过 10TB tokens 训练,具备 200K 推理上下文窗口(注:相当于 36.5 万个汉字),推理时上下文窗口达到 200K 左右,更号称“全面对标 GPT-4 Turbo”。其提供自然语言处理、图片生成、自动化数据标注、自定义模型训练等多种大模型及能力。
今年 5 月,商汤宣布将免费向粤语区用户推出粤语大模型 Web 版及 App 版,“商量语言大模型粤语版”及“商量多模态大模型粤语版”即日起向企业用户开放 API。