字节跳动旗下豆包大模型 1.5 Pro 今日正式发布,全新 Doubao-1.5-pro 模型增强了综合能力,在知识、代码、推理、中文等多个测评基准上,综合得分优于 GPT-4o、Claude 3.5 Sonnet 等模型。
字节跳动推出的LatentSync是一项先进的端到端唇同步技术,利用音频条件的潜在扩散模型,实现了视频中人物唇部动作与音频的精确匹配。
在12月18日举办的火山引擎 Force 大会上,字节跳动正式发布发布豆包视觉理解模型,为企业提供极具性价比的多模态大模型能力。
字节跳动视频生成模型 PixelDance 已在豆包电脑版正式开启内测,部分用户已开通体验入口。
字节跳动旗下的智能AI助手豆包近期对其文生图能力进行了显著升级,用户现在可以通过一键操作生成包含指定文本的图片。
字节跳动推出X-Portrait2肖像动画技术,通过先进的表情编码器模型和生成扩散模型,实现超低成本高效的角色动画创作。
9月中下旬,字节旗下的 AI 写真 App PicPic 开始在日本爬榜,最高冲到了日本 iOS 下载总榜23位,摄影与录像分榜第2。
字节跳动悄悄推出了一个名为“炉米 Lumi”的 AI 模型分享社区,相关平台据称集成了模型分享、Workflow 搭建以及 LoRA 训练等多种功能,用户可以上传自己开发的 AI 模型,并在社区中与其他人分享,平台还支持用户搭建 AI 工作
大模型(LLM)如GPT、Llama等在人工智能领域掀起了革命,但高效训练符合人类价值观仍是难题。
趣丸科技发布了名为MaskGCT的全新语音合成(TTS)模型,彻底颠覆了传统TTS模型的玩法,实现了自学成才,不再依赖人工标注。
字节跳动最新开发的PersonaTalk AI模型实现了视频精准配音,声音与嘴型完美同步,保留人物原有特点,让视频更真实自然。
2024火山引擎 AI 创新巡展在深圳举办,豆包大模型家族迎来新成员:全新发布豆包·视频生成模型、以及豆包·音乐模型、豆包·同声传译模型、豆包通用模型pro 和文生图模型、语音合成模型等垂类模型大幅升级。
-------------没有了-------------