字节跳动开源全新AI模型LatentSync 精准控制唇形同步_科技魔方-中文AI大模型门户网站

首页 更多场景 正文: 字节跳动开源全新AI模型LatentSync 精准控制唇形同步; 更多场景

2025年01月06日

点赞; 　　字节跳动推出的LatentSync是一项先进的端到端唇同步技术，利用音频条件的潜在扩散模型，实现了视频中人物唇部动作与音频的精确匹配。

　　该技术通过引入TREPA技术，增强了时间一致性，同时优化了SyncNet的收敛性，显著提升了唇同步的准确性。

　　端到端框架:LatentSync无需中间运动表示，直接从音频生成唇部动作。

　　高质量生成:利用Stable Diffusion生成动态逼真的说话视频，提升视觉效果。

　　时间一致性:通过TREPA技术增强视频帧之间的时间一致性，确保唇同步的准确性。

+1; 字节跳动开源大模型 AI模型; 来源：科技魔方

延展资讯

: AI 是如何利用语言技巧「操纵」人类的

: 马斯克大胆预测：2027年AI智力将反超人类

: 轻松同行自在创作：猛玛与内容创作者共启2025新篇章

: 比亚迪正式进军人形机器人领域面向高校招聘相关人才

: 50多款AI眼镜来了，大模型找到了应用救星？

: 月之暗面Kimi正式发布数学推理模型“k0-math”

最热新闻最新新闻 更多>

用户推荐最热产品 更多>

倾城

小新

叶紫

创维电视（SKYWORTH）55V40

创维电视（SKYWORTH）55V40

小米全面屏电视E43K

小米全面屏电视E43K

康佳（KONKA）55D6S

康佳（KONKA）55D6S

荣泰S60按摩椅

荣泰S60按摩椅

自媒体头条更多>: 极致听感智能降噪三星Galaxy Buds Pro诠释非同凡“响”

未来科技范试驾摩灵MOi｜视频

品牌专区更多>

产品与服务

联系站长

反馈邮箱

news#keji100.net（发邮件时把#换成@）

关于我们