3月5日,两位华人创业者苗亦舒和王子宇建立的 AI 初创公司推出了搭载自研 AI 模型的视频生成工具Haiper。
题图来源:Haiper
Haiper 的两位创始人都获得了牛津大学机器学习方向的博士学位,在该领域拥有丰富的知识和实践经验。苗亦舒曾供职于 TikTok,王子宇则在谷歌和 DeepMind 担任过研究员。
Haiper 于2022年正式成立,一开始的方向是 AI3D 建模。而根据创始人的说法,团队在半年前决定将创业方向改为 AI 视频生成,半年时间,他们推出了 Haiper 的测试版。
目前,Haiper 已经完成了两轮融资,总融资额达到1920万美金。最近的一轮融资额为1380万美元,由 Octopus Ventures 领投,5Y Capital 跟投。
完全免费的视频生成工具
与其他视频生成产品采用订阅付费模式不同,Haiper 目前完全免费,用户只需访问 Haiper 官网就可以使用。
但是,目前 Haiper 只能生成最长2秒的高清视频,和最长4秒的标清视频。目前 Pika、runway、Stable Video 等主流产品直接生成的视频最长4秒,可扩展到16秒,但 Sora 则能生成最长60秒的视频,但目前只有 Demo。
除了视频生成功能外,Haiper 还提供视频卡通化、照片卡通化、重绘视频等功能,未来还将引入扩展视频功能。
对于付费问题,创始人苗亦舒表示,目前 Haiper 的视频生成功能还不太成熟,实行付费订阅模式还“为时尚早”,公司的计划是,保持免费模式,并专注于建立社区生态。而在 ToB 方面,Haiper 已经与京东等企业合作,对商业场景进行探索。
最终目标,构建通用AI模型
目前,Haiper 专注在面向 C 端用户的网站视频生成产品,但创始人透露,他们希望开发一个使用场景更广泛的视频生成模型。公司已经私下联系了一些开发者来测试 Haiper 的 API,并根据开发者的反馈来优化 AI 模型。此外,Haiper 还考虑将其模型开源,让更多的用户来优化模型,探索更丰富的使用场景。
对于下一阶段的目标,Haiper 团队表示,目前 AI 视频生成正在达到一个拐点,模型需要提高质量和准确性,以解决恐怖谷问题。
恐怖谷(Uncanny Valley)是指当人们看到人工智能
生成的拟真性较高的人物形象时,会产生厌恶的感觉
这要求模型不仅要理解大量视频和图像形式的训练素材,还要理解现实世界的物理规律和其中的信息交互方式,例如光线、运动、纹理和不同对象之间的交互。例如,AI 需要了解雨滴撞击物体表面时会如何飞溅,或者风吹过人脸时头发如何移动。这也是目前 Haiper 技术攻关的重点方向。
而未来,创始人苗亦舒表示,Haiper 的目标是建立一个具有完整感知能力的通用 AI 模型,而当前开发的视觉基础模型将使 AI 能够深入理解世界,并在生成的视频中更好地复制现实世界,为通用模型打下基础。
虽然理想很美好,但经过去年一整年的发展,AI 视频生成赛道其实也变得非常拥挤。OpenAI 的 Sora 在技术上一骑绝尘,已经融资超过2.3亿美金的 Runway 已经拥有了不少用户,占据了先手。此外,谷歌、Meta、Stability AI 等一众明星企业也都推出了自己的视频生成模型。Haiper 作为一款新产品想要切入市场,并在未来实现商业化,其实并不容易。
但是根据 a16z 的评论文章,目前人工智能视频工具大概只达到了类似当时 GPT-2的发展水平。也就是说,目前 AI 视频工具已经在技术上有所突破,但仍缺乏适用于普通用户的应用场景。
而如果 Haiper 能在视频拟真技术上有所突破,真正找到能够落地的应用场景,实现差异化。那么切入市场,甚至超越 Sora 等其他同类产品,也并非不可能。