输入文字命令可生成视频,文生视频工具Pika将搅动全球视频产业链?
【环球时报记者 倪浩 环球时报驻美国特约记者 冯亚仁】编者的话:在对话框中输入文字“马斯克穿着太空服,3D动画”,一个3D动画版的“宇航员”马斯克就惟妙惟肖地出现在屏幕上,他身后喷着火焰的SpaceX火箭正腾空而起。这是突然走红的文生视频工具Pika发布的Pika1.0版本的宣传视频中展示的场景。不仅如此,Pika1.0还允许用户修改已有的视频,比如让一只瞪大眼睛的大猩猩戴上墨镜,或者更换正在行走的女孩的衣服。这些都只需要输入文字命令就可以完成。这样的功能让Pika迅速吸引了全球科技圈的关注,有人认为Pika或将影响未来的视频产业链,也有人对这家刚成立半年、团队只有4人的公司提出质疑。那么Pika能否带来一场视频行业的技术变革呢?
Pika走红,创始人受关注
美国AI初创公司Pika Labs日前发布了其首款视频生成产品Pika1.0。据其介绍,Pika1.0能够生成和编辑3D动画、动漫、卡通和电影。《环球时报》记者发现,在官网发布的宣传片中,Pika1.0生成的视频效果非常惊艳,让人称奇。
Pika迅速走红,除了产品本身效果外,创始人兼首席执行官郭文景的“女学霸”“斯坦福退学创业”“上市公司创始人女儿”等个人标签也进一步助推了Pika1.0的爆火。除了使用者纷至沓来,不少国内媒体和主流券商分析师纷纷进行了报道和研究。
根据Pika官网的介绍,Pika Labs成立于今年4月,整个团队目前只有4个人。郭文景和联合创始人兼首席技术官Chenlin Meng均为斯坦福高材生。尤其是95后的郭文景一夜间成为舆论关注的焦点。
媒体报道显示,郭文景曾就读于杭州二中,她曾在2014年、2015年连续两年参加美国信息学奥林匹克竞赛,且都夺得冠军。2015年,她还在国际信息学奥林匹克竞赛中获得银牌。高中毕业后郭文景被哈佛大学录取。2018-2019年,郭文景在“间隔年”期间加入了Facebook的AI研究团队。从哈佛大学毕业后,她进入了斯坦福大学攻读人工智能专业博士,今年4月份退学创办了Pika。
在接受美国《福布斯》杂志采访时,郭文景说,人工智能前景广阔,但将其应用到视频制作中却极其麻烦。于是她选择退学推出了更易操作的人工智能视频生成器Pika。
11月28日,Pika Labs在正式发布Pika1.0的同时还宣布,该公司已经完成了三轮融资,总金额达5500万美元。
Pika Labs的投资人阵容不容小觑,OpenAI两位创始成员亚当·迪安杰罗、安德烈·卡帕西都在其中。Github前CEO纳特·弗里德曼、HuggingFace创始人克莱门特·德朗格、Giphy联合创始人Alex Chung、YC合伙人丹尼尔·格罗斯、硅谷著名投资人埃拉德·吉尔等也出现在投资人阵营中,几乎是硅谷AI行业的半壁江山。
Pika1.0目前正在内测中,还未正式上线。《环球时报》记者在其官网注册后发现,目前还需要等待才能获得体验机会。根据介绍,作为一款文生视频工具,Pika1.0的主要功能包括:输入文字即可快速生成时长3秒的视频,对现有视频的背景、其中的道具进行局部修改以及改变视频的尺寸等功能。
截至12月5日,Pika官网显示用户数已经超过58万人,在线活跃用户达到4万人以上,每周生成视频数量达到数百万个。
艾媒咨询CEO兼首席分析师张毅接受《环球时报》记者采访时表示:“年初AIGC(生成式人工智能)火起来后,整个业界都在思考AI可以往哪里走、可以做什么、可以替代人类解决什么问题?文生视频这个赛道实际上是一个非常有前景的领域,Pika应运而生,正碰在风口上。”另外,张毅认为,创始人郭文景的个人背景与硅谷创业的传统结合在一起,助推了Pika的走红。
能否带来一场行业变革?
Pika11月28日通过官网表示:“6个月前我们创建Pika时,就希望能够突破技术的边界,让每个人都能轻松地进行视频创作。”Pika的愿景就是让每个人都能成为自己故事的导演,激发出每个人内心的创作热情。作为当前技术领域最热门的话题之一,AI被认为将在视频领域发挥重要作用,那么以Pika为代表的应用有可能颠覆整个行业的运作方式吗?
张毅认为,文生视频的前景毋庸置疑,影视、游戏以及广告等领域都是其落地的重要场景。张毅说:“个性化的视频制作更麻烦、成本更高,甚至超出了雇用程序员编程。不少行业都渴望有一款简单的视频生成工具。”
长期关注文生视频行业发展的AI工程师逸阳告诉《环球时报》记者,在他眼中,Pika有着广阔的应用前景,首先可以在广告、媒体、影视等创意产业中大显身手,通过快速生成各种风格的视频内容,帮助创作者实现更多的创意和想法;在教育领域,教师可以利用Pika制作生动有趣的教学视频,提高学生的学习兴趣和效果;在社交媒体上,博主可以使用Pika制作精美的视频,吸引更多的关注和粉丝;普通网友也可以用Pika生成视频作品,记录生活、分享经验或者表达观点。
资深互联网分析师丁道师告诉《环球时报》记者,Pika的视频生成能力正在以肉眼可见的速度进步,很可能在未来一两年内,就超过90%以上的影视公司。他说:“Pika的技术可以大大提高视频制作的效率和质量,降低制作成本,使得更多的创意和故事能够被呈现出来。如果积极选择新技术,影视行业可能会开启一个新的纪元。”
对现有影视行业的改变或者颠覆,只是其能力的冰山一角。丁道师认为,展望未来,Pika还有望在游戏开发、文化旅游甚至心理健康和疗愈中大展拳脚。
Pika的横空出世也吸引了国内诸多主流券商分析师的关注。国泰君安分析师秦和平认为,Pika聚焦低门槛消费级应用,AI视频生成领域迎来全面迸发。西部证券分析师李艳丽认为,从Runway到Pika,AI视频技术持续革新,继MidJourney等AI绘图工具实现企业级应用后,视频制作有望在AI工具支持下迎来效率、成本的大幅优化。目前Pika的产品还是免费的,但最终可能会推出分层订阅模式,付费用户能享受更多功能。
中泰证券分析师闻学臣认为,视频生成作为多模态生成中难度最大的领域,依旧存在很多应用的问题,更大的技术突破才是产业现阶段的核心推动因素,但这个过程或许不会太久。正如Pika联合创始人Chenlin Meng所言,目前的视频生成产业可能处于GPT-2时期,技术突破可能远比想象中更快。
走红之后质疑声不断
Pika横空出世,并没有给业界足够的时间进行了解。《环球时报》记者也发现,除《福布斯》外,美国主流媒体基本上没有对其进行报道。Pika1.0炫酷的宣传效果与目前还未放开使用所带来的落差,也让众多网友产生疑惑。
有AI创业者在短视频平台上表达了对Pika技术能力的怀疑。他认为目前关于Pika的各种炫酷视频基本都来自宣传片,几乎看不到Pika1.0实测者的评价。他认为“靠简单几个命令,就可以进行复杂的视频处理,给猩猩戴上墨镜,感觉好莱坞视觉团队分分钟就要下岗了。”这位AI创业者认为,按Pika的宣传,这确实是AI视频领域一个重大的突破,但是否属实,要经过普遍使用后才能确认。
Pika使用者世超发现,对于一些小幅度动作或者简单动作的要求,Pika生成效果还不错。但只要涉及四肢协调运动,或者手部细节时,效果就差强人意了。他举了一个例子:让一个3D版的马里奥跑步,生成的视频手脚频率明显不同步,而且两条腿出现不可思议的错换。世超又去翻了翻社区里大家生成的视频,还跑到官方给出的优秀案例库看了看,“结果发现,没啥好效果,还真不是我个人的原因。”
针对用户提出的一些问题,该公司表示,正在努力修改算法,进一步改进模型,并开发用于过滤受版权保护材料的模型。
有Pika的使用者认为,杭州天才女学霸、哈佛提前录取、斯坦福退学创业、上市公司实控人女儿,这些关键词为Pika大火铺垫了舆论基础。这名使用者认为,Pika1.0大火本身是中性的,如果实际效果不错,那就是非常成功的营销。如果效果不好,那么公司的口碑也将毁于这次营销中。
光大证券分析师付天姿在最新的研报中指出了Pika1.0面临的技术难题,她认为Pika或难以解决AIGC视频的核心难题:视频质量的稳定性,以及视频画面运动的核心逻辑理解。她认为,视频的生成需要对运动物体的结构有清晰的理解和认知,才能在运动过程中准确刻画透视关系,避免画面走形和失真。
付天姿认为,相比一步到位的文生视频,以3D模型和物理引擎为中介的AIGC工具或更具发展前景,有望达到更高的视频质量上限。
中泰证券分析师闻学臣也认为,Pika当前免费版本的效果尚处于早期阶段,视频生成的效果还不够成熟,存在画面模糊、不流畅等问题。但从发布的宣传片来看,新版1.0效果值得期待。
张毅告诉《环球时报》记者,4个人的Pika Labs还处于创业的初始阶段,虽然AI训练模型的核心人员不需要太多,但未来Pika Labs想发展壮大,4个人、40个人,恐怕400个人都不够。
值得关注的是,Pika并不是AI视频生成领域的唯一参与者。Pika的重要竞争对手Runway是最早使用人工智能进行视频编辑的初创公司之一。Stable Diffusion背后的公司Stability AI最近也发布了其首个生成视频模型。在一项用户偏好研究中,Stable Video Diffusion的表现优于其商业竞争对手。
张毅认为,在互联网时代,创业成功概率较低,竞争也非常惨烈。他说,一些初创企业能不能走到最后,还有很多未知数。现在对Pika进行任何断言都太早。
不过张毅也表示,很多很伟大的互联网公司在其发展过程中都会错失一些技术方向,后期付出高昂的代价来进行弥补。张毅说,Pika抓住文生视频这个前景广阔的方向,持之以恒不断推进,是非常有价值的。