从文字生成视频:人工智能再添新本领 演员导演要“失业”?

【欧洲时报网】没有任何预告,人工智能明星企业OpenAI在16日突然发布了文生视频工具Sora,并公布了一组由Sora生成的多镜头视频,包含真实人类世界的高模拟度画面、精细的画质、多镜头拍摄、多角度运镜等。

震惊业界:能生成多个角色、准确细节

综合广州《21世纪经济报道》、《成都商报》、新加坡《联合早报》报道,“一名时尚女子走在充满霓虹灯和广告牌的标志性东京街头,她穿着黑色皮夹克、红长裙和黑靴子,拎着黑色手袋,戴着太阳镜,涂着红色口红,走路自信又随意。街道潮湿且反光,在灯光映射下形成镜面效果,行人走来走去。”这段60秒的视频并非真实拍摄,而是对Sora输入文字指令后得到的人工智能生成产物。

Sora一出,立刻震惊业界。尽管这不是首个人工智能视频工具,其他企业也有类似文本生成视频的工具,谷歌正在测试名为Lumiere的模型,Meta则有名为Emu的模型,还有人工智能初创企业Runway也在开发相应产品来帮助制作视频。但人工智能专家和分析师表示,Sora视频的长度和质量超出了迄今为止所见的水平。

Sora能够生成具有多个角色、特定类型的运动以及主题和背景的准确细节的复杂场景。不仅了解用户在提示中要求的内容,还了解这些东西在物理世界中的存在方式。同时,该模型对语言有深刻的理解,使其能够准确地解释提示并生成表达生动情感的引人注目的角色。

据悉,Sora的团队中还包括两位华人:Li Jing在2014年本科毕业于北京大学物理系,2019年获得麻省理工学院物理学博士学位,2022年加入OpenAI。Ricky Wang今年1月刚刚从Instagram跳槽到OpenAI。

Sora团队公布的文生视频画面十分逼真。(图片来源:视频截图)

演员和导演要“失业”了?

多名人工智能从业者称,从Sora公布的预览视频来看,简直太“疯狂”。多方评论认为,科技界与影视界或将迎来新一轮革命。

特斯拉创始人马斯克在一个由Sora生成的视频下回复:“人类该认输了。”

360公司创始人周鸿祎则表示:“一旦人工智能接上摄像头,把所有的电影都看一遍,把YouTube上和TikTok的视频都看一遍,对世界的理解将远远超过文字学习,一幅图胜过千言万语。”

当人工智能可以直接将剧本文字变成视频时,甚至连演员和导演都不需要,就可以制作出“影片”。

影视从业者已经感到了巨大冲击。一名青年导演16日发朋友圈说:“今日,大家正为人工智能的进步会在不远的将来抢走饭碗而倍感惶恐。”

中国香港青年导演朱智立说:“它(Sora)对电影行业的影响只是一个时间问题,因为它已经把画面做到非常真实、有细节,连脸上的雀斑都能做到非常真实。”

目前在影视界,特别是动画电影中,用文生图片工具来画前期动态分镜预览已很广泛。分镜预览是指在正式拍摄之前将拍摄内容简单制作一遍,用简单动画展示出演员走位、取景、摄影机角度与运动大方向,这原本是要一笔不小的预算和时间的,但人工智能可以低成本快速产出。

另据法新社报道,法国育碧游戏公司(Ubisoft)称这一工具的发布为“量子飞跃”,可能让用户和开发团队表达他们的想象。该公司发言人说:“我们长期对这个潜力进行探索。”

Sora生成的视频中,主角脸上的雀斑清晰可见。(图片来源:OpenAI官网)

邀请用户评估潜在危害或风险

不过,作为一个新推出的工具,Sora也有需要改进的地方。

比如,此次发布的视频中有一个“与中国龙一起庆祝农历新年”,Sora无法准确生成视频画面中的中文受到了网友的关注。有相关人士对此调侃道:“莫非是中文太难了?”

前记者、现斯坦福大学研究员巴尔西·西蒙认为,人工智能制作能快速制作逼真的假场景。他担心此类工具可能会在选举期间被滥用,担心公众“不再知道相信什么”。

据悉,Sora如今正面向部分用户开放,以评估关键领域的潜在危害或风险。

(编辑:唐快哉)