公然造假却被央视吹爆!AI产品毁三观 凭啥值千亿?

2024年最能搞事的巨头,依然是OpenAI。

先是创始人兼CEO奥特曼,透露预计筹集7万亿美元,用来提高全球芯片制造能力。

7万亿美元,都能把苹果、微软、谷歌一起打包买走了。

相比天文数字,更让人震惊的是OpenAI的另一件事。

2月16日凌晨,它的首个文生视频模型Sora正式亮相,并发布了几段AI生成的视频,最长60秒。

AI视频,从此达到了以假乱真的程度。

看到这些视频,普通人直呼“现实,不存在了”,同行们则全萎了。

明星AI公司Stability AI,原本也发布了一个新的视频模型,但看到Sora的视频后,官方火速删除了自家推文。

另外一家公司Runway,创始人感慨:过去要干一年的活,现在被它几天、几小时就干完了。

马斯克则到处留言“人类愿赌服输(gg humans)”。

央视也被惊动,有多个频道都对Sora进行了全天候报道。

对于Sora,目前全程高兴的只有两种人。

一个是老色批,他们已经快进到“MR头显+AI创作剧情”的联想了。

一个自然是OpenAI,再次逼疯同行后,其估值达到800亿美元,还可能飙升。

只能生成60秒视频的Sora,凭啥这么值钱?

发布2个小时,让对手损失上亿

在AI生成视频的领域,OpenAI不是第一个吃螃蟹的。

不一样的是,之前的AI视频公司,它们做的AI生成视频,基本只有几秒,而且模糊不清,还有明显的违和感。

比如去年,AI生成的一个外国男明星吃意大利面的视频,一眼假。

所以不少大佬都说在AI生成视频方面,我们还有很长的路要走。

但它的商业价值,没能人否认。

此前业内最知名的Runway,最多只能生成18秒的视频,但凭这手功夫,Runway参与了奥斯卡获奖影片《瞬息全宇宙》的制作,估值一度达到15亿美元。

还有一家去年底成立的创业公司Pika,靠其文生视频大模型轰动一时。这家只有4个人的公司,半年时间完成了三轮融资,估值飙升到2.5亿美元。

只是没想到,横空出世的Sora,一夜搅没了所有人的美梦。

Runway的CEO第一时间在网上说了两个字:“Game On(竞争开始了).”

另一家AI视频公司Stability的CEO甘拜下风:“奥特曼真是个魔术师。”

美国图片供应商Shutterstock,被跨界打击,在Sora发布的2小时,其市值损失了约7000万美元。

更惨的是谷歌,秒变科技界的汪峰。

因为就在Sora发布的同一天,谷歌也重磅发布了新一代多模态大模型Gemini 1.5 Pro,在性能上完全秒杀OpenAI的GPT-4 Turbo。

这本该是谷歌扬眉吐气的一天,却被Sora抢走了所有头条。

能让所有公司黯然失色,Sora太颠覆了。

别人还在用AI费劲地生成4秒动图,Sora随意生成60秒的高清大片。

其他AI生成视频充满山寨感,Sora甚至能生成电影级别的场景,以假乱真。

连“同一场景”下的多机位视频,Sora都整出来了。

无论是视频时长、画面精细度,还是细节完整性,不论是一镜到底还是多机位无缝切换,Sora的表现都可以用碾压对手来形容。

有人用相同的提示词,对比Sora和其他同类产品生成的视频,差距一目了然。

更关键的是,使用Sora的门槛极低。

从官方发布的宣传视频看,你只需要输入“构成元素、环境、行为及发生顺序、视频风格”等提示词,就能生成不同风格的高清、连贯、具有丰富运镜和转场的60秒视频。

所以,用它生成其他风格的虚拟视频也很容易,比如3D或动漫风。

同时还能根据要求,直接生成不同尺寸的视频,适配不同设备的屏幕。

说不定很快,人人都能有个导演梦。


Sora价值千亿的底气,不是秘密

其实Sora还有很多明显的弱点。

OpenAI指出,它可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系。

比如这个视频里,老人吹蜡烛前后,火苗没有丝毫变化,不合常理。

酒杯摔碎,但是液体的流动和玻璃的破裂关系,也不合理。

一个人在跑步机上倒着跑步,更不合理。

对于AI来说,现实世界里再简单、再自然的现象,它可能都需要学习才能理解和还原。

去年很火的“AI绘画”,一开始也有类似毛病。

让它画一幅“在地上睡”的图,呈现出的可能是“地板+枕头+人头”,以为把脑袋放在枕头上就是睡觉。

还有人发现,AI绘画总是不能让人物老老实实地吃拉面。用什么工具吃面,一口吃几根,AI都需要学习。

但AI绘画技术很快迭代,不再智障,反而成了工作利器。

一名做插画设计相关工作的人表示,用了AI绘画后,工作更高效了,“现在甲方给我一个主题,我可以同时给他生成七八张图。”

现在还有明显硬伤的Sora,也有快速迭代的能力。

这主要得益于它理解长文的能力,这也是OpenAI本来就有的杀手锏。

比如在输入端,OpenAI利用GPT,先将用户输入的提示词进行精准的详尽扩写,然后再将扩写后的提示词交给Sora,让Sora能更好地遵循提示词来生成精准的视频。

所以相比以往的AI视频生成,只能死板地翻译文案,接着生成死板的视频,Sora不光能理解文案,还能基于文案自行发挥,让视频变得更自然、更精彩。

就好像这个视频,在完成主题的前提下,Sora又自动进行了多次镜头转换。

有了更好的理解能力,才能有更好的逻辑能力。

因此,在理解和掌握了更多现实世界的现象以及规律后,Sora生成的视频会越来越接近真实。

行驶中的列车窗外偶遇遮挡,车内人物倒影的短暂出现,十分惊艳。

也可以来一段好莱坞大片质感的电影预告片。

近景视角下,镜头细节拉满。

这也是为什么,OpenAI把Sora定义为“世界模拟器”。

除了接近真实,Sora还能实现人类的非现实脑洞。举个例子,根据提示词“一个杯子里两艘海盗船战斗的逼真近距离视频”,它生成了这样的视频。

难怪很多网友直呼要失业了,影视、广告、游戏等很多行业都会被冲击。

不少人还认为,连抖音、TikTok等短视频平台也要有危机感了。

毕竟AI生成视频一旦踏入正轨,输出源源不断,再加上AI还能更好地理解人类的成瘾机制,如果OpenAI推出自己的短视频平台,很可能成为一方霸主。

OpenAI可能存在的野心,越来越吓人了。

从巨亏到狂赚,它为何成了巨头的噩梦?

作为近两年的科技界顶流,有段时间,OpenAI并不被看好。

在其创立的前几年,OpenAI毫无盈利能力,全靠金主爸爸养活。

以至于曾有商业报告称,OpenAI仅运行其人工智能服务ChatGPT每天就要花费约70万美元,OpenAI目前正处于烧钱的状态,若不加速自身商业化进程,很有可能在2024年底不得不申请破产。

但OpenAI用行动表示:不是不会赚钱,只是还不想赚钱。

去年下半年开始,OpenAI加速商业化。创始人介绍,截至去年11月,有92%的财富500强公司在使用OpenAI的产品。整个2023年,OpenAI的收入突破了20亿美元。

与此同时,其最著名的产品ChatGPT,周用户量达到了1亿。

随之而来的是它水涨船高的估值,从去年年初的300亿美元暴涨到如今的800亿美元,在创业公司里仅次于字节跳动和SpaceX。

不过,比起赚钱能力和飙升的估值,OpenAI身上还有更让巨头忌惮的特质。

那就是开创风口的能力。

过去14个月,OpenAI始终是风口中的顶流。

从AI聊天,到AI绘画,再到AI生成视频,OpenAI的每次亮相似乎都在打脸巨头。

ChatGPT刚一亮相,吓得谷歌紧急推出AI加持的搜索引擎Bard,结果出师不利,当天股价大跌7.4%,市值蒸发1024亿美元。

Sora只是发出几段AI视频,抢走了所有科技版头条,让已经耕耘良久的同行自惭形秽。周鸿祎还在微博发长文表示,Sora意味着AGI实现将从10年缩短到1年。

如今火热的生成式AI市场,可以说离不开OpenAI的一步步推波助澜。

一个创业公司,抢先开创风口、放大市场,隐隐有成为新巨头的迹象,足以成为当下所有巨头的噩梦。

但与其眼红OpenAI不断开创风口,巨头们更该做的是反思。

前搜狗CEO王小川曾评论说:“OpenAI的成功,首先是技术理想主义的胜利。中国需要自己的OpenAI,就需要技术理想主义。大厂受自己的业务牵引,追逐资本热点的创业公司更动作变形。”

其实不论国内外,这个问题都存在。

在发展中,技术和创新的重要性不知不觉退居到了第二位,一切动作变成了为收入服务。

OpenAI就像曾经的影子,提醒它们必须想起久违的拼劲。

从ChatGPT到Sora,在AI的冲击面前,许多行业里的普通人都开始有危机感,巨头也别妄想能继续躺平。


推荐阅读