Sora
Sora是OpenAI于2024年2月16日凌晨发布的创新性文生视频模型,可以在保持质量的前提下,生成1分钟的视频,超过Gen-2、SVD-XT、Pika等主流产品,这也再次展示了OpenAI在大模型领域超强的技术研发能力。
Sora概述[ ]
Sora是一种扩散模型,其生成视频的过程通常是从静态噪音的视频开始,然后通过多个步骤逐渐去除噪音,完成视频转换。类似于ChatGPT,Sora采用了Transformer架构,并应用了DALL-E 3中的重述技术,这种技术有助于为视觉训练数据生成准确描述性的字幕。
Sora在生成视频的过程中能够准确还原用户提供的文本提示的语义。还能够生成具有多个角色、特定类型的运动以及主题和背景的准确细节的复杂场景,不仅了解用户在提示中要求的内容,还了解这些东西在物理世界中的存在方式。
该模型对语言有深刻的理解,使其能够准确地解释提示并生成表达生动情感的引人注目的角色。Sora 还可以在单个生成的视频中创建多个镜头,以准确保留角色和视觉风格。
360创始人周鸿祎对Sora给予了极高的评价,他认为,Sora的诞生意味着AGI(通用人工智能)实现可能从10年缩短至一两年。
周鸿祎认为,科技竞争最终比拼的是让人才密度和深厚积累,“很多人说Sora的效果吊打Pika和Runway。这很正常,和创业者团队比,OpenAl这种有核心技术的公司实力还是非常强劲的。有人认为有了AI以后创业公司只需要做个体户就行,实际今天再次证明这种想法是非常可笑的。”
Sora发布后数小时,马斯克在社交媒体上回复了“gg humans”,gg为Good Games缩写,代指“打得好,我认输” 。之后马斯克还称,通过AI增强的人类将在未来几年创造出最好的作品。
Sora使用[ ]
OpenAI表示,目前Sora已经向“红队成员”开放,即那些能够评估风险并识别潜在问题的(如错误信息、偏见和仇恨内容)专家,还将向一些视觉艺术家、设计师和电影制作人开放,以获得有关如何推进模型以对创意专业人士最有帮助的反馈。
Sora安全[ ]
OpenAI将采取几个重要的安全措施,目前正在与红队人员合作,他们将对模型进行对抗性测试。在开发一些工具来帮助检测误导性内容,比如检测分类器,它可以分辨出视频是由 Sora 生成的。
例如,一旦进入 OpenAI 产品,Sora的文本分类器将检查并拒绝违反我们使用政策的文本输入提示,例如要求输入极端暴力、性内容、仇恨图像、名人肖像或他人知识产权的内容。还开发了强大的图像分类器,用于审查生成的每段视频的帧数。。