Sora

Sora是OpenAI于2024年2月16日凌晨发布的创新性文生视频模型，可以在保持质量的前提下，生成1分钟的视频，超过Gen-2、SVD-XT、Pika等主流产品，这也再次展示了OpenAI在大模型领域超强的技术研发能力。

Sora概述[ ]

Sora是一种扩散模型，其生成视频的过程通常是从静态噪音的视频开始，然后通过多个步骤逐渐去除噪音，完成视频转换。类似于ChatGPT，Sora采用了Transformer架构，并应用了DALL-E 3中的重述技术，这种技术有助于为视觉训练数据生成准确描述性的字幕。

Sora在生成视频的过程中能够准确还原用户提供的文本提示的语义。还能够生成具有多个角色、特定类型的运动以及主题和背景的准确细节的复杂场景，不仅了解用户在提示中要求的内容，还了解这些东西在物理世界中的存在方式。

该模型对语言有深刻的理解，使其能够准确地解释提示并生成表达生动情感的引人注目的角色。Sora 还可以在单个生成的视频中创建多个镜头，以准确保留角色和视觉风格。

360创始人周鸿祎对Sora给予了极高的评价，他认为，Sora的诞生意味着AGI（通用人工智能）实现可能从10年缩短至一两年。

周鸿祎认为，科技竞争最终比拼的是让人才密度和深厚积累，“很多人说Sora的效果吊打Pika和Runway。这很正常，和创业者团队比，OpenAl这种有核心技术的公司实力还是非常强劲的。有人认为有了AI以后创业公司只需要做个体户就行，实际今天再次证明这种想法是非常可笑的。”

Sora发布后数小时，马斯克在社交媒体上回复了“gg humans”，gg为Good Games缩写，代指“打得好，我认输” 。之后马斯克还称，通过AI增强的人类将在未来几年创造出最好的作品。

OpenAI表示，目前Sora已经向“红队成员”开放，即那些能够评估风险并识别潜在问题的（如错误信息、偏见和仇恨内容）专家，还将向一些视觉艺术家、设计师和电影制作人开放，以获得有关如何推进模型以对创意专业人士最有帮助的反馈。

OpenAI将采取几个重要的安全措施，目前正在与红队人员合作，他们将对模型进行对抗性测试。在开发一些工具来帮助检测误导性内容，比如检测分类器，它可以分辨出视频是由 Sora 生成的。

例如，一旦进入 OpenAI 产品，Sora的文本分类器将检查并拒绝违反我们使用政策的文本输入提示，例如要求输入极端暴力、性内容、仇恨图像、名人肖像或他人知识产权的内容。还开发了强大的图像分类器，用于审查生成的每段视频的帧数。。