OpenAI 推出文生视频模型 Sora,人工智能赋能短视频应用发展超预期。从全球角度看,OpenAI Sora 的发布,使得 ChatGPT 从文字、图片层面正式向成熟短视频层面进行演进,可生成最长 60 秒的全动态视频,具备了创建复杂场景和多人物角色的能力,一经发布业界就引起较大轰动。Sora 本质上基于“Transformer+Diffusion”,属于 GPT 的延申,代表了人工智能应用的进一步尝试,让世界看到了 AI 行业的更多可能,随着全球对 AI 的热衷程度不断提高,未来全球 AI
Sora 是第一个表现出"涌现"能力的视频生成模型:随着模型规模增大而出现“理解世界”的能力。虽然许多 LLM,如ChatGPT 和 GPT-4,表现出涌现能力,但在 Sora 出现之前,展示类似能力的视觉模型一直很少。根据 Sora 的技术报告,它是第一个表现出确认的涌现能力的视觉模型,标志着计算机视觉领域的一个重要里程碑。