2025年9月30日,OpenAI 正式发布视频与音频生成模型 Sora 2,并同步推出一款社交 iOS 应用 “Sora”。
与 2024 年的初代版本相比,Sora 2 在物理准确性、现实感和可控性上取得显著进步。它能够更好地遵循物理规律,例如篮球投篮未中时会自然反弹,而不是“瞬移”入框。Sora 2 还支持复杂的镜头切换、世界状态持续,以及电影风、写实风和动画风格的生成。
除画面外,Sora 2 也能生成对话、音效和环境声,并可通过录制素材将真人或实物准确嵌入生成视频。OpenAI 称该能力有助于推动通用世界模拟器的研究,同时为用户带来娱乐和创作体验。
在应用层面,OpenAI 推出 Sora 社交 App。用户可创建视频、互相二次创作,并使用“Cameo”功能将自己或朋友直接置入场景。App 将以邀请制方式在美国和加拿大率先上线,后续逐步扩展。
为应对潜在风险,OpenAI 表示已在 Sora 2 部署安全和健康机制,包括:
默认偏向展示关注对象的内容;
对青少年用户设定浏览与功能限制;
提供家长控制选项;
允许用户随时撤销对自己肖像的使用权。
Sora 2 最初将免费提供,但在算力受限时可能需要付费扩展。ChatGPT Pro 用户可在 sora.com 使用高质量的 Sora 2 Pro 模型。未来,Sora 2 还将通过 API 向开发者开放。
OpenAi Blog