ZH
HomeBlog其他AI生成视频成为现实?OpenAI正式推出AI视频创作模型Sora!

AI生成视频成为现实?OpenAI正式推出AI视频创作模型Sora!

cover_img

Soar官网:https://sora.com/


2024年12月10日,OpenAI 在其12月第三场直播中正式推出了全新的视频创作模型——Sora!此前,OpenAI 已连续发布了为期12天的直播预告,集中展示了公司在人工智能领域的最新进展,尤其是在多模态创作工具方面的创新。Sora 正是在这一背景下首次亮相。

在本场直播中,Sora 作为 OpenAI 新一代创作工具正式登场。该模型旨在为视频创作提供革命性的解决方案,通过人工智能自动生成剧本、配乐、场景和视觉内容,从而大幅简化传统视频制作流程。直播中,Sora 展示了如何仅通过简单的文本描述,快速生成高质量的视频内容,迅速引起了广泛关注和热议。

如果你对直播内容感兴趣,可以前往 油管观看回放。接下来的文章中,我们将详细介绍 Sora 的功能、应用场景以及如何使用这一强大的创作工具。


一、Sora 是什么?

Sora 是 OpenAI 最新推出的视频创作工具,旨在利用先进的人工智能技术简化视频制作过程,帮助用户轻松创作高质量的视频内容。该工具可以根据简单的文本提示快速生成专业级别的视频,极大地降低了创作门槛。通过结合文本生成、图像处理和音频合成等技术,Sora 利用 OpenAI 的多模态 AI 技术,为视频创作者提供了一个全面的自动化解决方案。

Sora 最初于 2 月推出,面向一小部分艺术家、设计师和电影制作人;随着 3 月份这些创作者展示了他们的奇幻实验成果,OpenAI 发布了 Sora Turbo 的增强版本;现已向全球绝大部分地区 ChatGPT 用户开放。

二、Sora 面向用户

在 Sora 首发后,迅速吸引了大量用户,掀起了前所未有的热潮。然而,随着用户数量的激增,Sora 的服务器和基础设施面临了巨大的压力。目前,由于过于拥挤,平台暂时无法接受新用户注册,部分用户也无法成功登录 Sora 账号。

OpenAI 的首席执行官山姆·奥特曼(Sam Altman)表示,Sora 的需求超出了团队的预期,团队正在全力以赴进行技术优化和服务器扩展,以确保每个用户都能够顺利访问并使用 Sora。

根据目前的规定,绝大多数国家和地区的用户均可访问 Sora,但英国、中国、瑞士和欧洲经济区(EEA)的用户暂时无法使用该服务。

想知道自己所在地区能否使用Sora吗?访问官网:https://intercom.help/openai/en/articles/10250692-sora-supported-countries了解更多。请注意,任何未在此名单上的地区,若尝试访问或提供服务访问权限,可能会导致您的帐户被阻止或暂停。

面对这么一个炙手可热的明星产品,尚未能体验上的网友只能眼巴巴地看着别人分享Sora的使用心得,互联网上可谓是”哀号遍野“。

三、Sora 的强大功能:让想象通过文字、图像或视频焕发生命

核心功能

文本生成视频

Sora 的核心功能之一是通过文本生成高质量的视频。用户只需输入简单的文本描述,Sora 就能自动生成相关的视频内容,极大地简化了传统视频制作流程。无论是创作剧本、场景、配乐还是视觉效果,Sora 都能自动处理,为用户节省大量时间和精力。

多种视频规格支持

Sora 允许用户生成 1080p 分辨率的视频,视频长度可达 20 秒,支持宽屏、竖屏和方形等多种比例,适应不同社交媒体平台和创作需求。该工具不仅能生成 真实感强 的场景,如繁忙的城市街道或宁静的雪景,还能制作 超现实 的视频,例如火箭升空时喷射五彩缤纷的彩带,或是巨大嘴巴里充满了小花朵。

图像与视频的动画化

你可以将静态图像转化为动态画面,或者延续已有视频内容,制作更长时间的动画效果。

3D 一致性与长期一致性

Sora 还具备惊人的 3D 一致性能力,可以在动态镜头中保持人物、物体和场景的自然连贯性。当摄像机移动时,视频中的元素会按照三维空间中的位置变化自然移动,呈现出真实感的动态效果。此外,Sora 还能够在长时间的视频生成过程中保持物体的持续性,即使物体短暂脱离镜头,它仍然能够在后续的镜头中出现,确保视频的整体连贯性。

模拟数字世界与互动

Sora 不仅能模拟简单的物理和互动现象,还可以模拟更复杂的数字世界。例如,它能够展示画家在画布上留下涂抹痕迹的过程,或是模拟人类动作,如吃汉堡时留下的咬痕。此外,Sora 还可以生成像 Minecraft 这样的虚拟世界,通过控制玩家角色,实时渲染游戏世界中的变化,带来身临其境的体验。

主要功能:

1. Remix(重混)

Remix 功能让你随意修改视频中的元素。你可以替换视频中的部分内容、删除不需要的部分,或者重新设计某些元素。例如,假设你拍摄了一段人在公园跑步的视频,使用 Remix 功能,你可以将跑步的人物替换成一个动画角色,或者将公园的背景换成一个沙滩景观,创造出一个全新的故事情节。


2. Recut(重新剪辑)

Recut 功能让你挑选视频中的最佳画面,并把这些画面延长或调整顺序,完成一个完整的场景。比如,如果你有一段快速移动的舞蹈视频,你可以通过 Recut 找出最精彩的舞步,并将它们延长,甚至改变这些舞步的顺序,让整个视频更加精彩。


3. Storyboard(故事板)

Storyboard 功能帮助你将视频按照时间线整理和编辑。你可以在时间线上安排每个视频片段的顺序,确保视频内容流畅自然。例如,在制作一个旅行视频时,你可以用 Storyboard 来安排每个城市的镜头顺序,确保旅行路线的呈现逻辑性,同时还能方便地调整镜头的长短,使视频更具节奏感。


4. Loop(循环)

想要制作重复播放的效果吗?Loop 功能让你将视频剪辑成无缝循环的效果,特别适合做短小、节奏感强的内容。举个例子,如果你想制作一个展示风景的视频片段,你可以选取一段风景逐渐变化的镜头,通过 Loop 功能让它在循环播放中显得更加流畅,给观众带来一种沉浸式的体验。


5. Blend(混合)

Blend 功能可以把两个视频合并成一个无缝衔接的片段。假设你拍摄了一段人们在城市街头的生活场景和另一段海边日落的视频,使用 Blend 功能,你可以将这两个场景平滑衔接,创造出一种令人惊艳的过渡效果。这种混合功能不仅适用于两个场景,也可以用来将两种不同风格的内容结合,产生非常创意的效果。


6. Style Presets(风格预设)

如果你有自己喜欢的风格,Style Presets 功能允许你保存这些风格并在未来的创作中重复使用。例如,你拍摄了一段黑白电影风格的视频,通过调整对比度、亮度和滤镜等,将其变得更加有年代感。你可以保存这个风格作为预设,之后在其他视频中直接应用,省去每次调整的麻烦。


四、Sora 定价

Sora 作为 ChatGPT 的一部分,对于已订阅 ChatGPT PlusChatGPT Pro 的用户,无需额外付费即可使用该视频创作模型。根据不同的订阅选项,Sora 提供了多样化的功能,满足不同用户的需求。

ChatGPT — $20.00/月

  • 优先视频生成:每月最多 50 个优先视频(1,000 积分)
  • 视频规格:支持最高 720p 分辨率,视频时长最多为 5 秒
  • 额外功能:访问 ChatGPT Plus 所有其他功能,提升您的创作体验

ChatGPT Pro — $200.00/月

  • 无限制生成:您可以生成无限数量的视频创作
  • 优先视频生成:每月最多 500 个优先视频(10,000 积分)
  • 视频规格:支持最高 1080p 分辨率,视频时长最多 20 秒,最多 5 个同时生成的任务
  • 下载无水印:下载视频时不会带有水印,适合商业用途
  • “放松”视频生成:不限时长和分辨率的低优先级视频

什么是“优先视频”?

“优先视频”是指在生成视频时,享有更高优先权的内容。当系统资源有限时,优先视频将被优先处理,而不需要按照顺序排队等待。这对于需要快速生成视频内容的用户尤其重要,能够显著提高创作效率。

什么是积分?

在 Sora 和其他基于积分系统的服务中,积分(Credits) 用于衡量用户可用的生成资源。每当用户生成视频、请求 AI 服务或执行其他操作时,都会消耗一定数量的积分。积分系统使得使用更加灵活,且根据需求可选择适当的生成配额。


功能ChatGPT PlusChatGPT Pro
优先视频数量每月最多 50 个优先视频(1,000 积分)每月最多 500 个优先视频(10,000 积分)
视频分辨率支持最高 720p 分辨率支持最高 1080p 分辨率
视频时长最多 5 秒最多 20 秒
同时生成任务最多支持 5 个同时生成任务
水印下载不支持下载视频时无水印
更多功能提升创作体验,支持 ChatGPT Plus 所有功能提供更高分辨率和更多生成选项

五、Sora 的安全性保障

在让大家使用 Sora 之前,OpenAI 可没少花心思在确保这款视频创作工具的安全性上。他们与一些专业的“红队”合作,这些团队擅长发现工具可能带来的安全问题,尤其是在虚假信息、仇恨内容和偏见方面。通过一系列严谨的测试,OpenAI 确保 Sora 能够抵御各种潜在的风险。

此外,OpenAI还在开发一些工具来检测误导性内容。比如,他们正在开发一个检测分类器,能够识别出哪些视频是由 Sora 生成的。除了开发新的安全技术,OpenAI还充分利用了为其他产品(如 DALL·E 3)建立的现有安全方法。这些方法同样适用于 Sora,确保这款新工具能够在使用过程中维持高标准的安全性。

具体来说,Sora有哪些安全措施呢?

  1. 文本输入审核:用户的文本输入会先经过筛查,确保没有违反使用规范的内容。例如,涉及暴力、色情、仇恨言论或侵犯他人版权的请求,都会被拒绝,确保其不违反使用政策。
  2. 视频内容审核:每个生成的视频都会经过图像审核,确保每一帧都符合规定。如果视频内容存在问题,它们不会展示给用户。若检测到用户上传的真人照片/视频涉及在世知名人物,系统将要求用户重新上传;若检测到上传的是未成年人的照片或视频,也会触发安全限制。
  3. 全球合作与反馈:OpenAI也非常重视与全球的政策制定者、教育工作者和创作者的合作,听取他们的意见和担忧。毕竟,尽管OpenAI已经做了很多测试,还是无法预见到所有的使用场景和问题。所以他们认为,听取大家的声音,持续改进产品是确保安全和可用性的关键。

六、关于 Sora 的常见问题

什么是 Sora?

Sora 是 OpenAI 推出的一款创新的视频生成模型,能够根据用户输入的文本描述、图像或现有视频内容,自动生成高质量的视频。它简化了视频创作过程,适用于个人创作者、企业营销人员以及教育工作者,帮助用户轻松制作和编辑内容。

如何使用 Sora?

使用 Sora 很简单。你只需通过 ChatGPT Plus 或 ChatGPT Pro 订阅,然后输入文本、上传图像或视频,Sora 就能根据这些输入生成相应的视频内容。无论是短视频创作、动画效果,还是图像转视频,Sora 都能提供强大的支持。

Sora 的视频规格是什么?

Sora 支持生成多种规格的视频,具体包括:

  • 最高分辨率:支持生成 720p 或 1080p 的高清视频。
  • 时长:视频时长最多可达 20 秒。
  • 视频比例:支持宽屏、竖屏、方形等多种视频比例,满足不同社交平台需求。

Sora 支持哪些输入格式?

Sora 支持多种输入格式,包括文本、图像和现有视频。你可以根据需要提供任意一种输入,Sora 都能自动生成与之相关的视频内容。

Sora 可以生成哪些类型的视频?

Sora 能生成各种类型的视频,包括:

  • 真实场景视频:例如城市街道、自然风景等。
  • 超现实视频:例如火箭升空或奇幻场景等。
  • 动画视频:将静态图像转换为动画,或者延续已有的视频内容。

Sora 是否支持多人协作?

Sora 本身不直接支持多人协作,但用户可以借助工具,如DICloak指纹浏览器,在不同设备间分享和交换视频内容,灵活调整和使用视频创作功能。

为什么Sora 视频生成这么慢?

如果你在使用 Sora 时遇到视频生成缓慢或者收到“服务已满”的提示,以下是一些立即可以采取的故障排除步骤:

  1. 清除浏览器缓存和Cookies:如果之前一切正常,但现在突然出现延迟,问题通常出在过时的缓存数据。清除浏览器的缓存和Cookies,通常能解决与某些网页应用相关的意外问题。
  2. 查看状态页面:在高峰时段,Sora 的用户可能会注意到某些时间段的慢速反应。你可以查看我们的状态页面,了解是否有高峰期影响响应速度的模式。
  3. 检查 OpenAI 状态页面:确认是否有任何已知的系统问题或正在进行的维护活动,这些都可能影响响应速度。
  4. 尝试不同的浏览器:这有助于确认问题是否与当前的浏览器或设备设置相关。
  5. 禁用浏览器扩展:某些浏览器扩展会干扰网页应用。尝试禁用扩展程序,特别是那些阻止脚本或广告的扩展,看看是否能解决问题。关闭不必要的程序或标签页也能释放系统资源,加快浏览速度。
  6. 使用隐身模式:隐身模式会禁用大多数扩展,帮助确认问题是否与浏览器设置或扩展有关。
  7. 尝试不同的设备或网络:使用在线测速工具检查你的网络连接速度,看看是否是网络问题导致的慢速。
  8. 检查公司网络:有时候,公司网络可能有新的策略,导致无法顺畅访问 Sora。如果你怀疑是网络问题,联系你的 IT 管理员以确认是否是网络设置造成的困扰。

Sora 可以通过 API 访问吗?

目前,Sora 尚无 API 访问权限。


分享至

DICloak防关联指纹浏览器-防止账号封禁,安全管理多帐号

让多账号运营更简单高效,低成本高速度实现业务增长

相关文章