中国第一家圆模制造厂
专业+/-0.1mm精密模切
爱游戏体育平台赞助马竞
爱游戏体育平台赞助马竞
爱游戏体育平台赞助马竞销售网络
首页 > 成功案例

电子行业点评:Sora模型横空出世AIGC行业又一里程碑

时间: 2024-04-02 02:39:08

  2 月 16 日凌晨, OpenAI 发布了文生视频 AI 模型 Sora,能够准确的通过文本提示(prompt)、静态图像或视频直接生成或扩展视频,视频时长可达 1 分钟。

  OpenAI 发布了具有里程碑意义的文生视频 AI 模型 Sora。 Sora 能够生成具有多个角色、特定类型的主题和运动,具备准确且高清的细节特征的复杂场景。该模型不仅使用户得到满足在 prompt 中要求的内容,还了解这么多东西在物理世界或数字世界中的存在方式。此外, Sora 还可以在单个视频中创建多个镜头,且准确保留角色和视觉风格的一致性和连贯性。当前 OpenAI 尚未向公众开放,仅向数量有限的红队成员以及艺术家、制作人开放权限。

  Sora 亮点 1:首次提出统一各类视觉数据的——patch,打通了扩散模型和大模型之间的桥梁。 为了对齐不同时长、分辨率和纵横比的视觉数据, Sora在训练时先将大量不统一的视频和图像编码为较小的数据单元集合 patches,使得 Sora 能够正常的使用更广泛的视觉数据来训练扩散模型。 Patch 的出现打通了扩散模型与 transformer 架构下大模型之间的桥梁,使得 Sora 能够在DALL· E 和 GPT模型技术基础上, 生成高质量的视频。且 OpenAI 官方技术报告数据显示, 训练计算量越大,样本质量的提升越显著。

  Sora 亮点 2:“涌现”出新的模拟功能,视频长度、镜头切换效果与画面流畅度大幅度的提高,“世界模型”雏形初显。 受益于扩散模型的生成和 transformer注意力机制下的推理能力, Sora 在训练过程中“涌现”了许多新型的模拟功能,而非得益于对 3D、物体等属性的归纳偏置(inducitive bias) : 1) 3D 一致性; 2)远距离相干性和物体持久性; 3)模拟物理世界的交互性; 4)模拟数字世界。 得益于涌现出的创新功能和领先技术,有别于传统 AI 视频生成工具, OpenAI 的 Sora 模型可以在一定程度上完成场景和物象的多视角、逻辑合理、内容连贯且稳定的高清镜头切换,在生成视频的时长(60s)上也遥遥领先。

  Sora 的推出给文生视频产业明确发展路径: 更丰富的下游应用、 更高的算力需求与安全需要。 我们大家都认为, 在软件领域, Sora 的推出将进一步加深和拓宽OpenAI 的护城河; 在底层算法和模型方面,少数巨头将占据主导地位; 下游第三方应用与生态将不断丰富。在硬件领域,一方面, Sora 模型本身需要更丰富的数据和更强的算力来优化其性能, 另一方面,丰富的第三方应用生态和更多的视频创作者也带来了更高的算力需求。 因此,我们看好相关 A I 文生视频, AI 算力芯片,光模块等产业,以及给 AI PC 等端侧硬件带来的新机遇。此外, 目前推出的 Sora 模型仍存在弱点,且安全性问题尚未推出完整的解决方案,因此, AIGC 视频在中短期内将主要扮演“辅助者”的角色,未来对于模型的安全性问题以及相关规则制度的建立将势在必行。

  风险提示: 1、宏观经济恢复没有到达预期,下业需求没有到达预期; 2、贸易摩擦加剧,供应链进一步受限的风险;3、研发技术和迭代、产品推进没有到达预期,存在国产替代没有到达预期的风险; 4、行业竞争加剧,使得部分企业纯收入能力下滑的风险

成功案例