OpenAI携视频生成模型开启新年!这些A股上市公司纷纷布局相关业务

摘要: 视频生成模型、A股上市公司、OpenAI、业务布局OpenAI的视频生成模型Sora引领最新技术潮流,各A股上市公司正在积极布局相关业务。 有关更多详细信息,请继续阅读本文。O...

视频生成模型、A股上市公司、OpenAI、业务布局

OpenAI的视频生成模型Sora引领最新技术潮流,各A股上市公司正在积极布局相关业务。 有关更多详细信息,请继续阅读本文。

OpenAI携视频生成模型开启新年!这些A股上市公司纷纷布局相关业务

昨天凌晨,OpenAI 又做出了一大动作,发布了首款 Vincent 视频模型 Sora。 据OpenAI介绍,人工智能系统可以快速生成一分钟长的视频,可以呈现具有多个角色、特定类型动作以及主体和背景的准确细节的复杂场景。 从公司官网更新的48个视频演示来看,Sora不仅能准确呈现细节,还能生成情感丰富的角色。

在技​​术和工作原理方面,OpenAI表示,由于采用了Transformer架构,Sora具有极高的可扩展性。 同时,在以往对DALL·E和GPT研究的基础上,还使用了DALL·E 3的重述技巧。 Word 技术为视觉模型训练数据生成高度描述性的注释。

在OpenAI的Sora之前,谷歌去年12月21日发布了新的视频生成模型VideoPoet,可以进行包括文本转视频、图像转视频、视频风格化等操作。一夜爆红的Vincent视频软件Pika也定下了掀起AI视频应用热潮。 对于Sora的出现,360集团创始人兼董事长周鸿祎2月16日在微博发文表示,这意味着AGI实施将从10年缩短到一年。

业内专家指出,基于视频的生成式AI结合文声视频功能,可以有效降低创作者的创作门槛。 国海证券陈梦珠在11月8日的研报中提到,根据量子位发布的《AIGC/AI生成内容行业展望报告》,视频生成将成为跨模态生成领域的中高潜力场景在不远的将来。 其背后的逻辑是不同技术带来的主流内容形态的变化。 NVIDIA高级科学家Jim Fan评价说,2022年是图像年,2023年是声波年,2024年是视频年。

随着海外OpenAI、谷歌等纷纷推出自己的Vincent视频模型,东方证券快剑等在12月18日的研报中提到,国内领先厂商已入局,包括海康威视、大华科技、萤石等。 互联网等视频分析行业领先厂商纷纷投入多模态大模型研究和行业应用实施。 具体来说,海康威视目前正处于多模态大模型的研发阶段,包括视觉、语音、文本等多模态信号的融合训练和处理。 大华股份于10月23日发布“星瀚大模型”,融合点云、语音、图像等输入,构建多模态融合的行业视觉模型。 值得一提的是,新雅达携“天才女儿”成立皮卡的消息刺激该公司去年11月30日至12月7日连续录得6次点击量。 该公司表示,它是围绕图像识别和人工智能定制而构建的。 深入研究建模等能力。

此外,专注于视频创意和绘图创意软件产品的万兴科技近日在互动平台表示,该公司的视频创意产品Wondershare Filmora可用于各类视频的创作和编辑。 “天幕”大模型是基于视频创意AI技术为核心的大型多媒体模型,涵盖音频、图像、视频等多模态能力。 昆仑国际旗下的星空集团和Opera都有做短视频的潜力,Opera已经在海外推出了短视频功能。 此外,昆仑万维天工大模型在腾讯优图实验室联合厦门大学开展的多模态大语言模型评测中综合得分排名第一。 当红科技是一家专业的智能视频解决方案和视频云服务提供商,拥有自主研发的AIGC工具集,并于去年上半年发布了静态照片生成三维体积视频的解决方案。

据财联社不完全统计,包括万兴科技、博汇科技、一点天下、数位视频、汉王科技、当红科技、东方国信、申思电子、银赛集团、托尔西、国脉文化、嘉信等10多家包括渡科技在内的A股上市公司近三个月均披露了其在互动平台视频生成模型领域的业务情况。 其中,当红科技互动平台1月5日表示,公司拥有自主研发的AIGC工具集,发布了由静态照片生成三维体积视频的方案,并通过点云模型转换实现高达800倍视觉无损和压缩算法。 压缩可以在不同模式之间切换。 Insai集团旗下的InsightGPT目前可以生成20秒以上的视频。 它可以将图像和视频大模型结合起来,融合抠图等算法,然后与音频模型结合起来,最终在整体渲染后合成完整的视频。

OpenAI带来视频生成模型开年王炸!这些A股上市公司布局相关业务

浮窗式百度分享代码,请勿使用文字或图标

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏