Video Ocean

Video Ocean视频大模型支持文生视频、图生视频及人物一致性处理功能，适用于广告、创意及媒体制作领域，轻松提升视频制作效率。

Video Ocean是一款基于人工智能技术的视频生成工具，它为用户提供了快速、高效、创意超群的视频制作体验。这款软件由潞晨科技开发，旨在打破传统视频制作的障碍，让每个人都能轻松创作出引人注目的视频内容。

其核心优势在于其强大的AI技术。它能够快速分析用户的需求，并自动生成脚本、选择合适的素材、配乐和特效，从而大幅提高创作效率。用户无需具备专业的视频编辑经验，只需几个简单步骤即可完成视频制作。这种简洁直观的用户界面设计，使得即使是视频制作新手也能快速上手。

并且提供了大量的模板和素材供用户选择，包括不同风格的视频模板、背景音乐、音效和动态图像等，大大丰富了创作选择。用户可以根据自己的需求，选择适合的模板和素材，轻松制作出高质量的视频内容。

除了基本的视频生成功能外，Video Ocean还带来了三大突破性功能：文生视频、图生视频和角色生视频。文生视频功能允许用户通过输入文字描述，即可生成符合要求的视频内容。图生视频则通过输入静态图片，利用AI算法生成动态视频，为图片赋予了新的生命力。而角色生视频功能则更加令人瞩目，它可以根据用户的设定，生成具有特定风格、动作和表情的角色视频，为影视制作、游戏开发等领域提供了前所未有的创意支持。

关于研发公司

潞晨科技是一家专注于人工智能技术研发的创新型企业，总部位于北京，并在新加坡设立了海外研发中心。公司致力于降低大模型的落地成本，提升训练、推理效率，其核心产品是开源高效深度学习系统Colossal-AI。该公司在视频生成、图像识别、自然语言处理等领域取得了显著成果。其最新发布的Video Ocean模型，以黑白电影片段为灵感，实现了任意角色、任意风格的视频生成，并带来了文生视频、图生视频、角色生视频三大突破性功能。这些功能极大地降低了视频制作的门槛，为创意产业开启了无限可能。其Video Ocean模型自发布以来，就受到了广泛关注。公司也完成了多轮融资，包括数亿元的A轮融资和A++轮融资，投资方包括北京市人工智能产业投资基金、Capstone Capital、领沨资本、石溪资本等。这些资金将用于进一步推动公司的技术创新和产品研发。

Video Ocean功能介绍

Video Ocean以其强大的功能、简便的操作和高效的工作流程，为用户提供了全新的视频创作体验。无论是个人创作者还是企业团队，都可以通过这款软件轻松制作出高质量、个性化的视频内容。随着技术的不断进步和应用的不断拓展，Video Ocean有望成为创意产业中不可或缺的一部分。

文生视频（Text-to-Video）

精准理解提示词

能够解析包含复杂逻辑关系的提示词。例如，“在一个充满神秘气息的中世纪城堡中，有一位穿着华丽盔甲的骑士，他手持宝剑，在昏暗的走廊里小心翼翼地前行，同时周围有闪烁的烛光和若有若无的神秘低语声”。Video Ocean 可以准确理解场景的时代背景（中世纪）、人物（骑士）、动作（前行）、环境细节（烛光、低语声）等诸多元素，并将它们有机地组合在生成的视频中。
对于抽象概念也能很好地理解并可视化。比如 “一个代表着希望的光芒从黑暗的深渊底部缓缓升起，光芒所到之处，黑暗如潮水般退去，同时伴随着振奋人心的音乐”，它能够通过色彩、光影的变化以及合适的音乐搭配来展现这种抽象的希望与黑暗的对抗。

高质量视频生成

人物方面，人物的面部表情能够根据场景和情绪进行细腻地生成。例如在一个悲伤的场景中，人物的眼角会有自然的泪花，嘴唇微微颤抖，眉毛紧皱，这些表情细节会随着视频的推进而动态变化，栩栩如生。人物的肢体语言也非常自然，像是在一个舞蹈场景中，舞者的身体扭动、手臂伸展和脚步移动的节奏和幅度都符合真实舞蹈的美感和韵律。
场景细节上，无论是自然景观还是建筑环境都有出色的表现。以自然景观为例，在生成一个热带雨林的视频时，每一片树叶的纹理都清晰可见，雨滴从树叶上滑落的动态效果非常逼真，阳光透过树叶间隙洒下的光影斑驳陆离。对于建筑环境，像古老教堂的墙壁上的浮雕、彩色玻璃的细节以及建筑内部空间的光影效果都能精细地呈现。
在视频的连贯性方面，不同镜头之间的切换自然流畅。例如在一个故事性的视频中，从一个人物的特写镜头切换到全景的城市街道场景，过渡自然，不会出现突兀的感觉。

风格多样化

复古风格可以细分多种类型。如古希腊风格，视频中的建筑会呈现出多立克式、爱奥尼式等柱式风格，人物服饰是古希腊的长袍，颜色古朴典雅；还有民国风格，街道场景带有浓郁的东方韵味，人物穿着旗袍、长衫，店铺招牌是繁体汉字，整个视频色调带有旧照片的微黄质感。
现代风格包括都市时尚风格，视频中会出现高楼大厦、时尚的购物中心，人物的穿着是潮流的服装，发型时尚，画面的色彩鲜明、对比度高；还有工业现代风格，以工厂、机械为背景，色调以冷灰色为主，展现机械的硬朗线条和高效运转。
科幻风格下，对于外星生物的描绘独具特色。比如生成的外星生物可能有着闪烁着微光的皮肤，身体结构具有非地球生物的几何形状，它们在一个充满奇异光芒和悬浮地貌的星球上活动。对于宇宙飞船的设计也非常细致，从飞船的外形、推进器的光芒到内部复杂的控制台，都能营造出强烈的科幻氛围。
卡通风格丰富多样，如迪士尼经典卡通风格，人物形象具有夸张的表情和动作，色彩鲜艳饱满；还有日本动漫风格，人物的眼睛较大，头发造型丰富，场景带有典型的日式元素，如神社、和风街道等。

图生视频（Image-to-Video）

图片动态化

对于风景图片，它可以让原本静止的河流流动起来，水面泛起波光粼粼的涟漪；天空中的云朵缓缓飘动，光影随着云朵的移动而变化；山上的树木在微风中轻轻摇曳，树叶沙沙作响。
针对人物图片，不仅可以让人物动起来，还能根据用户的指令添加更多细节动作。例如，将一张人物坐在椅子上的照片变成一个完整的生活场景视频，人物可以从椅子上站起来，走向厨房，打开冰箱，拿出食物，坐在餐桌前享用，整个过程中的动作都与环境相匹配。

动作与细节调整

动作幅度的调整非常灵活。如果是一个体育场景的图片，比如一张运动员投篮的照片，用户可以将投篮动作从常规幅度调整为夸张的高跳、大力投射的动作，同时篮球的飞行轨迹、速度等细节也可以调整，比如让篮球在空中旋转的速度更快，飞行的弧度更高。
在细节方面，对于生成的动态视频中的物体表面材质也能进行调整。例如，将一张木质家具的图片生成视频后，用户可以调整家具表面的光泽度，使其看起来更光滑或者更有质感；对于人物服装的材质，如丝绸的光泽、棉布的纹理等也可以进行改变。

角色生视频（Character-to-Video）

自定义角色

外貌特征的定制十分精细。用户可以调整角色的五官形状，如眼睛的大小、形状（杏仁眼、圆眼等）、颜色（蓝色、绿色、棕色等多种颜色选项）；鼻子的高低、宽窄；嘴巴的大小、唇形（厚唇、薄唇）等。还可以对角色的肤色进行从白皙到黝黑的多种色调选择，并且可以添加雀斑、痣等细节。
服装定制方面，提供海量的服装款式。从古代的各种服饰（如汉服的曲裾、襦裙，欧洲中世纪的骑士甲胄、贵族长袍等）到现代的各类时装（休闲装、正装、运动装等），还有各种风格的奇幻服装（带有魔法符文的长袍、机械感十足的未来战衣等）。用户可以选择服装的颜色、图案、材质等细节。
发型的选择也多种多样。有长发、短发、卷发、直发等基本发型，还可以添加各种发饰，如古代的发簪、步摇，现代的发卡、头带等，并且能够调整头发的光泽度和蓬松度。

场景化应用

在场景选择上，除了常见的室内外场景，还包括一些特殊场景。例如神秘的魔法森林，森林中闪烁着奇异的光芒，有会说话的动物和古老的魔法阵；还有未来的太空站，角色可以在失重的环境中穿梭于各种高科技设备之间，周围是浩瀚的宇宙星空。
角色在场景中的互动非常丰富。比如在一个古装场景中，角色可以与其他 NPC（非玩家角色）进行对话、交易、比武等互动；在一个校园场景中，角色可以参加各种社团活动，如在音乐社团里演奏乐器，在体育社团里参加比赛等。

丰富的模板和素材库

丰富的模板

短视频模板包括生活记录模板，带有时间戳、地点标签等元素，方便用户记录日常生活的点滴；还有美食短视频模板，有食物特写镜头、制作过程展示以及品尝环节的固定布局，用户只需添加自己的美食内容即可快速制作出吸引人的美食视频。
广告模板针对不同的产品类型有不同的设计。例如电子产品广告模板，通常会有产品的 360 度旋转展示、功能亮点突出显示的画面，搭配科技感十足的音乐和简洁有力的文字介绍；而服装广告模板则会以模特走秀、服装细节展示为主，背景可以是时尚的 T 台或者充满潮流感的街头。
教育视频模板有知识讲解模板，画面会划分出讲解区域（老师或讲解者）和展示区域（如知识点的图片、图表等），同时可以添加互动式的问题环节；实验演示模板则会重点关注实验设备、实验步骤和实验结果的展示，并且会预留注释区域用于添加说明文字。

多样的素材

背景音乐涵盖各种风格。古典音乐从巴洛克时期的庄重典雅（如巴赫的作品）到浪漫主义时期的抒情激昂（如肖邦的作品）都有收录；流行音乐包括各种流行风格，如流行摇滚、流行电子等；还有民族音乐，如中国的古筝曲、二胡曲，非洲的鼓乐等，满足不同视频主题对音乐风格的需求。
音效素材丰富，自然音效有鸟鸣、风声、雨声、海浪声等，生活音效包括门铃声、电话铃声、汽车喇叭声等，特殊音效如魔法音效（咒语吟唱声、魔法阵启动声）、科幻音效（激光发射声、飞船引擎声）等，这些音效可以增强视频的真实感和趣味性。
动态图像素材包括各种动态背景，如星空闪烁、火焰燃烧、水流涌动等；还有一些动画元素，如可爱的动物形象动画、卡通风格的特效动画（如爱心闪烁、魔法星星飞过等），可以为视频增添生动的元素。

高效的编辑和调整工具

内容编辑

文本添加功能强大。用户可以在视频的任何位置添加文字，并且可以调整文字的字体（如宋体、黑体、艺术字体等）、大小、颜色、透明度等。文字的排版方式也很灵活，比如可以选择横排、竖排，还可以设置文字的对齐方式（左对齐、右对齐、居中对齐）。
字幕添加方便快捷。可以根据视频中的对话或讲解内容自动生成字幕，并且可以对字幕的样式进行调整，如字幕的颜色与背景颜色的对比度，字幕出现的时间和消失的时间，以及字幕的滚动速度等。
特效添加种类繁多。光影特效包括镜头光晕、阴影效果、反光效果等，例如在一个日出的场景中添加镜头光晕，让画面更加明亮、富有层次感；转场特效有淡入淡出、旋转切换、缩放切换等多种方式，比如在两个不同的场景之间使用旋转切换特效，使过渡更加自然、有创意。

个性化调整

视频时长可以根据用户的需要精确调整。用户可以选择缩短视频，比如将一个冗长的故事视频精简到关键情节部分；也可以延长视频，例如在一个风景视频中放慢播放速度，同时添加更多的动态元素，如飞翔的鸟儿、飘动的花瓣等，使视频时长增加，同时更加丰富。
播放速度的调整范围很广。可以将视频加速到像快进一样的效果，用于展示快速的动作或者制作时间 - lapse 视频（如花朵开放的过程、建筑物的建造过程等）；也可以将视频放慢，用于细致地观察某个动作或场景，如观察运动员的某个高难度动作的细节。
画面比例可以在常见的 16:9、4:3、1:1 等多种比例之间自由切换。例如将一个原本用于手机竖屏播放的 1:1 视频转换为适合电脑屏幕播放的 16:9 视频，系统会自动调整画面内容，避免画面变形。
色彩调整功能包括亮度、对比度、饱和度、色温等多个参数的调整。用户可以将一个色彩暗淡的视频通过提高亮度和饱和度，使其变得鲜艳夺目；也可以通过调整色温，将一个暖色调的视频转换为冷色调，营造出不同的氛围。

Video Ocean核心技术

文生视频（Text-to-Video）技术

自然语言理解与解析：能够精准地理解用户输入的文字描述，包括复杂的逻辑关系、场景设定、角色行为等信息。例如，用户输入 “在一个风雨交加的夜晚，一位孤独的侠客在山林中顶风冒雨地前行，手中的宝剑在闪电的映照下闪烁着寒光” 这样的复杂文本，系统可以准确地识别并提取出关键信息，如时间（风雨交加的夜晚）、场景（山林）、角色（孤独的侠客）、角色行为（顶风冒雨地前行、宝剑闪烁寒光）等。这需要强大的自然语言处理算法和深度学习模型对文本进行语义分析和理解。
视频内容生成算法：基于对文本的理解，利用先进的生成算法来构建视频内容。该技术可能采用了类似于 Diffusion Transformer（Dit）的架构，将文本信息转化为视频的帧序列。通过不断地迭代和优化生成过程，确保视频的连贯性和合理性。例如，对于人物的动作生成，系统会根据文本中描述的动作姿态和行为逻辑，生成符合物理规律和视觉习惯的动作帧；对于场景的构建，会根据文本中的场景描述生成相应的背景、道具等元素。

图生视频（Image-to-Video）技术

图像分析与特征提取：当用户上传图片后，系统首先对图片进行分析，提取出图片中的关键特征，如人物的外貌、姿势、物体的形状、颜色等信息。这些特征将作为后续视频生成的基础元素。例如，上传一张人物站在海边的照片，系统会提取出人物的形象特征、海边的背景特征等。
动态生成与融合：在提取图像特征的基础上，结合用户输入的指令或提示，生成动态的视频内容。这可能涉及到对图像中的元素进行变形、移动、添加特效等操作，以使其呈现出动态的效果。同时，系统还需要将生成的动态元素与原图片的背景进行融合，确保视频的整体协调性和真实性。比如，用户上传一张人物弹吉他的静态图片，并输入指令 “让人物熟练地弹奏起吉他”，系统会根据人物的姿势和吉他的位置，生成手指拨动琴弦等动态动作，并与原图片的背景融合，生成一段人物弹吉他的动态视频。

角色生视频（Character-to-Video）技术

角色建模与定制：允许用户自定义角色形象，系统具备强大的角色建模能力。用户可以输入角色的外貌特征、服装、发型、表情等信息，系统会根据这些信息构建出一个三维的角色模型。例如，用户可以创建一个穿着古装、长发飘飘、眼神坚毅的角色形象。这需要基于深度学习的三维建模技术，对大量的角色数据进行学习和训练，以便能够准确地生成符合用户需求的角色模型。
动作与行为生成：针对用户自定义的角色，系统能够根据用户的设定或输入的剧情，生成角色的动作和行为。这涉及到动作捕捉技术和动作生成算法的结合。系统会根据角色的特点和所处的场景，生成符合逻辑的动作序列，如行走、奔跑、跳跃、打斗等。同时，还可以根据用户的需求，为角色添加特定的表情和情感表现，使角色更加生动和富有个性。

视频质量优化技术：

分辨率提升与细节增强：为了生成高质量的视频，系统采用了分辨率提升技术，能够将生成的视频从较低的分辨率提升到较高的分辨率，如从标清提升到高清甚至超高清。同时，还通过细节增强算法，对视频中的细节进行优化，使人物的毛发、皮肤纹理、物体的质感等更加清晰逼真。
光影效果与色彩校正：在视频生成过程中，系统会自动添加光影效果，如阳光的照射、阴影的投射、灯光的闪烁等，以增强视频的真实感和氛围感。此外，还会对视频的色彩进行校正和调整，确保色彩的饱和度、对比度、亮度等符合视觉审美和艺术要求。

产品适用人群

广告营销人员：在广告行业，快速吸引消费者的注意力至关重要。Video Ocean 可以帮助广告营销人员高效地生成各种新颖、独特且富有创意的视频内容，用于产品推广、品牌宣传等。他们可以根据产品的特点和目标受众的需求，通过文字输入快速生成符合品牌风格的视频广告，大大节省了广告制作的时间和成本。例如，一家运动品牌想要推广一款新的运动鞋，营销人员可以输入 “运动员在崎岖的山路上穿着我们的运动鞋健步如飞，鞋子的细节清晰可见，周围的风景美不胜收”，Video Ocean 就能生成相应的视频广告，展示出鞋子的性能和优势。

影视从业者编剧和导演：对于编剧来说，Video Ocean 可以将他们的剧本创意快速转化为可视化的视频片段，帮助他们更好地呈现故事场景和角色形象，以便在前期策划阶段更直观地与团队成员沟通交流，验证创意的可行性。导演则可以利用该工具来预览拍摄场景、设计镜头语言等，为实际的拍摄工作提供参考和灵感。比如，导演在筹备一部科幻电影时，可以使用 Video Ocean 生成一些科幻场景的视频，提前确定特效和场景布置的方向。

后期制作人员：在影视后期制作中，常常需要大量的特效和素材来丰富影片内容。Video Ocean 可以为后期制作人员提供丰富的视频素材和创意灵感，帮助他们快速生成一些特效场景或过渡片段，节省了寻找和制作素材的时间。而且，通过该工具生成的视频可以作为参考，帮助后期制作人员更好地理解导演的意图，提高后期制作的效率和质量。

社交媒体内容创作者：如今社交媒体平台上的视频内容竞争激烈，用户需要不断推出新颖、有趣的视频才能吸引粉丝的关注。Video Ocean 为社交媒体内容创作者提供了强大的创作工具，无论是搞笑段子、生活记录还是知识科普等内容，创作者都可以通过文字或图片输入，快速生成高质量的视频。例如，一位美食博主可以上传一张美食图片，然后使用图生视频功能，让图片中的美食 “动起来”，再配上自己的解说文字，就能生成一个生动有趣的美食视频，吸引更多粉丝的关注和点赞。

教育工作者：在教育领域，生动形象的教学内容可以提高学生的学习兴趣和学习效果。教育工作者可以使用 Video Ocean 制作教学视频，将抽象的知识概念转化为直观的视频内容，帮助学生更好地理解和掌握知识。例如，物理老师可以输入 “小球在斜面上的运动过程”，生成相应的视频，帮助学生理解物理原理；历史老师可以输入 “秦始皇统一六国的场景”，生成历史场景的视频，让学生仿佛身临其境，提高学习的积极性和主动性。此外，教育工作者还可以利用该工具制作在线课程视频，丰富教学资源。

游戏开发者：游戏开发过程中需要大量的视频素材来展示游戏的特色、玩法和剧情。Video Ocean 可以帮助游戏开发者快速生成游戏角色的动作视频、游戏场景的演示视频等，为游戏的宣传和推广提供有力的支持。而且，开发者还可以利用角色生视频功能，自定义游戏角色的形象和动作，提前预览角色在游戏中的表现，为游戏的设计和开发提供参考。例如，游戏开发者可以输入 “游戏角色在神秘森林中与怪物战斗的场景”，生成相应的视频，用于游戏的宣传海报或预告片制作。

企业宣传人员：企业需要通过各种宣传渠道来展示企业文化、产品服务和企业形象。Video Ocean 可以帮助企业宣传人员快速制作企业宣传视频，如企业宣传片、产品介绍视频、企业活动视频等。他们可以根据企业的需求和特点，输入相关的文字描述或使用企业的图片素材，生成符合企业风格的视频内容，提高企业的知名度和影响力。例如，一家科技企业想要宣传一款新的智能产品，宣传人员可以输入 “智能产品在家庭场景中的使用过程，展示其便捷性和智能化”，生成产品介绍视频，用于企业的官网、社交媒体等平台的宣传。

学习使用难易度

评分：★★★★☆（四颗星）

界面友好性与直观性 ：Video Ocean的用户界面设计得相当友好和直观，新手用户能够很容易地找到所需的功能和工具，不需要花费大量时间去熟悉界面布局。这一点对于新手来说非常重要，因为它降低了学习的门槛。

操作简便性 ：平台的操作流程相对简便，新手用户可以按照引导或教程逐步完成视频的制作。虽然某些高级功能可能需要一些时间去了解，但基础功能的操作并不复杂。

学习资源与教程 ：Video Ocean可能提供了丰富的学习资源和教程，帮助新手用户快速上手。这些教程可能包括视频教程、图文教程或用户社区的支持，都是新手学习的好帮手。

智能化辅助 ：平台的AI技术为新手用户提供了智能化的辅助，如自动脚本生成、场景推荐等，这些功能大大减轻了新手在创作过程中的负担，使得他们能够更轻松地制作出高质量的视频。

技术门槛与细节处理 ：尽管Video Ocean在很多方面都降低了新手的难度，但视频制作本身还是有一定的技术门槛。新手用户可能需要一些时间来理解视频编辑的基本概念，如剪辑、转场、音效调整等。此外，对于某些细节处理，如颜色校正、特效添加等，也可能需要一定的学习和实践。

需要优化改进的地方

语言支持有限：目前文生视频功能可能主要支持英文提示词输入或对其他语言的支持不够完善。对于非英语国家的用户来说，在使用文字描述生成视频时可能会受到语言限制，需要花费更多的时间和精力去翻译和调整提示词，影响了创作效率和体验。

AI 理解的局限性：尽管 AI 技术在不断进步，但在理解用户的复杂意图和抽象概念方面仍然存在一定的局限性。有时候，用户输入的文字描述可能无法被系统完全准确地理解，导致生成的视频与预期存在一定的偏差。需要用户不断地调整提示词和参数，才能获得满意的结果。

缺乏深度编辑功能：与专业的视频编辑软件相比，Video Ocean 在深度编辑功能方面可能有所欠缺。例如，对于视频的剪辑、调色、特效添加等操作，可能无法提供像专业软件那样精细和全面的功能。用户在生成视频后，如果需要进行进一步的精细调整，可能还需要借助其他专业软件。

Video Ocean

关于研发公司