Seed Dance 2.0 深度评测:即梦AI视频模型能否超越 Sora 2?
科技博主戏剧迷对字节跳动即梦平台推出的 Seed Dance 2.0 进行了深度实测,从首尾帧功能、全能参考到视频参考能力逐一验证。博主发现这款 AI 视频模型在动作稳定性、文字保持度、多图串联等方面相比 Kling 3.0 有显著提升,甚至认为在多个维度已超越 Sora 2 和 Veo 3.1。接下来我们看看博主是如何评价这款被称为"AI视频新王"的模型的。
Seed Dance 2.0 入口与积分消耗规则
进入即梦主页,在视频生成里面可以看到全新的 Seed Dance 2.0 模型。目前只能在首尾帧和全能参考这两个功能上使用它默认的参数设置,生成一段视频消耗30个积分点。首尾帧功能仅能参考两张图片;切换到全能参考后,最多可同时上传九张图片,积分消耗不变。但如果上传的是视频,扣除的积分会大幅提高。
Seed Dance 2.0 是一个能够混合参考的多模态模型,除了参考视频外,还能提供参考音频和对应的图片一起混合参考。正是因为这样的交互参考特性,玩法变得非常丰富。
Seed Dance 2.0 首尾帧功能实测:动作稳定性对比 Kling 3.0
首先测试首尾帧功能。上传一张女生玩滑板的图片,提示词输入:"女生从滑台上冲下,完成一系列高难度的滑板动作。"生成结果显示,Seed Dance 2.0 对复杂动作和物理规律的表现,相比过往视频模型有非常明显的提升,稳定性极高。up主抽了4次卡,所有生成的素材都可用,完全没有出现姿态扭曲的情况。
同样的提示词用之前的 Kling 3.0 模型生成对比,动作明显没那么真实自然,生成出来的女生样貌一致性保持度也不如 Seed Dance 2.0。
Seed Dance 2.0 文字细节保持度测试
Seed Dance 2.0 首尾帧对细微文字的保持度也有所加强。例如上传《戏剧迷全面掌握视频》中雅诗兰黛广告案例的两张图片,输入对应的变化提示词。把原图放大来看,瓶身上的文字非常清晰,但由于字体太小,不利于模型进行计算和采样。
之前用 Kling 3.0 模型制作,乍一看没问题,但放大拉近来看,细小文字会有扭曲。这次用 Seed Dance 2.0 对比测试,很明显对于这种细小文字的保持度更好,有着更高的细节精度——这对 AI 产品广告制作来说是一个很好的提升。
Seed Dance 2.0 全能参考:多图首尾帧串联
首尾帧功能只能上传两张图片。如果要实现多张图片的串联过渡,就要用到 Seed Dance 2.0 最核心的全能参考功能,可以直接上传最多12个素材。例如上传四张图片,实现"人物变成一只熊在咆哮"的效果。
在全能参考里调用素材有两个方法:一是点击"引用参考"按钮选择对应素材;二是更快捷的方式——在提示词里直接输入@符号,快速弹出上传素材调用框。选择第一个图片,提示词输入:"把它作为首帧,镜头慢慢拉近,人物突然抬起头,面部特征就参考图片2;接着大声咆哮,表情参考图片3;最后变成一只熊,参考图片4。"
通过这种方式把素材关联起来,Seed Dance 2.0 的多图串联过渡非常丝滑顺畅,完全看不到图片与图片之间过渡卡顿的问题。
Seed Dance 2.0 场景一镜到底与产品广告制作
再上点难度:上传五张场景完全不一样的图片,提示词直接按出五张图片,然后补充"一镜到底,追踪镜头:从街头跟随跑步者上楼,穿过走廊进入屋顶,最后俯瞰整个城市"。整个过程一气呵成,对于不能衔接的画面,Seed Dance 2.0 会自动进行贴近转换。
利用这个特性,现在制作产品广告非常简单轻松。只需拍摄几张产品图片上传到即梦,输入提示词:"鞋子的侧面就参考图片2,鞋子的材质就参考图片3,要求鞋子和鞋盒各个细节都要展示出来,并配上大气的背景音乐。"点击生成,非常高清、各个细节都能清晰呈现的产品视频就完成了。
Seed Dance 2.0 TI提示词格式:精准控制变化时长
Seed Dance 2.0 能够很好地在多图之间丝滑过渡,但如果想进一步控制某个图片与图片之间的变化时长,可以使用 TI 提示词格式。
例如上传五张历代保时捷 911 的图片。如果直接让 Seed Dance 2.0 过渡,它只会在不同车型之间过渡变化。但现在希望每款车型都要在公路上先行驶一段时间,再进行过渡变化,就要用 TI 的方式指定视频的变化效果:以图片一作为首帧,0至1秒的画面,图片一的汽车在公路上高速行驶;1至3秒的画面,图片一的汽车变形、拆解、整合、组装,变化成图片2;接着3至4秒画面,汽车又在公路上高速行驶……以此类推,把所有款式的图片串联起来。
Seed Dance 2.0 提示词理解力:复杂指令一键成片
前面测试的都是图片之间的过渡能力。接下来测试 Seed Dance 2.0 对提示词的理解和创造性。
上传一张蒙娜丽莎的图片,输入一系列非常复杂的提示词:"要求她有心虚的表情,先是左右瞄了一眼,然后从画框中弹出来,拿起台面上的可乐喝了一口,露出满足的表情;这时候传来脚步声,蒙娜丽莎立刻把可乐放回原位,保安没有发现,把可乐拿走了;最后画面出现对应的字幕和旁白:'来一口可乐,清爽直上头。'"
整段提示词交代的人物表情、细节和要完成的事项非常多。时间设置成最长的15秒,点击生成——Seed Dance 2.0 对所有细节几乎无一遗漏,毫无瑕疵地完整呈现出来。一分钟就能制作出这样一段有配音的广告大片,这就是现阶段 AI 视频惊人的能力。up主表示,就连影视飓风的 Team 也连夜给 Seed Dance 2.0 加更了一段视频。
Seed Dance 2.0 复杂叙事测试:好莱坞级追逐戏
接下来请出评测的主角:一个手拿着汉堡包的胖子。让这个主角通过 Seed Dance 2.0 完成一系列更加复杂的任务。
把小胖的图片上传进来,提示词输入:"让小胖手拿着汉堡包被一群人追逐。在逃跑的过程中,不小心碰到路边的水果摊,汉堡包丢在了地上,小胖迅速把汉堡包捡起来,连滚带爬继续逃跑。"设置12秒的生成时长,这样一段媲美好莱坞电影大片的效果就生成出来了。最令up主惊喜的是,Seed Dance 2.0 并不像过往视频模型那样,即便时长设置到15秒,各个分镜稳定性都非常高。效果直接一次生成,完全不需要多次抽卡。
Seed Dance 2.0 电影预告片制作实战
对于 Seed Dance 2.0 对提示词的超强理解能力,现在制作各种电影、短片、AI 漫剧都非常简单。同样上传小胖图片,让他用图片中男人的形象,通过 TI 提示词格式,生成一段减肥励志电影《破茧》的预告片——规定每个时间段要表达的画面和内容,还可以指定小胖的说话内容:"我不想再这样了。"接着就是激昂的背景音乐,小胖开始疯狂减肥。设置一下生成的分辨率,时间直接拉满15秒,效果就出来了。
Seed Dance 2.0 视频参考功能:复刻运镜与动作
前面用的都是图片参考功能。Seed Dance 2.0 的视频参考,才是它最灵魂、最核心的能力。
例如从网上看到一段炫酷的视频,通过 Seed Dance 2.0 可以非常轻松地复刻出来。只需要把视频上传到即梦,但需要注意:一旦用上视频参考能力,消耗的积分也会大幅提升。生成15秒的视频需要消耗195点积分。接着把想复刻的主体图片上传进来,提示词输入:"参考视频一的运镜和节奏,用图一的跑车来进行复刻。"瞬间同款视频效果就生成出来了。
合理利用好视频参考功能,可以很轻松地制作出各种好莱坞导演级别唯美的片段。只需要在网上找到喜欢的广告片段,保存下来导入即梦,就可以让角色模仿对应的拍摄手法,实现同款效果。
想要更接地气一点,可以找一段炫酷的舞蹈视频上传,让主角小胖"参考视频中的运镜和节奏,同时也参考视频中女子的跳舞动作"。这样小胖就丢掉手中的汉堡包,展示出优秀的舞蹈了。
Seed Dance 2.0 多素材混合参考:复杂运镜与打斗戏
再上点难度:直接用手机随手拍一个运镜的视频——向上、向下,接着往左转、再往右看——作为参考,然后上传多个场景的图片。提示词输入:"以图一作为首帧画面,参考视频的运镜方式;上方的场景参考图片2,下方的场景是图片3;接着把左右场景的画面都定义一下。"同款运镜、第一人称的视频画面就生成出来了。
再来复杂一点的超高难度运镜:把一段把观众都转晕的电影视频上传到即梦,主角依然是小胖,再上传几张自己生成的酒店构造图,根据原视频的运镜方式输入提示词。这样的好莱坞大片大家也能轻松实现。
同理,给小胖添加几个坏人——拿着棒球棍和大扳手,并生成一个指定的背景图片。上传一段打斗的参考视频,让小胖模拟视频中的动作——这些动作参考片段可以是实拍视频,也可以是三维建模、简单的骨骼姿态动作图,都能够识别。然后指定在图片三的场景中与图片二的黑衣人进行打斗,灵活帅气的小胖打斗视频就生成出来了,就连坏人拿着扳手的工具都能非常稳定地还原。up主感叹,即梦这次推出的 Seed Dance 2.0 确实非常强。
不过在测试过程中,对于过于炫酷的快闪视频的参考能力,会有一定程度的下降和污染。例如上传快闪视频,让小胖作为模特分别穿上五套不同的衣服,参考视频运镜,每穿一套衣服都切换一个镜头。生成效果总体不错,衣服也能完美穿上,但某些画面中会有原视频人物污染出现。如果想实现这样的快闪视频效果,需要多抽几次卡。
Seed Dance 2.0 AI 漫剧与视频延长功能
Seed Dance 2.0 的出现是 AI 漫剧制作者的福音。只需要提供一张九宫格的图片,也可以在图片上简单备注必要的注释,上传到即梦,提示词非常简单:"让它根据九宫格的图片说明制作出美式漫画风格的动画。"效果就出来了。
对于打斗动效,很多同学喜欢制作。现在可以先生成两个人物角色的形象图,然后再生成一张九宫格的打斗图片,直接上传到即梦,提示词输入:"图一的女生与图二的男生,参考图三的九宫格漫画进行打斗",然后补充一段通用的打斗提示词,一段非常炫酷的打斗效果就完成了。人物一致性保持度非常好,男生衣服上的阿迪 Logo 在各个分镜中都能够很好地保留下来。
此外,Seed Dance 2.0 还能对视频进行向前或向后延长处理,这个功能对视频创作非常有用。例如只生成了一段5秒钟"从咖啡杯上生长出甜甜圈"的视频,希望接着这个视频在后面继续创作,可以把它上传到即梦,提示词输入:"让它把视频延长15秒",后面就是对应的 TI 格式描述,指定不同时间段生成的效果。一段完整的瑞幸咖啡广告就在原来的基础上补充生成好了。
Seed Dance 2.0 视频编辑替换能力
Seed Dance 2.0 还有一定的视频编辑和替换能力。例如上传一段李连杰打斗的参考视频,主角依然是小胖,要求把视频中右边的黑衣男人替换成图片中的胖子。前半段替换效果非常不错;但由于参考视频本身有多个分镜,在后面的视频中胖子就不能替换了。up主建议,更好的做法是对原视频进行对应的拆分,然后分段来替换。
另外,在视频替换方面,Seed Dance 2.0 很多时候会加入一些自己的想法,不会原封不动地还原原视频。例如让他把视频中左边的白衣男人(星爷)替换成图片中的小胖,虽然星爷被替换过来了,但画面中的动作和背景也有一定程度的改变。所以对于视频编辑替换方面,Seed Dance 2.0 还有进步和改进的空间。
Seed Dance 2.0 综合评价:AI 视频新王登基?
Seed Dance 2.0 可以实现的创意玩法非常多。up主表示这几天跑光了两个即梦会员的所有积分,进行了各种效果测试,才带来了这个真实的使用评测视频。
毫无疑问,在春节到来之前,即梦提前准备了一个大大的新年礼物。它在很多方面都已经超越了 Sora 2 和 Veo 3.1,因此 Seed Dance 2.0 也快速出圈,已经火爆外网。up主总结道,Seed Dance 2.0 确实把视频创作推向了一个全新的高度。