系列V2:您的角色现在可以拥有任何世界。还有对话。
 
在系列的第一版中,每个虚拟形象都有一套在固定背景下的稳定动作。理念很简单:"这是一个原型 + 其手势,可以重新配音并适应任务"。每个角色都有自己的手势库,包含10到25种不同的动态。
1. 为熟悉的手势搭配任何背景

事实证明,世界很会给人惊喜。像 Kling O1 这样的工具,突然就学会了很好地处理视频背景替换任务。现在,无需"删除背景"并破坏画面,而是可以将原始视频作为动作来源,并重新构建背景,同时保留手势的质感与神韵

因此,现在可以为我的客户生成虚拟形象视频,在相同的精确手势下,搭配(几乎)任何背景
IRA. Collection V2
Deimos&Khalia. Collection V2
2. 对话:光明与黑暗同台

问题一:这会影响虚拟形象的性格吗?
我认为不会。至少,我非常不希望破坏角色原型(光明、黑暗、王牌)的概念,以便角色选择保持熟悉且易于理解:
  • “我需要让观众充满蔑视——那么我选Archie。”
  • “如果需要礼貌地嘲笑观众——我选Ira…”
  • ……诸如此类。选择的逻辑保持不变,只是他们周围的场景现在可以改变。
实际上,选择原则已在之前的文章中描述过,并且它们没有改变。

问题二:这会影响虚拟形象视频的价格吗?
可能也不会。如果手势库仅仅是一个展示窗口(并且它并非最终版本),而我本来就在为客户设计具体的手势,那么为何不一起设计背景呢?这同样是基于任务的工作。为每位客户——量身定制。
因此,我无法提供一个明确的“我们如何工作”的逐步计划:细节太多了。
当然,对我来说,根据您的描述,“按照我的想法”制作角色视频会更简单。但您是否会满意我的构思——这是个很大的问题。所以我们通常会交谈。深入交谈。因此,网站上的价格并非死板的固定报价(也不应该是!),而是讨论的起点。
3. 同框双人同步

不断发展的AI工具包带来了另一个惊喜:可以在一个镜头中组合两个角色,并对口型让他们进行对话。

这意味着,正如我之前所写,客户现在可以真正地混搭角色,而不仅仅局限于一个选定方案。

例如:一个典型的黑暗与光明虚拟形象在同一背景下相互交谈,而不仅仅是一个接一个地弹出画面。

关于角色性格和成本的问题,我认为在这里是相同的。我无法断言哪种方式投入更多:是选择特定手势的"常规"视频,还是系列第2版——"v2 — 背景与对话"。
Zakhra&Archi. Collection V2
在任何情况下,一切都归结为与客户的沟通和工作量。唉(或者说幸运的是),我并非一家生产100种款式、300种颜色相同靴子的制鞋厂。我只是按需创作美好的作品
4. 现实的期望:魔法需要检验
即使采用新方法,也必须考虑工具的现实情况:

  • 通过不同视频服务进行的背景替换在大多数情况下效果不错,但在复杂光照或剧烈运动时,某些地方必然会出现瑕疵——噪点、"蠕变"边缘、颜色变化。
  • 两个、尤其是三个角色的场景需要测试:并非每个手势都能同样好地融入到多角色构图中。
  • 多人口型同步也不完美:有时嘴唇和声音存在轻微错位,这需要检查并在必要时重新生成。

因此,"虚拟形象系列V2" 并非关于"完美魔法",而是关于诚实地扩展可能性。新模式是存在的,但每个具体的视频片段,都仍然是针对任务精心选择手势、背景和工具,并进行测试的结果。
...我们已经共同走过了一段路,这意味着...
5. 结果:从“视频片段”到场景系统

最终,过去曾是"独立虚拟形象的集合",正逐渐转变为一个场景系统:角色保持不变,但他们周围的世界变得灵动起来。

所以,对于新客户,我也邀请老客户:我们已经共同走过了一段路,这意味着接下来的步骤会更简单、更快速、更清晰,并且……通常更便宜。
Made on
Tilda