伴随ChatGPT的问世,在技术与商业运作上都日渐发展成熟的数字人产业正持续升温。去年9月,北京市发布了国内首个数字人产业专项支持政策,提出将依托国家文化专网将数字人纳入文化数据服务平台。以数字人、ChatGPT为代表的互联网3.0创新应用产业机遇正迎面而来,美摄数字人系列产品助力企业打造专属虚拟形象,快速接轨新赛道。
第一步,模型设计
美摄提供功能强大的数字人设计制造工具,设计师可以使用美摄的设计工具与C4D、Maya等工具配合进行数字人的形象设计,快速进行贴图更换、效果调节,实现高效设计。其中,美摄自研数字人设计工具与渲染器内部使用同一套引擎,设计效果所见即所得,与最终渲染效果完全一致。设计制作出的模型效果可快速部署发布。
在自主设计之外,美摄还开发了“照片转数字人”的快速形象生成方式。依靠人脸属性分析和形象自动生成算法,对照片中的人物形象属性如性别、年龄、脸型、五官特征、配饰等进行分析,并根据分析结果自动形成用户专属虚拟形象。在生成形象的基础上,美摄提供多套男女发型、五官形状效果方案,用户可以在美摄数字人捏脸系统中进行精细调整。
第二步,形象渲染
美摄数字人设计使用自研三维图形渲染引擎,具备强大的渲染能力,效果精细逼真,能够真实再现人物皮肤、毛发、衣物的细节,以及金属、玻璃等材质的质感。
基于物理的材质渲染(Physical-Based Rendering):效果更加逼真,材质更加自然 实时阴影处理:让数字人形象更加立体逼真 法向量贴图:让整体渲染效果更加清透,光感更好 支持全局环境光(Environment Lighting):三维渲染的光影效果可以根据实际场景随时变化 屏幕空间环境光遮蔽(SSAO):真实渲染各凹凸细节处的明暗关系 仿真物理系统:让数字人的运动带动佩饰、头发等部分进行拟真晃动、弹跳、垂感等效果第三步,唇音同步
美摄基于AI训练建立了一套独特的唇音分析算法,可以实现自然生动的形象展现。通过对输入的语音进行轻量化AI分析,获取实际人物的面部表情,再将AI算法输出的结果与语音内容结合,驱动数字人模型,实现实时的三维唇音同步效果。
第四步,表情动作设定
基于自研的Morphing技术,美摄渲染引擎支持多达54种人脸基础表情。这些基础表情相互组合,构成了拟真的数字人面部系统,几乎可以囊括所有的人脸表情,为数字人模型生动的表情展现奠定基础。
而在动作方面,大致可以分成默认动作、问答类动作和提醒动作三类。默认动作是在无需任何应答时在屏幕上展现悬浮、旋转、休息等预设动作,使数字人避免长期处于呆板的站立形态,更加生动灵活。而问答类动作主要针对交互问答场景设置,当输入特定文字语音时,数字人会在播报的同时进行相应的动作表达。
此外,结合具体的硬件特性,还可以设定特殊的提醒类动作。如应用在汽车、医疗硬件等设施中时,可以与硬件传感器相结合,在接收到譬如上下车、设备故障、用户疲劳等信号时,触发数字人进行动作和语音提示,带来更智能的交互体验。至此,一个专属数字人就制作完成了。