只需四步，手把手教你打造专属数字人

伴随ChatGPT的问世，在技术与商业运作上都日渐发展成熟的数字人产业正持续升温。去年9月，北京市发布了国内首个数字人产业专项支持政策，提出将依托国家文化专网将数字人纳入文化数据服务平台。以数字人、ChatGPT为代表的互联网3.0创新应用产业机遇正迎面而来，美摄数字人系列产品助力企业打造专属虚拟形象，快速接轨新赛道。

第一步，模型设计

美摄提供功能强大的数字人设计制造工具，设计师可以使用美摄的设计工具与C4D、Maya等工具配合进行数字人的形象设计，快速进行贴图更换、效果调节，实现高效设计。其中，美摄自研数字人设计工具与渲染器内部使用同一套引擎，设计效果所见即所得，与最终渲染效果完全一致。设计制作出的模型效果可快速部署发布。

在自主设计之外，美摄还开发了“照片转数字人”的快速形象生成方式。依靠人脸属性分析和形象自动生成算法，对照片中的人物形象属性如性别、年龄、脸型、五官特征、配饰等进行分析，并根据分析结果自动形成用户专属虚拟形象。在生成形象的基础上，美摄提供多套男女发型、五官形状效果方案，用户可以在美摄数字人捏脸系统中进行精细调整。

第二步，形象渲染

美摄数字人设计使用自研三维图形渲染引擎，具备强大的渲染能力，效果精细逼真，能够真实再现人物皮肤、毛发、衣物的细节，以及金属、玻璃等材质的质感。

基于物理的材质渲染（Physical-Based Rendering）：效果更加逼真，材质更加自然实时阴影处理：让数字人形象更加立体逼真法向量贴图：让整体渲染效果更加清透，光感更好支持全局环境光（Environment Lighting）：三维渲染的光影效果可以根据实际场景随时变化屏幕空间环境光遮蔽（SSAO）：真实渲染各凹凸细节处的明暗关系仿真物理系统：让数字人的运动带动佩饰、头发等部分进行拟真晃动、弹跳、垂感等效果

第三步，唇音同步

美摄基于AI训练建立了一套独特的唇音分析算法，可以实现自然生动的形象展现。通过对输入的语音进行轻量化AI分析，获取实际人物的面部表情，再将AI算法输出的结果与语音内容结合，驱动数字人模型，实现实时的三维唇音同步效果。

第四步，表情动作设定

基于自研的Morphing技术，美摄渲染引擎支持多达54种人脸基础表情。这些基础表情相互组合，构成了拟真的数字人面部系统，几乎可以囊括所有的人脸表情，为数字人模型生动的表情展现奠定基础。

而在动作方面，大致可以分成默认动作、问答类动作和提醒动作三类。默认动作是在无需任何应答时在屏幕上展现悬浮、旋转、休息等预设动作，使数字人避免长期处于呆板的站立形态，更加生动灵活。而问答类动作主要针对交互问答场景设置，当输入特定文字语音时，数字人会在播报的同时进行相应的动作表达。

此外，结合具体的硬件特性，还可以设定特殊的提醒类动作。如应用在汽车、医疗硬件等设施中时，可以与硬件传感器相结合，在接收到譬如上下车、设备故障、用户疲劳等信号时，触发数字人进行动作和语音提示，带来更智能的交互体验。至此，一个专属数字人就制作完成了。