AI数字人,即具有数字化外形的AI数字人物。AI数字人宜具备以下三方面特征:一是拥有人的外观,具有特定的相貌、性别和性格等人物特征;二是拥有人的行为,具有用语言、面部表情和肢体动作表达的能力;三是拥有人的思想,具有识别外界环境、并能与人交流互动的能力。当前,AI数字人仍处于快速发展时期,尚未形成统一的系统框架。我们引用了人工智能产业发展联盟的框架,将AI数字人的通用系统分为五个部分:人物形象,语音生成,动画制作,音视频,合成显示器和交互。交互模块是扩展项目,可以智能识别用户意图,决定其后续语音和动作并驱动数字人的下一轮互动。根据是否有交互模块分为非互动AI数字人和交互式AI数字人,后者将基于驱动方式的不同分为真人驱动和计算驱动。非交互AI数字人相对简单,运行过程较早。目前有更多的制造商部署它们。但是,未来的发展趋势总体上仍将着重于交互式AI数字人。3D高质量AI数字人能够呈现出逼真的外观和动作,为用户带来沉浸式的交互体验。南宁AI数字人

数字人的具体特征:(1)虚拟:指的是在非物理世界中,数字人在不同场景实现难度不同。数字人的存在方式主要以图片、视频、实时直播、实时动画等存在于APP、小程序、软硬一体显示设备等电子屏。未来VR设备与全息投影也将成为其重要存在方式。(2)数字:数字人的产生源于多技术综合。CG建模+真人驱动、多模态技术与深度学习都是数字人产生的关键技术。不少人认为数字人近年的发展来源于CG(ComputerGraphics,利用计算机进行视觉设计和生产)、语音识别、图像识别、动捕等相关技术的共同成熟。杭州AI数字人技术AI数字人系统开展亲子教育直播,促进亲子互动。

AI数字人的存在方式:虚拟—存在于非物理世界中,不同场景实现难度不同,目前,AI数字人主要以图片、视频、实时直播、实时动画等方式存在于电子屏中,如APP、小程序、软硬一体显示设备。在未来,VR设备与全息投影也将成为其重要存在方式。需注意的是,尽管其存在方式均在非物理世界中,由于各场景所需的时延(如直播等实时场景要求低时延,但内容生成场景无该要求)、驱动方式(计算驱动对模型的深度学习能力有极高要求)等不同,对技术、运营等要求差异较大。
当前,AI数字人正在以更具体的职业身份进入各行各业,并配备越来越清晰的工作职责和工作计划。将来,在产品供应商和开发人员共同构建产业生态系统的过程中,AI数字人技术将更好地融入其他语音交互技术和软件功能,为消费者提供更好的体验。作为多模态人机交互领域的重要成果之一,"AI数字人"依靠前端语音处理,语音唤醒,语音识别,对话理解和管理,语音合成,计算机视觉和图形学等技术支持。在对话理解的基础上,语音交互通过对话管理生成对应的答复话语和内容服务,并结合语音合成技术"TTS"来产生广播音频;AI数字人多模式互动需要在此基础上进一步了解播放文本中包含的信息。AI数字人系统的可扩展性是大型企业特别关注的一点。

在全球化商业浪潮下,AI 数字人直播的多语言能力成为跨境电商、国际品牌传播的得力工具。一个数字人主播能够轻松掌握多种语言,在面对不同地区的直播场次或多语言观众同屏观看时,流畅切换语言进行产品介绍与交流互动。例如,一家中国的智能家居企业,计划拓展欧美市场,其数字人主播在面向美国观众直播时,能用美式英语详细讲解智能灯具的安装步骤、智能控制 APP 的使用方法,结合美国用户家庭常见的室内场景进行演示;切换到面向法国观众时,又瞬间转换成优雅的法语,提及法国消费者注重的设计美学元素在产品中的体现,解答观众关于产品兼容性的疑问。这种无缝对接的多语言服务打破了语言壁垒,让全球各地消费者都能无障碍地接收产品信息,极大拓宽了品牌的国际市场覆盖范围,助力企业实现全球营销战略布局,提升品牌国际影响力。AI数字人定制服务让品牌形象更具个性,提升用户粘性。南宁AI数字人
AI技术使得这些数字人具备智能响应能力,可以根据用户的输入做出自然、流畅的反应,极大地增强了互动性。南宁AI数字人
数字人的作用及价值:(1)数字人关键功能:服务型数字人主要是功能性的服务,包括替代真人服务,完成内容生产、简单功能;多模态AI助手,提供日常陪伴、关怀等服务;身份型数字人的功能是身份性的,用于娱乐/社交;包括虚拟IP/偶像,推动虚拟内容生产。(2数字人)产出定位:服务型数字人的定位有现实世界中主持人、导游、购物主播等服务型角色的虚拟化;具有关怀感和真实感的AI助手;而身份型数字人的定位有虚拟偶像或为真人偶像的辅助分身。南宁AI数字人