2018年12月4日到7日,第11届SIGGRAPH Asia在日本东京举行。作为国际顶级专业学术会议,SIGGRAPH Asia从2008年起每年召开,这也是有计算机图形图像研究领域“奥斯卡”之称的SIGGRAPH唯一的分会。SIGGRAPH Asia 2018汇聚了全球从事科研(硬件、软件)、电影、游戏、艺术、动画、人机交互、教育和新兴技术等方向的最前沿的专家、创意人员以及爱好者,大家齐聚一堂,展示世界顶尖的科学、技术、创新与思想。
以这一世界级舞台为窗口,“清华大学-腾讯联合实验室”联合腾讯AI Lab、互娱NEXT技术中心、优图实验室、音视频实验室、腾讯视频、自动驾驶中心等多个腾讯顶尖AI团队,参与SIGGRAPH Asia 2018的展厅展示及Exhibitor Talk环节,为近万名来自60多个国家的参会者,带来了高保真可交互的虚拟人Siren、自动生成日系二次元头像的AI画师YUI、基于人眼视觉的腾讯丽影、基于人脸人体识别技术的智慧商超、防遮挡的视频智能弹幕、基于智能物联的微派机器人、自然场景汉字的自动识别等多项行业顶尖AI体验。
一、高保真可交互虚拟人Siren – 腾讯互娱NEXT技术中心 & AI Lab
近年来,AI技术的日渐成熟促进了IoT设备的爆发式增长,语音助手、聊天机器人逐渐走进我们的生活。为了给用户创造出更生动的交互体验,腾讯互娱NEXT技术中心与AI Lab联合研发的Siren AI,赋予虚拟人AI的大脑和具体的形象,让虚拟人能听会道。
基于虚拟人的语音交互是一个复杂的过程,涉及多个AI研究和工程领域:语音激活检测(VAD),语音识别(ASR),自然语言处理(NLP),语音合成(TTS),语音驱动面部动画(ADFA)。在虚拟人Siren的研究中,基于腾讯已有的AI解决方案,主要攻坚的是语音驱动面部动画(ADFA)相关技术。在解决实时驱动虚拟人的技术难点时,团队注意到Siren具有精巧的Rig Logic,能将80维左右的Rig Controls参数映射到数千维的脸部Rig Elements参数(Blend Shapes, Joints, Wrinkle Maps, etc. )。基于规则的映射,研发团队将语音驱动模型输出并抽象到80维左右,大大缩减了模型规模,同时降低了训练难度。在训练中,团队在面部动捕的同时采集音视频数据和Rig Controls序列数据,然后离线处%
特别声明:
转载上述内容请注明出处并加链接。上述内容仅代表作者或发布者的观点,与中国电子商会官网的立场无关。如有任何疑问或了解更多,请与我们联系。电话:4008 900 668 邮箱:service@cecc.org.cn