虚拟数字人"看得见"
语音识别,利用语音波形反应出说话人生理和行为特征的声波
频谱生物特性,使数字人能听懂自然语音指令。
人脸识别(Face Recognition)利用人体面部关键点检测等
一系列手段来检测五官等面部特征,依据独一无二的生理特征建
立精确的人脸模型。
语音识别和人脸识别,均可实现快速精准的身份定位和认证。
虚拟数字人"说得清"
以语音合成(TTS)技术为基础,为产品配上“明星的嘴巴”
通过全链路语音技术,将文本转换为流畅、清晰、自然和具有表现力的语音数据,由高质量合成的音频帮助虚拟数字人实现自然对话。
同时,提供中英多语种、男女声多风格、老年与孩童等各种音色的选择。
虚拟数字人"听得懂"
基于语音识别(Automatic Speech Recognition,ASR)、语音合成(Text To Speech,TTS)、自然语言理解(Natural Language Understanding,NLU)等技术让数字人更具情感。
结合企业在多种实际应用场景,赋予产品“能听、会说、懂你”的智能人机交互体验。
企事业多场景终端
应用于品牌宣传、娱乐营销、便民服务等场景,包括但不限于直播、导购、销售、客服等方面。助力企业提升用户服务体验,实现数字化转型。 可灵活应用于大屏、APP、PC、云屏等终端。
车机终端
提供标准化的SDK,开发便捷,可与车机上的软件进行实时交互。适用于目前市场上的大部分车机系统。