重磅升级|臻灵数字人V2.0全新上线!全能AI数字人能力一站式解锁

发布时间:2026/6/30 4:09:00

重磅升级|臻灵数字人V2.0全新上线!全能AI数字人能力一站式解锁 核心速览本文档为数字人系统V2.0版本操作手册详尽阐述AI能力中心、知识库系统、卡通数字人、写实数字人、实时通话数字人、核销码管理及聊天消息等核心模块的功能架构与操作流程。AI能力中心快速能力对接与支撑高效整合数字人所需的基础推理能力包括语音识别、语音合成、语音唤醒及视频合成等支持对接自建AI算力或字节跳动、阿里云等云端服务。系统具备卓越的AI生态集成与融合能力通过模块化设计无缝接入各类AI能力助力快速构建功能完备的数字人应用体系显著降低开发复杂度与门槛。Agent智能体兼容上百款主流大语言模型例如DeepSeek、Qwen、Doubao、ChatGLM、ChatGPT等同时支持Coze、Dify、FastGPT、RAGflow等主流智能体平台。遵循OpenAI、Anthropic等行业标准接口规范满足规范的大模型与智能体均可灵活接入并能迅速与用户既有的本地大模型及智能体方案融合。KWS语音唤醒集成多家闭源与开源语音唤醒引擎如科大讯飞、百度、字节跳动、阿里云、华为云等提供端到端的语音唤醒解决方案。例如用户可通过唤醒词“小昱小昱”直接激活数字人。ASR语音识别支持FunASR、SenseVoiceSmall、Whisper、AliyunASR、火山云ASR等多种引擎具备中英双语识别能力可将语音准确转换为文本文字。TTS语音合成支持CosyVoice、GPT-SOVITS、火山语音、百炼语音等合成引擎实现中英双语文语转换将文字信息流畅合成为自然语音。Human数字人推理兼容LiveTalking、OpenAvatarChat、魔法星云等多种数字人推理引擎支持对接自建或云端数字人推理服务实现异构数字人推理系统引擎的快速集成与应用。知识库系统功能概述系统提供语音唤醒、动作触发、外部设备联动及知识库管理等核心能力。关键词管理可自定义设置语音唤醒与动作触发的关键词及对应事件信息并支持接入麦克风、摄像头等外部感知设备。知识库管理赋能数字人朗读并智能回复基于自建知识库的内容提升交互的专业性与准确性。卡通数字人交互数字人配置支持添加并发布2D与3D数字人形象配置。Live2D数字人体验在此模块可亲身体验2D数字人交互效果并集成使用对应的2D数字人SDK。MMD数字人体验在此模块可亲身体验3D数字人交互效果并集成使用对应的3D数字人SDK。写实数字人真人交互数字人配置完成高拟真度写实数字人的全功能配置。真人交互数字人体验在此模块可亲身体验收实数字人交互效果并集成使用对应的写实数字人SDK。实时通话数字人实时通话数字人配置完成适用于实时音视频通话场景的数字人配置。实时通话数字人体验在此模块可亲身体验实时通话数字人交互效果并集成使用对应的实时通话数字人SDK。核销码管理用量管理与密钥解锁对每个数字人实例的使用量进行精细化管理。通过分配具有用量限制的密钥来授权解锁数字人功能实现资源可控的访问控制。聊天消息对话记录保存所有2D、3D及写实数字人产生的对话历史记录均统一存储于此模块便于追溯与管理。AI能力中心Agent智能体支持上百款主流大语言模型包括DeepSeek、Qwen、Doubao、ChatGLM、ChatGPT等。兼容主流智能体平台包括Coze、Dify、FastGPT、RAGflow等。遵循主流AI接口标准规范如OpenAI、Anthropic等。符合接口规范的大模型与智能体均可自由接入。可快速与用户现有的本地化大模型及智能体解决方案进行融合。KWS语音唤醒集成多家闭源与开源语音唤醒引擎如科大讯飞、百度、字节跳动、阿里云、华为云等。提供端到端的语音唤醒解决方案例如说出“小昱小昱”即可唤醒数字人。ASR语音识别支持FunASR、SenseVoiceSmall、Whisper、AliyunASR、火山云ASR等多种引擎。具备中英双语识别能力能够将语音准确转换为汉字或英文文本。TTS语音合成支持CosyVoice、GPT-SOVITS、火山语音、百炼语音等合成引擎。实现中英双语文语转换将文字信息流畅合成为自然语音。Human数字人推理支持LiveTalking、OpenAvatarChat、魔法星云等引擎可对接自建或云端数字人推理服务。实现不同数字人推理系统引擎的快速集成。知识库系统提供语音唤醒、动作触发、外部设备对接、知识库管理等核心能力。关键词管理自定义设置语音唤醒与动作触发的事件信息及具体关键词并可接入麦克风、摄像头等外部设备。知识库管理赋能数字人朗读并智能回复自建知识库中的内容。卡通数字人通过交互数字人配置模块完成2D与3D数字人的全面配置。交互数字人配置可添加2D、3D数字人配置并对2D、3D数字人形象进行发布管理。Live2D数字人体验在此模块可亲身体验2D数字人并集成使用2D数字人SDK。MMD数字人体验在此模块可亲身体验3D数字人并集成使用3D数字人SDK。写实数字人完成写实数字人的配置、体验等一系列操作。真人交互数字人配置完成高拟真度写实数字人的配置。真人交互数字人体验在此模块可亲身体验收实数字人并集成使用写实数字人SDK。实时通话数字人完成实时通话数字人的配置、体验等一系列操作。实时通话数字人配置完成适用于实时音视频通话场景的实时通话数字人配置。实时通话数字人体验在此模块可亲身体验实时通话数字人并集成使用实时通话数字人SDK。核销码管理对每个数字人实例的使用量进行精细化管理通过密钥授权解锁数字人功能每个密钥均设有用量上限。聊天消息所有2D、3D及写实数字人产生的对话记录均集中存储于此位置。

相关新闻