通义数字人测试系统

⚠️ 重要:音频要求

  • 时长:10-20 秒(建议不超过60秒)
  • 连续语音:至少包含一段超过 5 秒的连续人声
  • 格式:WAV 或 MP3
  • 环境:安静环境录制,无背景噪音、无音乐
  • 语言:支持中文、英文、日语、韩语等
  • 内容:连贯朗读,避免频繁停顿
  • 质量:清晰的人声,建议使用手机或麦克风近距离录音

提示:如果提示"No valid speech segments found",说明音频质量不符合要求,请重新录制。

正在创建音色...

正在加载...

⚠️ 重要提示:当前限制

qwen3-tts-vc-realtime 是实时模型,仅支持 WebSocket 协议,不支持传统的 HTTP POST 调用。

可选方案:

  • 方案 1(推荐):使用 Python 脚本 + PHP 调用(支持自定义音色)
  • 方案 2:切换到非实时模型(仅支持预设音色)
  • 方案 3:使用 Node.js 中间服务

详细说明请查看:语音合成说明文档

正在合成...