AI 实时同声传译 · 豆包 2.0 驱动
专业级同传体验,戴上耳机即刻开启。建议佩戴耳机使用,获得最佳同传效果。
核心功能特性
实时零样本音色克隆,完美复刻说话人声音特征。
优化的音频处理管线,实现毫秒级响应速度。
支持语速、音量、音调、情绪等多维度参数精细调节。
自动优化译文长度与节奏,保持听觉舒适度。
外放场景下避免音频反馈,建议佩戴耳机获得最佳体验。
豆包 2.0 负责声音克隆,MiniMax 提供丰富音色库。
声音克隆技术
实时零样本音色克隆,无需预先训练,自动捕捉并复刻说话人的独特音色特征。
此模式下不支持参数调节,完全匹配原声表现。
上传音频文件或在线录制语音,系统将学习并生成专属音色模型。
支持 MP3、WAV、M4A 格式,时长 10 秒至 5 分钟。
音色参数调节
合成音频的语速,取值越大,语速越快。
合成音频的音量,取值越大,音量越高。
合成音频的语调,0 为原音色输出。
仅在使用 MiniMax 平台音色时支持参数调节。
回声消除
外放情况下需打开回声消除功能,避免输出音频再次被录入造成反馈。 但回声消除会引起一定的音质损失,强烈建议佩戴耳机使用并关闭回声消除。
戴上耳机,开启实时中英同传,让语言不再成为沟通的障碍。