千问语音识别模型Qwen3-ASR开源:可识别52个语种与方言

2026年1月30日消息,千问Qwen3-ASR正式开源。

500

据了解,Qwen3-ASR是由Qwen开发的一系列功能强大的语音识别模型,包括两个强大且全面的语音识别模型Qwen3-ASR-1.7B与Qwen3-ASR-0.6B,以及一个创新的语音强制对齐模型Qwen3-ForcedAligner-0.6B。Qwen3-ASR系列的语音识别模型支持52个语种与方言的语种识别与语音识别。同时,依托创新的预训练 AuT 语音编码器与Qwen3-Omni基座模型的强大多模态能力,Qwen3-ASR实现了精准与稳定的语音识别。

500

其1.7B模型在中文、英文、中文口音与歌唱识别等场景下达到SOTA,具有复杂文本识别能力以及强噪声下的稳定性。

站务

全部专栏