Cohere开源20亿参数语音模型：手机就能跑的AI转录工具来了

语音识别终于不用再依赖云端了。

3月26日，企业级AI公司Cohere发布首个开源语音识别模型Cohere Transcribe，仅20亿参数却能在消费级GPU上流畅运行。该模型采用Apache 2.0协议完全开源，支持包括中文在内的14种语言，在Hugging Face开放ASR排行榜上以5.42%的词错误率超越Zoom Scribe v1、IBM Granite 4.0等竞品，1分钟可处理525分钟音频。

这款模型的杀手锏是边缘部署能力——识别延迟控制在300毫秒以内，全部运算在本地完成，无需上传云端。对于医疗、金融、会议等隐私敏感场景，这意味着数据不再出设备就能完成高质量转录。Cohere还将其集成到企业智能体编排平台North中，方便企业快速接入。

当语音识别从”云端大餐”变成”本地小吃”，你觉得哪些应用场景会被彻底改写？