Cohere开源20亿参数语音模型Transcribe：手机就能跑，14种语言实时转录

语音识别的”云端依赖症”，正在被一款轻量级开源模型打破。

3月26日，加拿大AI公司Cohere正式发布开源语音识别模型Cohere Transcribe。这款仅20亿参数的轻量级模型专为边缘设备设计，可直接部署在手机、PC、工业网关等终端，无需联网即可完成语音转文字任务。模型支持中文、日语、法语、希伯来语等14种语言，采用Apache 2.0协议完全开源，开发者可自由使用、修改和分发。

Cohere Transcribe的核心优势在于”小而强”——在Hugging Face开放ASR排行榜中，其表现优于ElevenLabs Scribe、阿里Qwen 3等同类模型。对于银行、医疗、销售等对数据隐私敏感的行业，本地部署意味着语音数据无需上传云端，彻底解决了隐私泄露风险。Cohere计划将该模型整合至其AI智能体编排平台”North”，进一步强化语音交互能力，与IBM、Zoom等企业争夺边缘计算及实时语音翻译市场。

当语音识别从”云端大脑”变成”本地小助手”，你觉得隐私保护和便捷性哪个更重要？