语音识别的”云端依赖症”,正在被一款轻量级开源模型打破。
3月26日,加拿大AI公司Cohere正式发布开源语音识别模型Cohere Transcribe。这款仅20亿参数的轻量级模型专为边缘设备设计,可直接部署在手机、PC、工业网关等终端,无需联网即可完成语音转文字任务。模型支持中文、日语、法语、希伯来语等14种语言,采用Apache 2.0协议完全开源,开发者可自由使用、修改和分发。
Cohere Transcribe的核心优势在于”小而强”——在Hugging Face开放ASR排行榜中,其表现优于ElevenLabs Scribe、阿里Qwen 3等同类模型。对于银行、医疗、销售等对数据隐私敏感的行业,本地部署意味着语音数据无需上传云端,彻底解决了隐私泄露风险。Cohere计划将该模型整合至其AI智能体编排平台”North”,进一步强化语音交互能力,与IBM、Zoom等企业争夺边缘计算及实时语音翻译市场。
当语音识别从”云端大脑”变成”本地小助手”,你觉得隐私保护和便捷性哪个更重要?
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...