Cohere开源20亿参数语音模型:手机就能跑的AI转录工具来了

科技1个月前发布 leso
27 0 0

语音识别终于不用再依赖云端了。

3月26日,企业级AI公司Cohere发布首个开源语音识别模型Cohere Transcribe,仅20亿参数却能在消费级GPU上流畅运行。该模型采用Apache 2.0协议完全开源,支持包括中文在内的14种语言,在Hugging Face开放ASR排行榜上以5.42%的词错误率超越Zoom Scribe v1、IBM Granite 4.0等竞品,1分钟可处理525分钟音频。

这款模型的杀手锏是边缘部署能力——识别延迟控制在300毫秒以内,全部运算在本地完成,无需上传云端。对于医疗、金融、会议等隐私敏感场景,这意味着数据不再出设备就能完成高质量转录。Cohere还将其集成到企业智能体编排平台North中,方便企业快速接入。

当语音识别从”云端大餐”变成”本地小吃”,你觉得哪些应用场景会被彻底改写?

© 版权声明

相关文章

暂无评论

none
暂无评论...