FunASR是阿里达摩院开源大型端到端语音识别工具包,顶顶通语音识别工具集成了FunASR,本文档描述顶顶通语音识别怎么配置FunASR的模型。
下载模型
录音文件识别、一句话识别 用离线模型(非实时识别),实时识别用在线模型。mod_vad用的是离线模型(非实时识别),mod_cti对接的是在线模型(实时识别)。
模型选择
- 8K音频建议用8K模型
- 16K音频建议用16K模型
- 模型名字带large就是模型比较大,识别的更准,但是需要更多CPU,简称大模型,不带large的模型比较小,节约CPU,简称小模型。
- 录音文件识别和电话机器人一句话识别建议用带large的大模型
- 实时质检建议用实时小模型,电话机器人实时识别建议用实时大模型。
- 标点模型(punc),用来加标点,也有大小2个模型,如果要求标点更准选择punc大模型,如果对标点没要求,就选择punc小模型
- 下载参数的最后一个参数a|b就是用来选择标点模型。
- a 选择标点大模型
- b 选择标点小模型
8K模型
Paraformer语音识别-中文-通用-8k-离线
curl -s http://129.211.24.206/downloadModel.sh | sh -s 3 b
Paraformer语音识别-中文-金融-8k-离线-large
curl -s http://129.211.24.206/downloadModel.sh | sh -s 6 a
16K模型
非实时识别识别
Paraformer语音识别-中文-通用-16k-离线
curl -s http://129.211.24.206/downloadModel.sh | sh -s 2 b
Paraformer语音识别-中文-通用-16k-离线-large
curl -s http://129.211.24.206/downloadModel.sh | sh -s 5 a
Paraformer语音识别-中文-通用-16k-离线-large-热词版
curl -s http://129.211.24.206/downloadModel.sh | sh -s 8 a
Paraformer语音识别-英文-通用-16k-离线-large
实时识别模型
Paraformer语音识别-中文-通用-16k-实时
curl -s http://129.211.24.206/downloadModel.sh | sh -s 1 a
Paraformer语音识别-中文-通用-16k-实时-large
curl -s http://129.211.24.206/downloadModel.sh | sh -s 4 a
asrproxy配置使用哪个模型
执行完下载脚本会输出asrproxy配置需要修改部分,把asrproxy.json根据输出的配置修改就可以。