funasr

FunASR是阿里达摩院开源大型端到端语音识别工具包,顶顶通语音识别工具集成了FunASR,本文档描述顶顶通语音识别怎么配置FunASR的模型。

下载模型

录音文件识别、一句话识别 用离线模型(非实时识别),实时识别用在线模型。mod_vad用的是离线模型(非实时识别),mod_cti对接的是在线模型(实时识别)。

模型选择

  1. 8K音频建议用8K模型
  2. 16K音频建议用16K模型
  3. 模型名字带large就是模型比较大,识别的更准,但是需要更多CPU,简称大模型,不带large的模型比较小,节约CPU,简称小模型。
  4. 录音文件识别和电话机器人一句话识别建议用带large的大模型
  5. 实时质检建议用实时小模型,电话机器人实时识别建议用实时大模型。
  6. 标点模型(punc),用来加标点,也有大小2个模型,如果要求标点更准选择punc大模型,如果对标点没要求,就选择punc小模型
    1. 下载参数的最后一个参数a|b就是用来选择标点模型。
    2. a 选择标点大模型
    3. b 选择标点小模型

8K模型

  • Paraformer语音识别-中文-通用-8k-离线

    curl -s http://129.211.24.206/downloadModel.sh | sh -s 3 b
  • Paraformer语音识别-中文-金融-8k-离线-large

    curl -s http://129.211.24.206/downloadModel.sh | sh -s 6 a

16K模型

非实时识别识别

  • Paraformer语音识别-中文-通用-16k-离线

    curl -s http://129.211.24.206/downloadModel.sh | sh -s 2 b
  • Paraformer语音识别-中文-通用-16k-离线-large

    curl -s http://129.211.24.206/downloadModel.sh | sh -s 5 a
  • Paraformer语音识别-中文-通用-16k-离线-large-热词版

    curl -s http://129.211.24.206/downloadModel.sh | sh -s 8 a
  • Paraformer语音识别-英文-通用-16k-离线-large

实时识别模型

  • Paraformer语音识别-中文-通用-16k-实时

    curl -s http://129.211.24.206/downloadModel.sh | sh -s 1 a
  • Paraformer语音识别-中文-通用-16k-实时-large

    curl -s http://129.211.24.206/downloadModel.sh | sh -s 4 a

asrproxy配置使用哪个模型

执行完下载脚本会输出asrproxy配置需要修改部分,把asrproxy.json根据输出的配置修改就可以。