网站logo的颜色与网页的颜色,如何做网站推广广告,网络培训思想汇报,苏州网页服务开发与网站建设市场有很多语音库#xff0c;这里介绍Vosk SDK
除了支持untiy外还有原生开发服务器等
目录
安装unity示例demo下载语音训练文件运行demo结尾一键三联 注意事项
有可能debug出来的文本是空的#xff0c;#xff08;确保麦克风正常#xff0c;且索引正确#xff09;分大…市场有很多语音库这里介绍Vosk SDK
除了支持untiy外还有原生开发服务器等
目录
安装unity示例demo下载语音训练文件运行demo结尾一键三联 注意事项
有可能debug出来的文本是空的确保麦克风正常且索引正确分大模型和小模型小模型给移动端用大模型给pc端用小模型识别速度快但大模型准 安装unity示例demo
自己clone库unity版本我选的2022.3.42f1c1
https://github.com/alphacep/vosk-unity-asr 下载语音训练文件
小模型42M
https://alphacephei.com/vosk/models/vosk-model-small-cn-0.22.zip
大模型1.3G
https://alphacephei.com/vosk/models/vosk-model-cn-0.22.zip
注意要是下载网速慢可使用梯子 下载完毕后将文件copy到工程的StreamingAssets 运行Demo
设置麦克风索引
这里我打印了麦克风信息列表
识别结果已经在Log上了 结尾
有一定的错误率但只要你说普通话吐字清晰基本上很准 这里是根据麦克风实时输入并转成文本。
理论上也可以把MP3 wav等转成文本
或者根据自己的业务需求做出点击麦克风开始录制点击结束再进行识别 一键三联
点赞·留言·收藏
如果可以帮到你好用的话记得一键三连。
毕竟博主写文章是靠爱发电所以爱会消失对不对。