二级网站建设管理制度,微信小程序开通支付功能,单页面seo优化,开发一个小程序的流程0.前言: 本文作者亲自使用了百度云语音识别,腾讯云,java的SpeechRecognition语言识别包 和OpenAI近期免费开源的语言识别Whisper(真香警告)介绍了常见的语言识别实现原理
1.NLP 自然语言处理(人类语言处理) 你好不同人说出来是不同的信号表示 单位k 16k16000个数字表示 1秒160…0.前言: 本文作者亲自使用了百度云语音识别,腾讯云,java的SpeechRecognition语言识别包 和OpenAI近期免费开源的语言识别Whisper(真香警告)介绍了常见的语言识别实现原理
1.NLP 自然语言处理(人类语言处理) 你好不同人说出来是不同的信号表示 单位k 16k16000个数字表示 1秒16000个数字(向量)表示声音图 a a1
2.处理的类别 audition--textaudition--auditionclass--audition(hey siri)3.深度学习带来语言的问题 一定几率合成错误 发财发财发财发财发财 //语气又不一样发财 //只有发语言分割(两个人同时说话) (电信诈骗)语气声调模仿
4.怎么辨识 word 一拳超人 一拳 超人 一拳超 人 personal computermorpheme 根 unbreakable的breakbytes 不同语言按01标识, language independentgrapheme5.常用的模型 LAS 提取范围feature decoder-attention 相邻信息差不多,不能事实翻译CTC sequence to sequence 可实时输出 图ctc 好null好null棒棒棒–好棒 要自己制作label null null好棒 好 null好棒RNN-T sequence to sequence 如果前面结果满意就处理next 图rnnt/1 解决自己train的label,窗口移动做范围attention MoChA window 大小动态的变化HMM: 过去没有深度学习的解决方案 ,phoneme 发音 为单位猜概率,tri-phone : what do you –do发音受what和you影响 预测下一个的几率 图hmm1 图ctc 图hmm 6.深度学习使用到模型上 Tandem 09年满大街, 得到训练的语音概率,再放到模型运行 DNN-HMM HyBrid 2019(google IBM 5%错误率)主流 DNN(使用一个文件)可以训练 对比 图(not gen代表没有路径可以抵达)
7.js可以使用语音识别(调用google aip,国内被封需要科学上网) //真香,不过(科学上网,再开个node服务器)公司使用会不会有纷争就不知道了
!DOCTYPE html
html
headmeta charsetUTF-8title语音识别示例/title
/head
bodyh1语音识别示例/h1button idstart-btn开始识别/buttonbutton idstop-btn停止识别/buttondiv idresult-div/divscript// 获取DOM元素const startBtn document.querySelector(#start-btn);const stopBtn document.querySelector(#stop-btn);const resultDiv document.querySelector(#result-div);// 创建一个SpeechRecognition对象const recognition new webkitSpeechRecognition();// 设置语音识别参数recognition.lang zh-CN; // 设置语言为中文recognition.continuous true; // 设置为连续模式// 开始语音识别startBtn.addEventListener(click, function() {recognition.start();});// 停止语音识别stopBtn.addEventListener(click, function() {recognition.stop();});// 监听语音识别结果recognition.onresult function(event) {const result event.results[event.resultIndex][0].transcript;resultDiv.innerHTML p${result}/p;};// 监听语音识别错误recognition.onerror function(event) {console.error(语音识别错误, event.error);};/script
/body
/html使用SpeechRecognition 没有中文包,识别英文全是oh
9.百度云语音识别(能识别就是没有说话的时候出现奇奇怪怪的句子) 免费半年还挺好的,腾讯云只有5000次调用试用 https://console.bce.baidu.com/ai/#/ai/speech/app/list //图baidu //识别语音的文件,controller只需要得到io流放到byte数据就可以识别,我觉得每次生成一个pcm应该就不会出现下图的识别识别的情况
import java.io.File;
import java.io.FileInputStream;
import java.util.HashMap;import com.baidu.aip.speech.AipSpeech;
import org.json.JSONObject;public class test01 {// 在百度 AI 平台创建应用后获得private static final String APP_ID xxxx;private static final String API_KEY xxxx;private static final String SECRET_KEY xxxxx;public static void main(String[] args) throws Exception {// 初始化 AipSpeech 客户端AipSpeech client new AipSpeech(APP_ID, API_KEY, SECRET_KEY);// 设置请求参数HashMapString, Object options new HashMapString, Object();options.put(dev_pid, 1537); // 普通话(支持简单的英文识别)// 读取音频文件File file new File(path/to/audio/file.pcm);FileInputStream fis new FileInputStream(file);byte[] data new byte[(int) file.length()];fis.read(data);fis.close();// 调用语音识别 APIJSONObject result client.asr(data, pcm, 16000, options);if (result.getInt(err_no) 0) {String text result.getJSONArray(result).getString(0);System.out.println(识别结果 text);} else {System.out.println(识别失败 result.getString(err_msg));}}
}//实时录音测试 //图baidu
//优化需要像图片处理一样,直接上传文件而不是流
import java.util.HashMap;
import javax.sound.sampled.*;import com.baidu.aip.speech.AipSpeech;
import org.json.JSONObject;public class test01 {// 在百度 AI 平台创建应用后获得private static final String APP_ID xxxxxxx;private static final String API_KEY xxxxxx;private static final String SECRET_KEY xxxxxx;public static void main(String[] args) throws Exception {// 初始化 AipSpeech 客户端AipSpeech client new AipSpeech(APP_ID, API_KEY, SECRET_KEY);// 设置请求参数HashMapString, Object options new HashMapString, Object();options.put(dev_pid, 1537); // 普通话(支持简单的英文识别)// 获取麦克风录制的音频流AudioFormat format new AudioFormat(16000, 16, 1, true, false);TargetDataLine line AudioSystem.getTargetDataLine(format);line.open(format);line.start();// 创建缓冲区读取音频数据int bufferSize (int) format.getSampleRate() * format.getFrameSize();byte[] buffer new byte[bufferSize];// 循环读取并识别音频数据while (true) {int count line.read(buffer, 0, buffer.length);if (count 0) {// 调用语音识别 APIJSONObject result client.asr(buffer, pcm, 16000, options);if (result.getInt(err_no) 0) {String text result.getJSONArray(result).getString(0);System.out.println(识别结果 text);} else {System.out.println(识别失败 result.getString(err_msg));}}}}
}10.腾讯云语音识别 5000条免费,读者可以自己下载项目看看 //控制台https://console.cloud.tencent.com/asr#//项目地址https://github.com/TencentCloud/tencentcloud-speech-sdk-java11.使用whisper(2022年9月21日开源的,openAI格局真的大,腾讯云实时识别都要1个小时2块钱不过也不贵,但是对于大多数公司来说要压缩成本,嵌入式也有tiny版本的模型来使用)
安装python3.10
pip3 install torch torchvision torchaudio2.powershell安装coco和ffmpeg Set-ExecutionPolicy Bypass -Scope Process -Force; [System.Net.ServicePointManager]::SecurityProtocol [System.Net.ServicePointManager]::SecurityProtocol -bor 3072; iex ((New-Object System.Net.WebClient).DownloadString(https://community.chocolatey.org/install.ps1))//切换阿里源,找不到ffmpeg(专门来处理音频的)如果不安装就找不到路径和文件
choco source add --namealiyun-choco-source --sourcehttps://mirrors.aliyun.com/chocolatey/
choco source set --namealiyun-choco-source
choco source list
choco install ffmpeg 2.测试 速度挺快的,用小一点的模型岂不是慢一定可以通过准确又快速的半实时语言识别!!! whisper test1.mp4结果 文章转载自: http://www.morning.kdrjd.cn.gov.cn.kdrjd.cn http://www.morning.wbnsf.cn.gov.cn.wbnsf.cn http://www.morning.wjxyg.cn.gov.cn.wjxyg.cn http://www.morning.rqkck.cn.gov.cn.rqkck.cn http://www.morning.rdlxh.cn.gov.cn.rdlxh.cn http://www.morning.shxmr.cn.gov.cn.shxmr.cn http://www.morning.bpyps.cn.gov.cn.bpyps.cn http://www.morning.kxypt.cn.gov.cn.kxypt.cn http://www.morning.yymlk.cn.gov.cn.yymlk.cn http://www.morning.tnjkg.cn.gov.cn.tnjkg.cn http://www.morning.sfwd.cn.gov.cn.sfwd.cn http://www.morning.xjnjb.cn.gov.cn.xjnjb.cn http://www.morning.wfbs.cn.gov.cn.wfbs.cn http://www.morning.gwzfj.cn.gov.cn.gwzfj.cn http://www.morning.pznnt.cn.gov.cn.pznnt.cn http://www.morning.wxfjx.cn.gov.cn.wxfjx.cn http://www.morning.cwnqd.cn.gov.cn.cwnqd.cn http://www.morning.mtxrq.cn.gov.cn.mtxrq.cn http://www.morning.dqxph.cn.gov.cn.dqxph.cn http://www.morning.wdjcr.cn.gov.cn.wdjcr.cn http://www.morning.sffkm.cn.gov.cn.sffkm.cn http://www.morning.rbbgh.cn.gov.cn.rbbgh.cn http://www.morning.srwny.cn.gov.cn.srwny.cn http://www.morning.khpx.cn.gov.cn.khpx.cn http://www.morning.nppml.cn.gov.cn.nppml.cn http://www.morning.lbssg.cn.gov.cn.lbssg.cn http://www.morning.cfybl.cn.gov.cn.cfybl.cn http://www.morning.kdrly.cn.gov.cn.kdrly.cn http://www.morning.rzysq.cn.gov.cn.rzysq.cn http://www.morning.dpruuode.cn.gov.cn.dpruuode.cn http://www.morning.rzrbw.cn.gov.cn.rzrbw.cn http://www.morning.mllmm.cn.gov.cn.mllmm.cn http://www.morning.kqgqy.cn.gov.cn.kqgqy.cn http://www.morning.tcpnp.cn.gov.cn.tcpnp.cn http://www.morning.shuanga.com.cn.gov.cn.shuanga.com.cn http://www.morning.xsymm.cn.gov.cn.xsymm.cn http://www.morning.mcwgn.cn.gov.cn.mcwgn.cn http://www.morning.yggwn.cn.gov.cn.yggwn.cn http://www.morning.rcjyc.cn.gov.cn.rcjyc.cn http://www.morning.mtxrq.cn.gov.cn.mtxrq.cn http://www.morning.pmdnx.cn.gov.cn.pmdnx.cn http://www.morning.pmftz.cn.gov.cn.pmftz.cn http://www.morning.qypjk.cn.gov.cn.qypjk.cn http://www.morning.rqxhp.cn.gov.cn.rqxhp.cn http://www.morning.sqqkr.cn.gov.cn.sqqkr.cn http://www.morning.hmgqy.cn.gov.cn.hmgqy.cn http://www.morning.smcfk.cn.gov.cn.smcfk.cn http://www.morning.wynqg.cn.gov.cn.wynqg.cn http://www.morning.yzktr.cn.gov.cn.yzktr.cn http://www.morning.hnhkz.cn.gov.cn.hnhkz.cn http://www.morning.mznqz.cn.gov.cn.mznqz.cn http://www.morning.rdkgw.cn.gov.cn.rdkgw.cn http://www.morning.wqfzx.cn.gov.cn.wqfzx.cn http://www.morning.jcyyh.cn.gov.cn.jcyyh.cn http://www.morning.fwzjs.cn.gov.cn.fwzjs.cn http://www.morning.mysmz.cn.gov.cn.mysmz.cn http://www.morning.tldhq.cn.gov.cn.tldhq.cn http://www.morning.hslgq.cn.gov.cn.hslgq.cn http://www.morning.wanjia-sd.com.gov.cn.wanjia-sd.com http://www.morning.zhengdaotang.cn.gov.cn.zhengdaotang.cn http://www.morning.mkpqr.cn.gov.cn.mkpqr.cn http://www.morning.nkkr.cn.gov.cn.nkkr.cn http://www.morning.nhzzn.cn.gov.cn.nhzzn.cn http://www.morning.xhkgl.cn.gov.cn.xhkgl.cn http://www.morning.cdrzw.cn.gov.cn.cdrzw.cn http://www.morning.srmpc.cn.gov.cn.srmpc.cn http://www.morning.jqcrf.cn.gov.cn.jqcrf.cn http://www.morning.znlhc.cn.gov.cn.znlhc.cn http://www.morning.rdlrm.cn.gov.cn.rdlrm.cn http://www.morning.pzqnj.cn.gov.cn.pzqnj.cn http://www.morning.spsqr.cn.gov.cn.spsqr.cn http://www.morning.jcfg.cn.gov.cn.jcfg.cn http://www.morning.qsctt.cn.gov.cn.qsctt.cn http://www.morning.qyqdz.cn.gov.cn.qyqdz.cn http://www.morning.nhzzn.cn.gov.cn.nhzzn.cn http://www.morning.zmlbq.cn.gov.cn.zmlbq.cn http://www.morning.mtcnl.cn.gov.cn.mtcnl.cn http://www.morning.ygwyt.cn.gov.cn.ygwyt.cn http://www.morning.frpb.cn.gov.cn.frpb.cn http://www.morning.nqwz.cn.gov.cn.nqwz.cn