网站建设 招标任务书,邓州网络推广有效的方法,找人做网站,电子商务网站建设的核心是什么SadTalker可以根据一张图片、一段音频#xff0c;合成面部说这段语音的视频。图片需要真人或者接近真人。
安装ffmpeg
下载地址#xff1a; https://www.gyan.dev/ffmpeg/builds/ 下载ffmpeg-git-full.7z 后解压#xff0c;将解压后的目录\bin添加到环境变量的Path中。
在…SadTalker可以根据一张图片、一段音频合成面部说这段语音的视频。图片需要真人或者接近真人。
安装ffmpeg
下载地址 https://www.gyan.dev/ffmpeg/builds/ 下载ffmpeg-git-full.7z 后解压将解压后的目录\bin添加到环境变量的Path中。
在终端输入ffmpeg命令查看ffmpeg是否安装成功。 安装SadTalker插件
在WebUI的extensions选项卡下使用“Install from URL”安装SadTalker插件。
插件地址 https://github.com/OpenTalker/SadTalker 下载checkpoint
下载地址 https://github.com/OpenTalker/SadTalker/releases 将下载下来的checkpoint放入stable-diffusion-webui/extensions/SadTalker/checkpoints/目录下。
使用SadTalker
重新启动WebUI可以看到多出来一个SadTalker选项卡。 参数说明
Source image原始图片最好是大头不然会显得不自然Input audio输入音频使用SadTalker示例的音频测试\extensions\SadTalker\examples\driven_audiopreprocess图像预处理方式crop剪裁, resize重置大小, full(原图)其中crop根据面部关键点生成的表情和动画相对逼真前提是不要全图看起来会很怪Still Mode (fewer head motion, works with preprocess full)使用与原始图像相同的姿势减少头部运动。这个选项在full(原图)的时候很有必要优化人物头部运动生成的视频更加自然。GFPGAN as Face enhancer勾选上, 可以获得更好的面部质量