Stable Diffusion
-
LoRA模型训练器:可以在一个web界面中完成从打tag到训练到数据分析的一系列操作
作者:秋葉aaaki 视频教程: https://www.bilibili.com/video/BV1AL411q7Ub/ 再也不用对着原来的脚本改参数了. 可以在一个web界面中完成从打tag到训练到数据分析的一系列操作。 同时还区分了新手和专家模式,增加了保存预设参数的功能,内置了Tagger 和对应的参数设置教程。 该项目是一个LoRA训练脚本,使用kohya-ss的tr…
-
Stable Diffusion一个非常酷的 WebUI 主题kitchen-theme
Kitchen Theme https://github.com/canisminor1990/sd-webui-kitchen-theme 🌈 支持亮暗色主题,并一键切换。 🪄 支持 Prompt 格式化。 🎛️ 快捷设置伸缩侧边栏. 🎨 基于 Antd CSS Token。 安装: 作为扩展(推荐) 将存储库克隆到您的扩展文件夹中: git clone “https://g…
-
C站大神Mazz_W告诉你如何Stable Diffusion + Matte Painting 全流程掌控
C站大神Mazz系列作品极其华丽,细节到位,实在惊艳,如上图那个天狗作品,超震撼的画作。细节、清晰度和透视关系都无可挑剔,特别是那个天狗面具——面部细节更是惊人。 作者还分享了这幅作品的8K版本和创作过程,原文: https://aigarlic.fanbox.cc/posts/5928584 总结如下(来自AI): 本教程中讲述了如何利用Stable Diffusion工具进…
-
Stability AI 发布了 DreamStudio 的开源版本 StableStudio
Stability AI最近发布了开源的StableStudio应用程序,这是该公司首个涉及文本到图像的消费类应用程序DreamStudio的开源版本。该公司表示,他们的目标是推动AI生态系统内的开源发展。此外,他们也希望与社区合作,共同打造全球领先的用于控制生成AI的用户界面。 项目地址: https://github.com/Stability-AI/StableStudi…
-
AIGC教程:Stable Diffusion精进,如何训练特定画风LoRA模型?
这篇文章从多个方面介绍了训练风格化LoRA模型的经验和技巧,通过本地训练和Google Colab Notebook两种方式展示了方法与结果。对于想要学习LoRA模型的人来说,这是一篇很值得阅读的文章。无论你是否拥有GPU,都可以轻松地跟着文章实践,并且得到一定的收获。 原文: https://mp.weixin.qq.com/s/lahF5TJ94zPKY-Frjez-wg
-
Stable Diffusion模型推荐:BreakDomain 一个淡雅的动漫模型,非常喜欢这种美学风格
该模型融合了背景和细节,输出类似于插画或日本动画风格 模型大小5.2G 模型地址: https://civitai.com/models/50520/breakdomain
-
Stable Diffusion 几个最常用和实用的模型推荐:二次元,真实系,2.5D模型等
• AI绘图需要选取适合的模型,但是网络下载速度慢,选择不符需求还需要重新下载。• 文章作者通过经验和网络评价推荐了几个常用实用的模型,并将其分为五种类型。• 官方模型是由Stable Diffusion团队提供的大模型,也叫底模。• 二次元模型训练数据以二次元素材为主,针对二次元场景效果好。• 真实系模型训练数据以实际照片素材为主,还原能力高。• 2.5D模型是混合模型,基于…
-
Stability AI正式发布了DeepFloyd IF图像生成模型 这个模型可以准确绘制文字
Stability AI与其多模态AI研究实验室DeepFloyd联合发布了DeepFloyd IF,这是一种强大的文本到图像级联像素扩散模型。它采用T5-XXL-1.1等大型语言模型作为文本编码器,可将文本描述转换为图像。除了基本的生成图像文本之外,DeepFloyd IF还可以生成非标准宽高比的图像,并可以实现零恢复图像修改,细节和样式重新生成等功能。该模型可以为多个领域如…
-
Stability AI 发布其 Image Upscaling API 可以用于放大任何图片
Stability AI推出了Image Upscaling API,该API可以将小图片放大到更大的尺寸而不影响其清晰度。它包括两个开源模型,Real-ESRGAN和‘latent’ Stable Diffusion 4x Upscaler。这些模型可以用于放大任何图片。Stability AI的目标是不断提高Image Upscaling API的水平,并随着可用的最新模型…
-
让Stable Diffusion美女开口说话的插件SadTalker
SadTalker是一种基于音频和3D信息的单图像说话脸生成方法,能够生成视觉逼真的说话演示效果。该方法利用音频信息学习生成3D运动系数,实现对头部姿态和面部表情的模拟,将学习到的3D信息转换到无监督3D关键点的空间中进行合成,最终生成自然流畅的视频。多项实验表明,SadTalker相较传统方法在生成视频质量和运动效果上均更好。 项目地址: https://github.com…