Last Updated on 2024年9月4日 by go123
我最近尝试了使用 RTX 4060Ti 16G 显卡,训练一个 Stable Diffusion 的 LoRA 来生成动漫人物 Rouge 的模型。实际效果还不错。
Table of Contents
动画片中的样子

训练出来的样子



生成的图像和训练素材的风格非常接近,人物的五官、发型、服装等细节都把握得能可以忽略差异。即使是在不同的场景和姿势下,模型也能够生成一致的高质量结果。
可以把提示词对应到画面中的元素,很有意思。
意外的发现
在准备训练素材的过程中,意外发现,在动画片里,只有特写镜头时人物才会被画得比较精细,而当人物作为背景时,有时候连脸都不会被仔细刻画。
不过有趣的是,在实际观看动画时,这样的画面质量并不会让人觉得难以接受。只有单独截取画面观看,才会发现这些细节上偷懒对观看体验影响很小。


发表回复