AI 이미지/워크플로 따라하기

스테이블 디퓨전 - 꿈과 나비와 소녀

하늘이푸른오늘 2023. 12. 21. 16:08

이 글은 종이접기(origami)로 만들어진 드레스를 입은 꿈결같은 소녀를 생성합니다. 이 글에서 다루는 내용은 다음과 같습니다.

  • 어두운 톤의 이미지 생성
  • 예술적인 디테일 추가하기
  • 자동 얼굴 수정

목차는 아래와 같습니다.

소프트웨어

Stable Diffusion GUI

이 글에서는 AUTOMATIC1111 이라는 Stable Diffusion을 사용하기 위한 대표적인 웹 UI를 사용합니다. 윈도에 설치하는 방법은 여기를 읽어보시면 됩니다.

이 글에서는 다음과 같은 확장(extension)을 사용합니다. 확장을 설치하는 방법은 이 글을 읽어보시기 바랍니다.

체크포인트 모델은 DreamShaper XL 모델을 사용합니다. 다운로드 받아서 stable-defusion-webui\models\Stable-Dffusion 폴더에 넣어주시면 됩니다.

이 글에서는 아래의 LoRA를 사용합니다. 다운로드 받아서 stable-defusion-webui\models\lora 폴더에 넣어주시면 됩니다.

Upscale 모델은 4x-UltraSharp 를 사용합니다. Upscaler 모델 설치 방법은 이 글을 보시면 됩니다.

따라 하기

Stable Diffusion txt2img 페이지에 들어가서 아래와 같이 설정해 줍니다.

모델: dreamshaperXL10_2Xl10
프롬프트: a woman in a colorful dress made of artistic chaotic origami surrounded by butterflies, fractal, dreamlike magic realism, look away, dark studio, dimly lit victorian room <lora:offset_0.2:1> <lora:add-detail-xl:1> <lora:xl_more_art-full_v1:0.5>
부정적 프롬프트: ugly, deformed, disfigured
샘플링 방법: DPM++ 2M Karras
샘플링 단계; 30
Refiner: 사용하지 않음(미세조정된 모델이라서 refiner를 사용하지 않는 게 좋답니다)
CFG 척도 : 7
Seed : -1
이미지 크기: 1216x832

아래로 내려가서  ADetailer를 활성화시킨 뒤, [Generate] 버튼을 누르면 아래와 비슷한 이미지가 생성될 것입니다.

이미지 생성시 참고 사항

원래 이 이미지는 미드저니(Midjourney)를 사용할 때 만난 이미지라고 합니다. 프롬프트는 "The drama of Life"이었다네요.

이 그림과 비슷하게 만들이 위해 먼저 "Interrogate CLIP" 을 사용해 프롬프트를 만들어 봤지만, 그다지 닮은 이미지가 만들어지지 않아서 "dress made of origami"를 넣어 환상적인 드레스를 만들었는데, 너무 밋밋한 편이라, "chaotic", "color"와 같은 키워드를 추가했다고 합니다.

특히 offset LoRA는 배경이 어두운 이미지를 만들어주어, 좀더 깊이있고 신비하고 꿈꾸는 듯한 이미지를 생성해 준다고 합니다. 

나비가 많이 나오는 것은 DreamShaper 모델의 특징입니다. 이 모델을 사용하면 나비가 춤추는 모습을 볼 수 있습니다. 

이미지 UpScale

여기에서는 Ultimate SD Upscale 확장을 사용해 이미지를 확대해보겠습니다.

이미지를 선택하고 이미지 아래쪽에 있는 Send to img2img 아이콘을 눌러줍니다.

이제 img2img 페이지에서 아래와 같이 설정해 줍니다.

샘플링 방법: Euler a
샘플링 단계: 30
Resize by: 2 (확대 배율. 원하는 대로 설정합니다)
CFG 척도: 7
잡음 제거 강도(Denoising strength) : 0.3 (이 값을 키우면 이미지가 더 많이 변경됩니다)

좀 더 아래로 내려가서 Script 를 펼치고 Ultimate SD upscale을 선택하고, 아래와 같이 설정해 줍니다.

Target size type: From img2img settings
Upscaler: 4x-UltraSharp
Type: Linear
Tile width: 1024 (SDXL 모델의 VAE 크기와 맞춰야 한다네요)

이제 [Generate] 버튼을 누르면 더 크고, 디테일이 추가된 이미지를 만날 수 있습니다.

ComfyUI 워크플로

아래는 이상의 내용을 가능한 한 반영하여 작성한 워크플로입니다. 제가 자주 사용하는 Efficiency 커스톰 노드를 기반으로한 SDXL 이미지용 워크플로를  확장한 것입니다. LoRA의 가중치와 프롬프트를 약간 변경했고, UpScaler는 Efficient 커스톰 노드에 포함된 Tiled Upscaler Script를 사용했습니다.

아래는 이렇게 생성한 결과입니다. AUTOMATIC1111과는 좀 차이가 나지만 괜찮은 이미지가 나왔네요.

이상입니다. 이 글은 https://stable-diffusion-art.com/drama-of-life/ 를 번역하면서 제가 생성한 이미지로 대체하였고, 추가로 ComfyUI 워크플로를 추가해서 작성한 글입니다.

민, 푸른하늘

====