AI 이미지/Stable Diffusion 53

Stable Diffusion 무분류기 안내(CFG) 척도란

무분류기 안내(CFG, Classifier Free Guidance) 척도(scale)은 스테이블 디퓨전 잡음 제거 샘플링 과정에서 프롬프트를 얼마나 잘 따를 것인지를 제어합니다. 이 값은 거의 모든 Stable Diffusion 기반의 인공지능 이미지 생성기에서 사용할 수 있습니다. 이제까지 제가 올린 글에는 CFG를 언급한 글이 매우 많은데, 이 글에서는 Stable Diffusion에서 CFG 척도가 무엇인지 좀 더 자세히 알아보겠습니다. CFG 척도가 하는 일 LCM과 turbo 모델의 CFG 척도 무분류기 안내란? 분류기 안내 무분류기 안내 무분류기 안내 척도 무분류기 안내의 학습 가장 좋은 CFG 척도는? CFG와 샘플링 단계의 관계 CFG를 납치하여 부정적 프롬프트 활성화 CFG 척도가 하는..

잡음제거 강도(Denoising strength)란?

잡음제거 강도는 샘플링 단계에 들어가기 전, 이미지에 얼마나 많은 잡음을 추가할 것인지를 결정합니다. 특히 스테이블 디퓨전에서 image-to-image이지지 생성에서 공통적으로 사용되는 설정입니다. 잡음제거 강도는 0부터 1.0까지 설정할 수 있습니다. 0은 입력 이미지에 아무런 잡음을 추가하지 않는다는 뜻이고, 1.0은 입력된 이미지가 완전한 노이즈로 대체된다는 뜻입니다. 이러한 점에서 잡음제거 강도는 원 이미지를 보존하는 것과 완전히 새로운 이미지를 생성하는 것 사이의 균형이라고 생각하셔도 좋습니다. 결론적으로 잡음제거 강도를 높일 수록 이미지가 많이 변화하게 됩니다. AUTOMATIC1111에서 잡음제거 강도 image-to-image에서 잡음제거 강도 인페인트에서 잡음제거 강도 ComfyUI에서..

Stable Diffusion에서 임베딩 사용하는 방법

임베딩(embedding) 혹은 텍스트 인버전(textual inversion)은 스테이블 디퓨전에서 이미지 스타일을 제어할 수 있는 또다른 방법입니다. 이 글에서는 임베딩이 무엇인지, 어디에서 받을 수 있는지, 어떻게 사용할 수 있는지 알아보겠습니다. 임베딩이란? 임베딩을 찾을 수 있는 곳 임베딩 사용 방법 유용한 임베딩 BadDream UnrealisticDream EasyNegative 추천 임베딩 wlop_style Kuvshinov 임베딩, 드림부스, 하이퍼네트워크의 차이 임베딩이란? 임베딩은 모델을 변경시키지 않고 새로운 키워드를 정의하는 방법인 텍스트 인버전의 결과입니다. 이 기법은 3~5개의 샘플 이미지 만으로 모델에 새로운 스타일이나 새로운 객체를 삽입할 수 있어서 주목을 받았습니다. 텍..

Stable Diffusion - 부정적 이미지 프롬프트

스테이블 디퓨전을 비롯한 많은 AI 이미지 생성기는 이미지를 프롬프트로 사용해서 비슷한 이미지를 생성하는 기능(이미지 프롬프트(image prompt)이 존재합니다. (AUTOMATIC1111에서는 이 글을 참고하세요) 일반적으로는 텍스트 프롬프트에 이미지에 추가하고자 하는 내용을, 부정적 프롬프트에 넣고 싶지 않은 내용을 지정합니다. 그런데, 이미지 프롬프트와 마찬가지로 이미지를 사용하여 내가 표현하고 싶지 않은 것을 지정하는 "부정적 이미지 프롬프트(negative image prompt)"가 있다면 어떨까요? 이 글에서는 스테이블 디퓨전에서 부정적 이미지 프롬프트를 구현하는 방법과, 재미있는 사례 몇 가지를 소개해 드립니다. 예를 들면, 아래 그림에서는 맨 왼쪽 사진에서 가운데 있는 잔디를 빼라고 ..

Stable Diffusion - 프롬프트에 관한 모든 것

좋은 프롬프트를 만드는 과정은 모든 스테이블 디퓨전 사용자가 마주치는 첫번째 단계입니다. 이 글에서는 여러가지 실험과 사용자 들의 반응을 종합한 프롬프트 제작 절차 및 기법을 요약한 글입니다. 참고: 이 글을 읽고 실제 프롬프트를 작성할 때에는 chatGPT로 프롬프트를 만드는 방법도 추천드립니다. 아래는 이 글의 목차입니다. 좋은 프롬프트의 구성 피사체(Subject, 주제) 이미지 종류(Media) 스타일(Style) 예술 작품 공유 웹사이트(Art-sharing website) 해상도(Resolution) 추가 세부사항(Additional detail) 색(Color) 조명(Lighting) 부정적 프롬프트 키워드 목록 좋은 프롬프트를 만드는 절차 프롬프트 관련 기술적 사항 비슷한 얼굴 생성 방법 ..

다이내믹 프롬프트 사용법

이 글에서는 다이내믹 프롬프트를 사용하는 방법에 대해 말씀드립니다. 먼저 다이내믹 프롬프트가 무엇인지 간단하게 소개하고 AUTOMATIC1111에서 사용하는 방법, 그리고 ComfyUI에서 사용하는 방법을 설명합니다. 목차는 아래와 같습니다. Dynamic Prompt 란? AUTOMATIC1111 다이내믹 프롬프트 사용법 ComfyUI 다이내믹 프롬프트 사용법 다이내믹 프롬프트 문법 Dynamic Prompt 란? 다이내믹 프롬프트란, 프롬프트내의 일부 단어를 여러가지로 조합하여 사용할 수 있는 프롬프트를 말합니다. 예를 들어 "a {blue|yellow|red} flower" 이라는 프롬프트는 a blue flower/a yellow flower/a red flower 등 세 가지 프롬프트를 생성해 ..

SDXL 터보 - 실시간 이미지 생성

SDXL 터보 모델은 단 한번의 샘플링 단계만에 선명한 이미지를 생성하는 미세조정(fine-tuned) 모델입니다. 이 글에서 다루는 내용은 다음과 같습니다. SDXL 터보란 AUTOMATIC1111에서 SDXL 터보 사용하는 방법 ComfyUI에서 SDXL 터보 사용하는 방법 실시간 프롬프트 처리(Real-time Prompting) SDXL Turbo를 위한 최적 설정 성능 비교 SDXL Turbo와 LCM-LoRA 비교 SDXL 터보란? SDXL 터보(Turbo) 모델은 단 한번의 샘플링 단계만에 선명한 이미지를 생성하도록 미세조정(fine-tuned)한 SDXL(스테이블 디퓨전 XL) 모델입니다. 학습방법 SDXL 터보 모델의 학습 방법은 Axel Sauer 등이 저술한 논문 "적대적 확산 농축(..

Stable Diffusion - HiRes. Fix를 활용한 고품질 이미지 생성

이 글에서는 HiRes Fix (High Resolution Fix, 고해상도 수정)이라는 기법을 소개합니다. 이 기법은 2 패스 Txt2Img 기법이라고도 하는데, txt2img 방식으로 저해상도 잠재 이미지를 생성한 후, 이 잠재 이미지를 확대하고 다시 img2img 방식으로 이미지를 생성하는 기법을 말합니다. 뭔가 여러번 단계를 거쳐야 해서 약간 복잡하기는 하지만, 그냥 이미지를 확대하는 것에 비해 매우 고품질의 이미지를 얻을 수 있는 장점이 있습니다. 먼저 결과물을 보여드리겠습니다. 아래 왼쪽은 그냥 txt2img로 생성한 이미지이고, 오른쪽은 HiRes. Fix 기법을 적용해 생성한 이미지입니다(이미지 크기가 다르지만 동일한 크기로 비교해봤습니다). 보시는 것처럼, 이미지 크기가 커진 것과는 별..

이미지에서 프롬프트를 알아내는 방법

멋진 AI 이미지를 발견했을 때, 무슨 프롬프트로 생성했을까 궁금할 때가 있으실 겁니다. 이럴 때 프롬프트를 알아내는 방법을 몇가지 소개시켜드립니다. 또한 이미지를 재 생성할 확률을 높일 수 있는 몇가지 기법도 소개합니다. 이 글의 목차는 다음과 같습니다. 소프트웨어 설치 PNG 정보에서 프롬프트 알아내기 CLIP interrogator 사용하여 프롬프트 알아내기 AUTOMATIC1111 기본 CLIP interrogator 사용법 CLIP interrogator 확장 Huggingface 사이트 비슷한 이미지를 생성하기 위한 팁 소프트웨어 설치 이 블로그에서 다루는 AI 이미지 생성용 모델은 stable diffusion입니다. 하지만 이 모델은 사용하기 힘들기 때문에(python 프로그램을 돌려야 합..

SDXL - ControlNet 사용하기(AUTOMATIC1111)

SDXL은 SD1.5에 비해 훨씬 뛰어난 이미지를 생성하는 모델입니다. 많은 경우 LoRA 등을 사용하지 않고 base 모델만으로도 충분히 괜찮은 이미지를 생성해주죠. 다만, 아직도 여러가지 확장은 안정적이지 않고 아직도 지원되지 않는 것들도 많습니다. 그 중 하나가 ControlNet이었습니다. ControlNet을 사용하면 피사체의 구도, 특히 인물의 자세를 원래의 이미지와 동일하게 복사할 수 있어서 무척 유용한 확장입니다. 거의 모든 확장 중에서 거의 최고의 확장이라고 할 수 있습니다. ControlNet에 대한 좀더 자세한 사항은 이 글(1)과 이 글(2)을 읽어보시기 바랍니다. 사실 ControlNet에 관한 사항은 위의 글 두개에 모두 담았기 때문에 이 글에서는 반복할 필요가 없으니, 반복되는..