이미지 생성형 AI 39

스테이블 디퓨전 - 부정적 프롬프트

스테이블 디퓨전을 사용해 인공지능 이미지를 생성할 때, 부정적 프롬프트를 사용하면 원하는 이미지를 얻을 확률을 높여줍니다. 사실은 부정적 프롬프트만으로도 이미지를 생성할 수 있습니다. 참고: 이 글은 부정적 프롬프트의 두가지 종류 중 하나입니다. 다른 하나는 부정적 이미지 프롬프트를 읽어보시기 바랍니다. 간단한 예 부정적 프롬프트의 원리 부정적 프롬프트가 없는 샘플링 부정적 프롬프트가 있는 샘플링 샘플링 공간(Sampling Space) 요약 간단한 예 긍정적 프롬프트만 사용할 경우 남자 이미지를 몇장 생성해 보겠습니다. 여기에서는 Stable Diffusion v1.5 모델을 사용합니다(사실 SDXL 쪽이 이미지 품질이 더 좋지만, 좀 성능이 떨어지는 모델로 생성해야 이 글의 목적을 달성할 수 있기 때..

Stable Diffusion 무분류기 안내(CFG) 척도란

무분류기 안내(CFG, Classifier Free Guidance) 척도(scale)은 스테이블 디퓨전 잡음 제거 샘플링 과정에서 프롬프트를 얼마나 잘 따를 것인지를 제어합니다. 이 값은 거의 모든 Stable Diffusion 기반의 인공지능 이미지 생성기에서 사용할 수 있습니다. 이제까지 제가 올린 글에는 CFG를 언급한 글이 매우 많은데, 이 글에서는 Stable Diffusion에서 CFG 척도가 무엇인지 좀 더 자세히 알아보겠습니다. CFG 척도가 하는 일 LCM과 turbo 모델의 CFG 척도 무분류기 안내란? 분류기 안내 무분류기 안내 무분류기 안내 척도 무분류기 안내의 학습 가장 좋은 CFG 척도는? CFG와 샘플링 단계의 관계 CFG를 납치하여 부정적 프롬프트 활성화 CFG 척도가 하는..

잡음제거 강도(Denoising strength)란?

잡음제거 강도는 샘플링 단계에 들어가기 전, 이미지에 얼마나 많은 잡음을 추가할 것인지를 결정합니다. 특히 스테이블 디퓨전에서 image-to-image이지지 생성에서 공통적으로 사용되는 설정입니다. 잡음제거 강도는 0부터 1.0까지 설정할 수 있습니다. 0은 입력 이미지에 아무런 잡음을 추가하지 않는다는 뜻이고, 1.0은 입력된 이미지가 완전한 노이즈로 대체된다는 뜻입니다. 이러한 점에서 잡음제거 강도는 원 이미지를 보존하는 것과 완전히 새로운 이미지를 생성하는 것 사이의 균형이라고 생각하셔도 좋습니다. 결론적으로 잡음제거 강도를 높일 수록 이미지가 많이 변화하게 됩니다. AUTOMATIC1111에서 잡음제거 강도 image-to-image에서 잡음제거 강도 인페인트에서 잡음제거 강도 ComfyUI에서..

AI로 그린 판타지 바탕화면 월페이퍼 - ComfyUI

요즘은 그다지 컴퓨터 바탕 화면에 신경을 쓰지 않습니만, 한때는 고해상도 Wall paper를 구하느라 인터넷을 뒤적거렸던 기억이 나네요. 이 글에서는 여러가지 다양한 스타일의 바탕화면 이미지를 자동 생성해주는 ComfyUI 워크플로를 소개시켜 드립니다. 아래는 이 워크플로로 자동 생성한 월 페이퍼들입니다. 보시는 것처럼, 색깔/테마/계절 등이 다양하게 생성됩니다. 소프트웨어 따라하기 설정 변경 방법 Efficient 노드를 사용한 개선 버전 윈도11 바탕 화면 설정 윈도11 바탕 화면 설정 소프트웨어 이 글에서는 스테이블 디퓨전을 위한 GUI 중 하나인 ComfyUI를 사용합니다. 설치 및 기본 사용방법은 이 글을 보시면 됩니다. 조금 중복되는 부분도 있지만, 초보자 가이드도 참고하세요. 따라하기 1단..

Stable Diffusion에서 임베딩 사용하는 방법

임베딩(embedding) 혹은 텍스트 인버전(textual inversion)은 스테이블 디퓨전에서 이미지 스타일을 제어할 수 있는 또다른 방법입니다. 이 글에서는 임베딩이 무엇인지, 어디에서 받을 수 있는지, 어떻게 사용할 수 있는지 알아보겠습니다. 임베딩이란? 임베딩을 찾을 수 있는 곳 임베딩 사용 방법 유용한 임베딩 BadDream UnrealisticDream EasyNegative 추천 임베딩 wlop_style Kuvshinov 임베딩, 드림부스, 하이퍼네트워크의 차이 임베딩이란? 임베딩은 모델을 변경시키지 않고 새로운 키워드를 정의하는 방법인 텍스트 인버전의 결과입니다. 이 기법은 3~5개의 샘플 이미지 만으로 모델에 새로운 스타일이나 새로운 객체를 삽입할 수 있어서 주목을 받았습니다. 텍..

Stable Diffusion - 부정적 이미지 프롬프트

스테이블 디퓨전을 비롯한 많은 AI 이미지 생성기는 이미지를 프롬프트로 사용해서 비슷한 이미지를 생성하는 기능(이미지 프롬프트(image prompt)이 존재합니다. (AUTOMATIC1111에서는 이 글을 참고하세요) 일반적으로는 텍스트 프롬프트에 이미지에 추가하고자 하는 내용을, 부정적 프롬프트에 넣고 싶지 않은 내용을 지정합니다. 그런데, 이미지 프롬프트와 마찬가지로 이미지를 사용하여 내가 표현하고 싶지 않은 것을 지정하는 "부정적 이미지 프롬프트(negative image prompt)"가 있다면 어떨까요? 이 글에서는 스테이블 디퓨전에서 부정적 이미지 프롬프트를 구현하는 방법과, 재미있는 사례 몇 가지를 소개해 드립니다. 예를 들면, 아래 그림에서는 맨 왼쪽 사진에서 가운데 있는 잔디를 빼라고 ..

DALL-E 3와 Stable Diffusion XL 비교

DALL-E 3는 ChatGPT 혹은 "일상의 AI 컴패니언"을 표방하고 있는 마이크로소프트 Copilot에서 사용할 수 있습니다. 이 글에서는 DALL-E 3와 스테이블 디퓨전의 장단점을 비교해 보겠습니다. 아래는 이 글의 목차입니다. DALL-E 3란 스테이블 디퓨전이란 DALL-E 3와 Stable Diffusion XL 비교 프롬프트 이해 및 반영 텍스트 렌더링 스타일 인페인트와 아웃페인트 프롬프트 콘트롤넷 결론 DALL-E 3를 사용한 스테이블 디퓨전 개선 DALL-E 3란 DALL-E 3는 텍스트 문장을 이미지로 변환해주는 text-to-image 생성형 인공지능입니다. DALL-E 3의 학습 방법이나 모델 아키텍처는 제임스 벧커와 동료들이 저술한 "Improving Image Generati..

ComfyUI를 위한 유용한 정보

스테이블 디퓨전으로 이미지를 생성하는 경우, 대부분 AUTOMATIC1111 웹UI를 사용합니다. 하지만, ComfyUI 는 훨씬 미세하게 조정할 수 있고, 스테이블 디퓨전의 자료처리 과정을 잘 이해할 수 있다는 점에서 나름 쓸만한 대안입니다. 게다가 사용해보면 아시겠지만, 훨씬 메모리를 덜 차지하고 속도가 빠릅니다. 저는 현재 AUTOMATIC1111을 사용하는 것이 편한 경우가 많아서 두가지 모두를 사용하고 있지만, 언젠가는 ComfyUI로 완전히 돌아서지 않을까 싶습니다. ComfyUI가 여러가지 장점이 있지만, 사용하기 쉽지 않다는 단점이 있습니다. 기능이 어딘가 숨겨져 있을텐데, 매뉴얼도 마땅치 않고... 그래서 제가 사용하면서 알게된 팁 몇가지를 공유합니다. 물론 제가 까먹지 않기 위한 목적이..

AnimateDiff - 쉬운 text-to-video

Text-to-video는 말 그대로 입력한 텍스트 프롬프트만 사용해 비디오를 생성하는 기법입니다. 디퓨전 기반의 text-to-video 모델은 매우 빠른 속도로 발전하고 있습니다. 이 글에서는 자신의 PC에서 직접 사용할 수 있는 text-to-video 모델 중 가장 유명한 것중 하나인 AnimateDiff를 소개(논문: AnimateDiff:Animate Your Personalized Text-to-Image Diffusion Models without Specific Tuning, Yuwei Guo 등)하고 그 작업과정을 보여드립니다. 참고: 2023년 12월, Stable Video Diffusion이 공개되었습니다. txt2vid, img2vid는 SDV를 사용하는 것이 더 빠르고 품질이 ..

스테이블 디퓨전에서 LyCORIS 사용법

스테이블 디퓨전으로 이미지를 생성해보셨다면, 아마도 LoRA는 사용해 보셨을 겁니다. (LoRA 사용법은 이 글을 읽어보세요) 특히 SD 1.5에서는 LoRA 없이는 정상적인 이미지를 만들기 힘들 정도죠. 그런데 LyCORIS 모델은 사용해 보셨나요? 저도 한번도 접해볼 기회가 없었습니다. LyCORIS 모델이란 무엇인가? LyCORIS는 LoRA beYond Conventional methods, Other Rank adaptation Implementations for Stable Diffusion(스테이블 디퓨전을 위한, 일반적인 방법론을 넘어서는 LoRA, 또다른 계수 적용법(Rank adaptation) 구현) 의 약자입니다. (제가 번역하고도 무슨 뜻인지 모르겠네요 ㅠㅠ) LyCORIS는 Lo..