AI 이미지/Stable Diffusion 59

Stable Diffusion 3

SDXL이 출시가 된지 이제 겨우 6개월이 된 듯하고, 1 주일 전에 Stable Cascade가 발표되었는데, 이제 스테이블 디퓨전 다음 버전이 공개되기 직전이라는 소식입니다. 이번 버전은 특히 프롬프트를 잘 이해하고, 이미지 품질이 높아지며, 아래처럼 글을 작성하는 능력이 아주 높아진다고 합니다. 또한 모델 크기가 다양하게 제공된다고 하니, 아마도 다양한 플랫폼에 적용시킬 수 있을 것으로 생각되네요. 스테이블 디퓨전의 팬으로써 또 어느 정도의 성능을 보여줄지 정말 많이 기대가 되네요. 아래는 https://stability.ai/news/stable-diffusion-3 를 그대로 번역한 내용입니다. 참고하세요~ 다중 주제 이미지 프롬프트가 가능하고, 이미지 품질, 철자 기능이 크게 향상된 Text-..

ComfyUI에서 스테이블 캐스케이드 사용법

스테이블 캐스케이드(Stable Cascade)가 출시된지 불과 10일정도뿐이 안되었는데, 벌써 ComfyUI에서는 정식으로 지원하기 시작했습니다. 이것만 봐도 ComfyUI가 얼마나 유연한지, 왜 요즘 사용자가 급격하게 늘고 있는지 아실 것 같습니다(AUTOMATIC1111은 언제쯤 정식으로 지원이 될까... 궁금해지네요) 참고: 이 글보다는 스테이블 캐스케이드 ComfyUI 예제 사이트 를 읽어보시길 권합니다. 이 글에 포함된 워크플로는 약간의 오류가 있고 사용하기도 조금 복잡하기 때문입니다. 아직까지 스테이블 캐스케이드를 최대한 잘 활용할 수 있는 워크플로가 모두 개발된 것은 아닙니다. ControlNet이나 LoRA도 지원된다고는 하는데 아직 제대로된 워크플로는 못찾았고요. 이 글에서는 Comfy..

스테이블 캐스케이드(Stable Cascade)

10일 전쯤 스테이블 디퓨전을 개발한 Stability.ai 사가 새로운 이미지 생성 인공지능 모델인 스테이블 캐스케이드(Stable Cascade)를 공개했습니다. 불과 얼마전에 SDXL을 공개해서 1024x1024 해상도의 고품질 이미지를 생성할 수 있게되었다고 놀라워했고, 아직 완전히 정착되지도 않은 듯 싶은데 새로운 모델이 공개된 것입니다. 이번에 공개된 모델은 잠재 공간을 더욱 압축시킴으로써, 학습 및 추론 속도가 매우 빨라지면서도 생성되는 이미지의 품질은 매우 높고, 게다가 프롬프트를 이해하고 따르는 능력이 향상되었다고 합니다. 아래는 보도자료에 포함된 주요 요점이고, 목차 아래쪽은 Stability Github 페이지에 있는 내용입니다. 아주 기대되면서도 또 새로 배워야 할 것이 늘어나서 즐..

InstantID를 사용한 얼굴 교체 방법

얼마전에 LoRA는 필요없다 - ComfyUI IP-Adapter라는 글에서, 별도로 학습한 체크포인트나 LoRA 모델 없이 어떤 사람의 얼굴을 복제하는 방법을 알려드렸습니다. 이 글도 비슷한 내용입니다. 다만, InstantID라는 기법을 이용한 것만 다릅니다. 아래는 InstantID를 사용해 얼굴을 복제한 예입니다. 뭔가 나사가 빠진 듯 하네요. 다른 예를 봐도 아시겠지만, 이 기법은 (적어도 제가 테스트해 본 바로는) 복제한 얼굴이 닮은 정도를 비율로 따지면 10~20% 정도가 아닐까... 싶은 정도입니다. InstantID 란 InstantID 대신 사용할 수 있는 것 AUTOMATIC1111 사전 준비 콘트롤넷(ControlNet) 확장 설치 InstantID 모델 설치 AUTOMATIC111..

IP-Adapter: 너무 많아서 정리한다

IP-adapter(Image Prompt adapter)는 이미지를 프롬프트로 사용할 수 있는 스테이블 디퓨전 애드온입니다. IP-adapter를 사용하면 참조 이미지로부터 스타일, 구도, 얼굴을 복사할 수 있습니다. 이 글에서는 IP-adapter의 여러가지 모델(Plus, Face ID, Face ID v2, Face ID portrait 등)과 이들 IP Adapter를 AUTOMATIC1111과 ComfyUI에서 사용하는 방법을 알아봅니다. 아래는 목차입니다. IP-adapter 모델 원래의 IP-adapter IP-adapter Plus IP-adapter Plus Face IP-adapter SDXL IP-adapter Plus SDXL IP-adapter Plus Face SDXL IP-a..

스테이블 디퓨전 - 부정적 프롬프트

스테이블 디퓨전을 사용해 인공지능 이미지를 생성할 때, 부정적 프롬프트를 사용하면 원하는 이미지를 얻을 확률을 높여줍니다. 사실은 부정적 프롬프트만으로도 이미지를 생성할 수 있습니다. 참고: 이 글은 부정적 프롬프트의 두가지 종류 중 하나입니다. 다른 하나는 부정적 이미지 프롬프트를 읽어보시기 바랍니다. 간단한 예 부정적 프롬프트의 원리 부정적 프롬프트가 없는 샘플링 부정적 프롬프트가 있는 샘플링 샘플링 공간(Sampling Space) 요약 간단한 예 긍정적 프롬프트만 사용할 경우 남자 이미지를 몇장 생성해 보겠습니다. 여기에서는 Stable Diffusion v1.5 모델을 사용합니다(사실 SDXL 쪽이 이미지 품질이 더 좋지만, 좀 성능이 떨어지는 모델로 생성해야 이 글의 목적을 달성할 수 있기 때..

Stable Diffusion 무분류기 안내(CFG) 척도란

무분류기 안내(CFG, Classifier Free Guidance) 척도(scale)은 스테이블 디퓨전 잡음 제거 샘플링 과정에서 프롬프트를 얼마나 잘 따를 것인지를 제어합니다. 이 값은 거의 모든 Stable Diffusion 기반의 인공지능 이미지 생성기에서 사용할 수 있습니다. 이제까지 제가 올린 글에는 CFG를 언급한 글이 매우 많은데, 이 글에서는 Stable Diffusion에서 CFG 척도가 무엇인지 좀 더 자세히 알아보겠습니다. CFG 척도가 하는 일 LCM과 turbo 모델의 CFG 척도 무분류기 안내란? 분류기 안내 무분류기 안내 무분류기 안내 척도 무분류기 안내의 학습 가장 좋은 CFG 척도는? CFG와 샘플링 단계의 관계 CFG를 납치하여 부정적 프롬프트 활성화 CFG 척도가 하는..

잡음제거 강도(Denoising strength)란?

잡음제거 강도는 샘플링 단계에 들어가기 전, 이미지에 얼마나 많은 잡음을 추가할 것인지를 결정합니다. 특히 스테이블 디퓨전에서 image-to-image이지지 생성에서 공통적으로 사용되는 설정입니다. 잡음제거 강도는 0부터 1.0까지 설정할 수 있습니다. 0은 입력 이미지에 아무런 잡음을 추가하지 않는다는 뜻이고, 1.0은 입력된 이미지가 완전한 노이즈로 대체된다는 뜻입니다. 이러한 점에서 잡음제거 강도는 원 이미지를 보존하는 것과 완전히 새로운 이미지를 생성하는 것 사이의 균형이라고 생각하셔도 좋습니다. 결론적으로 잡음제거 강도를 높일 수록 이미지가 많이 변화하게 됩니다. AUTOMATIC1111에서 잡음제거 강도 image-to-image에서 잡음제거 강도 인페인트에서 잡음제거 강도 ComfyUI에서..

Stable Diffusion에서 임베딩 사용하는 방법

임베딩(embedding) 혹은 텍스트 인버전(textual inversion)은 스테이블 디퓨전에서 이미지 스타일을 제어할 수 있는 또다른 방법입니다. 이 글에서는 임베딩이 무엇인지, 어디에서 받을 수 있는지, 어떻게 사용할 수 있는지 알아보겠습니다. 임베딩이란? 임베딩을 찾을 수 있는 곳 임베딩 사용 방법 유용한 임베딩 BadDream UnrealisticDream EasyNegative 추천 임베딩 wlop_style Kuvshinov 임베딩, 드림부스, 하이퍼네트워크의 차이 임베딩이란? 임베딩은 모델을 변경시키지 않고 새로운 키워드를 정의하는 방법인 텍스트 인버전의 결과입니다. 이 기법은 3~5개의 샘플 이미지 만으로 모델에 새로운 스타일이나 새로운 객체를 삽입할 수 있어서 주목을 받았습니다. 텍..

Stable Diffusion - 부정적 이미지 프롬프트

스테이블 디퓨전을 비롯한 많은 AI 이미지 생성기는 이미지를 프롬프트로 사용해서 비슷한 이미지를 생성하는 기능(이미지 프롬프트(image prompt)이 존재합니다. (AUTOMATIC1111에서는 이 글을 참고하세요) 일반적으로는 텍스트 프롬프트에 이미지에 추가하고자 하는 내용을, 부정적 프롬프트에 넣고 싶지 않은 내용을 지정합니다. 그런데, 이미지 프롬프트와 마찬가지로 이미지를 사용하여 내가 표현하고 싶지 않은 것을 지정하는 "부정적 이미지 프롬프트(negative image prompt)"가 있다면 어떨까요? 이 글에서는 스테이블 디퓨전에서 부정적 이미지 프롬프트를 구현하는 방법과, 재미있는 사례 몇 가지를 소개해 드립니다. 예를 들면, 아래 그림에서는 맨 왼쪽 사진에서 가운데 있는 잔디를 빼라고 ..