AI 이미지/Stable Diffusion 60

SD 3.5 - Stability AI의 깜짝쇼

2024년 10월 22일, Stability AI에서 2024년 6월 발표했던 SD 3.0에 비해 상당히 진보한 차세대 이미지 생성 모델인 Stable Diffusion 3.5(SD 3.5)를 공개했습니다(링크) 예상치 못한 복귀SD 3.5SD 3.5 사용방법결론예상치 못한 복귀 이번 Stable Diffusion 3.5는 정말 깜짝쇼에 가깝습니다. 인공지능 이미지 생성 분야에서  Stable Diffusion 3.0에 대한 실망이  커지고 Flux 가 급격한 성장을 보이는 가운데, 이런 발표를 예상했던 사람은 거의 없었습니다. 사실 2024년 6월에 발표된 버전 3.0은 커뮤니티를 전혀 설득하지 못했습니다. 이미지 품질은 열악했고 라이선스가 강화되는 바람에 많은 제작자들이 다른 솔루션으로 돌아서게 만들..

Stability Matrix -모든 Stable Diffusion을 한번에

현재 여러가지 이미지 생성용 AI가 공개되어 있으며, 이를 활용할 수 있는 프로그램(웹 인터페이스)도 매우 다양합니다. 저의 경우, 요즘엔 ComfyUI를 주로 사용하지만, AUTOMATIC1111, SD-Forge, Fooocus 등등 아주 많은 웹인터페이스를 사용해 왔습니다. 이렇게 여러가지를 사용하다보면, 각각 설치하고 업데이트하고... 하는 게 번거로울 뿐 아니라, 무엇보다 체크포인트 모델을 비롯하여 LoRA, ControlNet, Upscaler 등 많은 모델을 여기저기 설치하느라 관리하기가 힘들게 됩니다. 이러한 문제를 해결해줄 도구가 이 글에서 소개시켜드리는 Stability Matrix입니다.Stabiilty Matrix는 Flux 나 Stable Diffusion과 같은 이미지 생성형 A..

LoRA 학습용 이미지 선택 방법

LoRA를 사용하면, Flux.1 dev 모델 전체를 다시 학습시킬 필요 없이, 맞춤형 스타일을 정의할 수 있습니다. 이 기술을 사용하면 계산과 저장 측면에서 공간을 적게 차지하면서도, 특정 개념, 인물 또는 스타일에 맞춰 모델을 조정할 수 있습니다.LoRA학습 자체는 그다지 어렵지 않습니다. Flux 용 LoRA 학습 투토리얼에서 설명한 것처럼, 온라인에서도 학습시킬 수 있습니다. 그러나, 효과적인 LoRA 의 핵심은 학습 데이터세트에 달려있습니다. 즉, 학습용으로 선택한 이미지가 LoRA의 성능에 직접적으로 영향을 미치게 됩니다.이 글에서는 최적의 데이터세트를 만드는 방법을 알아보겠습니다. 이미지의 양, 이미지 다양성 및 품질의 중요성, 캡션의 생성 등과 같은 핵심적인 요소에 대해 알려드리겠습니다. ..

Stable Diffusion 3.5 GGUF를 ComfyUI에서 사용하기

Stability Ai에서 Stable Diffusion 3.5 Large 모델과 더 빠른 Turbo 버전을 공개했습니다. Stable Diffusion Medium의 실패를 바로잡고, SD 3.5 Large는 괄목할만한 성능 향상이 이루어졌습니다. 프롬프트의 이해도가 높아졌고, 다양한 스타일의 이미지를 생성할 수 있습니다.이 글에서는 Stable Diffusion 3.5 Large 모델에 대해 알아보고, 3070에서는 메모리 부족문제로 SD 3.5 Large를 직접 돌릴 수 없기 때문에 SD 3.5 GGUF 를 이용해 ComfyUI에서 돌릴 수 있는 방법을 알아보겠습니다.소프트웨어SD 3.5 Large 모델따라하기8bit 모델 테스트워크플로 설명간편 워크플로소프트웨어이 글에서는 스테이블 디퓨전용 GUI..

ComfyUI에서 스테이블 디퓨전 3.5 미디엄 모델 사용하기

스테이블 디퓨전 3.5 미디엄(Stable Diffusion 3.5 Medium)은 일반용 그래픽카드에서 돌릴 수 있는 AI 이미지 모델입니다. 파라미터의 수는 26개로서, 8억개인 SD 3.5 Large에 비해 적습니다.SD 3.5 미디엄은 메모리가 큰 GPU에서 이미지를 빨리 생성하고 싶은 경우, 혹은 메모리가 비교적 작은 PC에서 돌리고자 할 경우에 사용할 수 있습니다. Stablility AI에 따르면 256x256 부터 1440x1440 에 이르는 여러 해상도를 지원하는 최초의 스테이블 디퓨전 모델이라고 합니다. 소프트웨어SD 3.5 모델SD 3.5 미디엄 설치 방법SD 3.5 미디엄 모델 설정소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제가 제일 좋아하는 ComfyUI를 사용합니다. ..

Flux 및 SD에서 프리셋 스타일 사용하기

스타일 프리셋이란 스테이블 디퓨전 혹은 Flux AI 모델에 사용할 수 있는, 널리 사용되는 스타일 모음입니다. 스타일 프리셋을 사용하면 이미지의 스타일을 빠르게 바꿀 수 있습니다.예를 들어, JuggernautXL_version6 모델을 기반으로 아래와 같은 프롬프트로 생성하는 이미지에 여러가지 스타일 프리셋을 결과입니다. 프롬프트: a man in silver suit on streetbase (프리셋 x)craft clayanime이 글에서는 SD Forge 웹UI, AUTOMATIC1111 웹UI 및 ComfyUI 웹UI에서 스타일 프리셋을 사용하는 방법을 설명합니다.스테이블 디퓨전이 처음이라면 기본적인 이론을 참고하시기 바랍니다.스타일 프리셋의 작동원리SD Forge에서 스타일 프리셋 사용방법A..

스타일이 비슷한 이미지 만들기 - Style Aligned

스타일이 비슷한 이미지를 만드는 것은 로고나 서적 일러스트레이션과 같은 창조적인 작업에서 매우 유용한 기법입니다. 이 글은 스테이블 디퓨전에서 이러한 이미지를 생성하는 방법을 설명합니다.아래는 이 글에서 기술하는 기법을 사용하여 생성된 일관성있는 로고의 예입니다.또다른 예로서 아래와 같은 이미지를 생성할 수도 있습니다.이 글에서는 다음과 같은 내용을 다룹니다.Style Aligned 를 사용한 일관성있는 스타일(AUTOMATIC1111 및 ComfyUI)ControlNet Reference를 이용한 일관성있는 스타일(AUTOMATIC1111)AUTOMATIC1111과 ComfyUI의 구현상 차이점AUTOMATIC1111과 ComfyUI에서 사용하는 방법소프트웨어스타일 전송의 원리AUTOMATIC1111 ..

SAG - 이미지 배경 살리기

SAG(Self-attention Guidance, 자기 주의 안내)는 전체적인 두고를 보존하면서 이미지의 디테일을 향상시킵니다. 따라서 이미지가 생성하는 무의미한 디테일을 수정하는데 유용합니다.아래의 예에서는 신사분이 매고 있는 보우타이를 수정하고, 배경에 있는 기타 디테일을 수정하였습니다.원 이미지SAG 적용소프트웨어SAG의 원리ComfyUI다른 예제소프트웨어이 글에서는 ComfyUI를 사용합니다. ComfyUI는 약간 복잡해 보이지만, AUTOMATIC1111보다 빠르면서도 워크플로를 마음대로 수정할 수 있어서 인기가 높아지고 있는 Web UI입니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다. SAG의 원리SAG에 대한 상세한 내용은 홍수성 님 등이 ..

Stable Diffusion 3를 내 PC에서 돌리는 방법

얼마전, ComfyUI에서 API를 통해 SD3를 돌리는 방법을 올려드렸는데, 이 글에서는 자신의 컴퓨터에서 스테이블 디퓨전 3 미디엄(Stable Diffusion 3 medium)을 돌리는 방법에 대해 설명드립니다.소프트웨어시스템 요구사항ComfyUI에서 사용방법비교비교소프트웨어이 글에서는 ComfyUI를 사용하여 SD3 medium을 돌리는 방법을 사용합니다. ComfyUI는 매우 빠르게 사용자가 늘고 있는, 이제는 사실상 AUTOMATIC1111보다 더 많이 활용되는 것으로 예상되는 Stable Diffusion용 웹UI 입니다. ComfyUI를 설치하는 방법과 기초적인 사용법은 이 글을 읽어보시고, 좀 더 잘 활용하는 방법은 튜토리얼을 읽어보시기 바랍니다.시스템 요구사항SD3 미디엄 모델을 돌리..

Hyper-SD와 Hyper-SDXL 패스트 모델

Hyper-SD와 Hyper-SDXL은 1~8 단계만에 고품질의 이미지를 생성할 수 있다고 주장하는 농축형(distilled) 스테이블 디퓨전 모델입니다. 이글에서 다루는 내용은 다음과 같습니다.하이퍼 스테이블 디퓨전 모델의 작동원리LCM, Turbo, Lightning 등 다른 패스트 모델과의 차이AUTOMATIC1111 및 ComfyUI에서 사용하는 방법최적 이미지 설정다음은 목차입니다.소프트웨어하이퍼 스테이블 디퓨전 모델이란?ComfyUI에서 하이퍼 SDXL 사용방법하이퍼 SDXL 이미지 비교소프트웨어논문저자가 공개한  하이퍼-SD UNet과 LoRA모델을 사용하려면, ComfyUI를 사용할 필요가 있습니다. 다만, LoRA 모델은 어떠한 체크포인트 모델과도 호환됩니다.하이퍼-SD 방법론으로 학습된..