이미지 생성형 AI 38

Hyper-SD와 Hyper-SDXL 패스트 모델

Hyper-SD와 Hyper-SDXL은 1~8 단계만에 고품질의 이미지를 생성할 수 있다고 주장하는 농축형(distilled) 스테이블 디퓨전 모델입니다. 이글에서 다루는 내용은 다음과 같습니다.하이퍼 스테이블 디퓨전 모델의 작동원리LCM, Turbo, Lightning 등 다른 패스트 모델과의 차이AUTOMATIC1111 및 ComfyUI에서 사용하는 방법최적 이미지 설정다음은 목차입니다.소프트웨어하이퍼 스테이블 디퓨전 모델이란?ComfyUI에서 하이퍼 SDXL 사용방법하이퍼 SDXL 이미지 비교소프트웨어논문저자가 공개한  하이퍼-SD UNet과 LoRA모델을 사용하려면, ComfyUI를 사용할 필요가 있습니다. 다만, LoRA 모델은 어떠한 체크포인트 모델과도 호환됩니다.하이퍼-SD 방법론으로 학습된..

교란 어텐션 유도(Perturbed Attention Guide)

교란 어텐션 유도(Perturbed Attention Guide)은 샘플링 프로세스를 간단히 수정하여 스테이블 디퓨전 이미지를 향상시키는 것을 말합니다. 아래는 목차입니다.교란 어텐션 유도(PAG)이란?ComfyUI에서 PAG 사용법PAG 설정교란 어텐션 유도란?Perturbed Attention Guide(PAG)는 샘플링 프로세스를 변경하여 이미지 품질을 높이는 것입니다. 이 기법은 SD1.5와 SDXL 모델에 적용할 수 있습니다.좀 더 자세한 사항은 안동훈 님외의 Self-Rectifying Diffusion Sampling with Perturbed-Attention Guide를 참고하세요.U-Net에서의 어텐션(Attention)스테이블 디퓨전 SD1.5 및 SDXL 모델은 U-Net이라는 심층..

스테이블 디퓨전 샘플러: 완벽 가이드

AUTOMATIC1111과 ComfyUI에는 Euler, Heun, DDIM 등등 여러가지 샘플링 방법이 존재합니다. 이 글에서는 샘플러가 무엇인지, 작동 원리, 그리고 어떤 차이점이 있는지, 어떤 걸 사용하는 게 좋은지 등을 다룹니다.샘플링이란?샘플러(Sampler) 개요샘플러 평가이미지 수렴속도품질샘플링이란?이미지를 생성하기 위해서는 , 스테이블 디퓨전은 먼저 잠재 공간(latent space)에 완전히 무작위(random) 이미지를 생성합니다. 잡음 예측기(noise predictor)는 이미지로부터 잡음을 예측하고, 원래의 잡음 이미지에서 그 만큼의 예측된 잡음을 제거해줍니다.이 프로세스를 여러번 반복하면 최종적으로 깨끗한 이미지를 얻을 수 있습니다.이와 같은 잡음 제거(denoising) 프로세..

단계 정렬(Align Your Steps) 사용방법

단계 정렬(AYS, Align Your Steps)는 Nvidia 팀에서 역 디퓨전 공식을 보다 정확하게 풀기위하여 제안한 것으로, 샘플링 프로세스를 변경한 것입니다. 논문에 따르면 AYS를 사용하면 10단계만으로도 고품질의 이미지를 생성할 수 있다고 합니다.단계 정렬이란?ComfyUI에서 단계 정렬을 사용하는 방법단계 정렬(Align Your Steps) 리뷰결론단계 정렬이란?단계정렬(Align Your Steps 는 새로운 모델이 아니라, 기존 샘플링 프로세스에 변화를 준 것입니다. 좀 더 정확하게 말씀드리자면 잡음 스케줄(noise schedule)을 변경시킨 것입니다. 따라서 단계 정렬은 어떤 모델과도 함께 사용할 수 있습니다.단계 정렬을 이해하려면 먼저 샘플링 프로세스를 이해해야 합니다. 여기에..

스테이블 디퓨전 3: SDXL 및 스테이블 캐스케이드와 비교

스테이블 디퓨전 3(Stable Diffusion 3)는스테이블 디퓨전 모델 중에서 가장 최신의 가장 대형 모델입니다. Stability AI의 발표에 따르면, 자신의 기존 모델(스테이블 캐스케이드 및 SDXL)보다 텍스트 생성 능력과 프롬프트를 이해하고 따르는 능력이 훨씬 뛰어나다고 합니다.이 글에서는 Stable Diffusion 3와, 스테이블 캐스케이드, SDXL을 비교합니다. 비교할 대상은 아래와 같습니다.이 글의 목차는 아래와 같습니다.스테이블 디퓨전 3 사용방법텍스트 렌더링프롬프트 이해 및 따르기자세 제어물체의 구도손 렌더링얼굴 렌더링스타일결론스테이블 디퓨전 3 사용방법스테이블 디퓨전 3는 자신의 컴퓨터에 설치해서 사용하는 방법은 불가능하며, 개발자 API 를 통해서만 사용할 수 있습니다. ..

ComfyUI로 스테이블 디퓨전 3 API 사용하기

Stable Diffusion 3는 Stability AI의 최신 txt2img(텍스트-이미지) 변환 모델입니다. 스테이블 캐스케이드(Stable Cascade) 및 스테이블 디퓨전 XL(SDXL)과 같은 이전 모델보다 텍스트를 생성하는 성능 및 프롬프트를 이해하고 따르는 능력이 훨씬 뛰어납니다.이 모델은 현재 많은 관심을 받고 있지만, API를 이용해서만 사용할 수 있습니다.이 글에서는 ComfyUI에서 Stable Diffusion3를 사용할 수 있는 방법을 알려드리겠습니다.따라하기1단계: ComfyUI 매니저 설치2단계: SAI API 노드 설치3단계: API 키 정의 4단계: 워크플로 불러오기샘플 이미지따라하기스테이블 디퓨전 개발사인 Stablility AI에서는 스테이블 디퓨전 3 API를 지원..

소프트 인페인트

소프트 인페인트(Soft inpainting)를 사용하면 원래의 이미지에 인페인트되는 내용을 이음매 없이 연결해 줍니다. 즉, 잡음 제거 강도(denoising strength)를 높게 유지하면서도 복잡한 장면에서 경계가 뚜렷하게 나타나는 현상을 막을 수 있습니다. 아래는 소프트 인페인트의 예입니다. 배경 일반 인페인트 소프트 인페인 소프트웨어 간단한 예제 일반 인페인트 소프트 인페인트 소프트 인페인트의 작동원리 소프트 인페인트 설정 소프트웨어 이 글에서는 스테이블 디퓨전 모델의 웹 GUI 중에서 가장 대중적이고 널리 사용되고 있는 AUTOMATIC1111을 사용합니다. 설치 방법은 이 글은 보시고, 메뉴를 비롯한 기초적인 내용은 AUTOMATIC1111 가이드를 읽어보세요. 간단한 예제 배경 생성 먼저..

스테이블 디퓨전 3 - 상세 기능

스테이블 디퓨전(Stable Diffusion) 3가 발표되고, 이 모델에 대한 상세한 내용을 담은 연구논문이 공개되었습니다. 이 모델은 아직 사용할 수 없지만, 미리 시험하기 원하신다면 대기자명단에 등록하실 수 있습니다. 스테이블 디퓨전 3 모델이란? 스테이블 디퓨전 3 모델의 장점 텍스트 생성 능력 향상 프롬프트 이해도 향상 속도와 배포 안전 스테이블 디퓨전 3의 새로운 기능 잡음 예측기 샘플링 텍스트 인코더 더 나은 캡션 스테이블 디퓨전 3 모델이란? 스테이블 디퓨전은 Stabiltity AI에서 공개한 최신의 텍스트-이미지(text-to-image) AI 모델입니다. 그런데, 기존의 v1 모델이나 SDXL 모델과는 달리, 8억개 에서 80억개의 매개변수를 가지는 여러 모델의 집합입니다. 즉, 가장..

아날로그 카메라 사진 생성하기 - ComfyUI

AI 이미지는 어딘가 인위적인 느낌이 많이들고, 사실적인 느낌이 떨어지기 마련입니다. 이 글에서는 이미지에 입자(grain) 효과와 비네팅(vignett) 효과를 추가하여 사실적인 이미지를 만드는 워크플로를 소개합니다. 소프트웨어 따라하기 변형 방법 간략한 워크플로 설명 소프트웨어 ComfyUI 이 글에서는 노드 기반의 스테이블 디퓨전용 GUI인 ComfyUI를 사용합니다. ComfyUI는 AUTOMATIC1111보다 속도가 빠르고 유연하기 때문에 요즘 사용자가 급증하는 추세입니다. ComfyUI의 설치방법 및 기본적인 사용방법은 이 글을, 투토리얼은 이 글을 읽어보시기 바랍니다. 따라하기 1 단계 : ComfyUI 워크플로 불러오기 아래 그림이나 json 파일을 다운로드 받은 후, ComfyUI 화면에..

SD Forge 설치방법

Stabel Forge WebUI Forge(SD Forge)는 스테이블 디퓨전용 웹 UI 중 하나로서, VRAM이 적은 GPU에서도 빠르게 이미지가 생성되는 등 여러가지 장점이 있습니다. 이 글은 Stable Diffusion용 고급 GUI인 SD Forge를 설치하는 방법을 설명합니다. SD Forge란? SD Forge의 장점 SD Forge 설치방법(Windows) AUTOMATIC1111 과 모델 공유 SD Forge란? SD Forge는 AUTOMATIC1111의 변형 버전입니다. SD Forge는 이미지 생성이 빠르며, 일부 확장이 미리 설치되어 있고, 특정 기능이 가능하도록 일부 백엔드를 수정하였다는 것이 특징입니다. SD Forge의 장점 빠른 이미지 생성 개발팀에 따르면, SD Forg..