전체 글 1746

교란 어텐션 유도(Perturbed Attention Guide)

교란 어텐션 유도(Perturbed Attention Guide)은 샘플링 프로세스를 간단히 수정하여 스테이블 디퓨전 이미지를 향상시키는 것을 말합니다. 아래는 목차입니다.교란 어텐션 유도(PAG)이란?ComfyUI에서 PAG 사용법PAG 설정교란 어텐션 유도란?Perturbed Attention Guide(PAG)는 샘플링 프로세스를 변경하여 이미지 품질을 높이는 것입니다. 이 기법은 SD1.5와 SDXL 모델에 적용할 수 있습니다.좀 더 자세한 사항은 안동훈 님외의 Self-Rectifying Diffusion Sampling with Perturbed-Attention Guide를 참고하세요.U-Net에서의 어텐션(Attention)스테이블 디퓨전 SD1.5 및 SDXL 모델은 U-Net이라는 심층..

스테이블 디퓨전 샘플러: 완벽 가이드

AUTOMATIC1111과 ComfyUI에는 Euler, Heun, DDIM 등등 여러가지 샘플링 방법이 존재합니다. 이 글에서는 샘플러가 무엇인지, 작동 원리, 그리고 어떤 차이점이 있는지, 어떤 걸 사용하는 게 좋은지 등을 다룹니다.샘플링이란?샘플러(Sampler) 개요샘플러 평가이미지 수렴속도품질샘플링이란?이미지를 생성하기 위해서는 , 스테이블 디퓨전은 먼저 잠재 공간(latent space)에 완전히 무작위(random) 이미지를 생성합니다. 잡음 예측기(noise predictor)는 이미지로부터 잡음을 예측하고, 원래의 잡음 이미지에서 그 만큼의 예측된 잡음을 제거해줍니다.이 프로세스를 여러번 반복하면 최종적으로 깨끗한 이미지를 얻을 수 있습니다.이와 같은 잡음 제거(denoising) 프로세..

단계 정렬(Align Your Steps) 사용방법

단계 정렬(AYS, Align Your Steps)는 Nvidia 팀에서 역 디퓨전 공식을 보다 정확하게 풀기위하여 제안한 것으로, 샘플링 프로세스를 변경한 것입니다. 논문에 따르면 AYS를 사용하면 10단계만으로도 고품질의 이미지를 생성할 수 있다고 합니다.단계 정렬이란?ComfyUI에서 단계 정렬을 사용하는 방법단계 정렬(Align Your Steps) 리뷰결론단계 정렬이란?단계정렬(Align Your Steps 는 새로운 모델이 아니라, 기존 샘플링 프로세스에 변화를 준 것입니다. 좀 더 정확하게 말씀드리자면 잡음 스케줄(noise schedule)을 변경시킨 것입니다. 따라서 단계 정렬은 어떤 모델과도 함께 사용할 수 있습니다.단계 정렬을 이해하려면 먼저 샘플링 프로세스를 이해해야 합니다. 여기에..

스테이블 디퓨전 3: SDXL 및 스테이블 캐스케이드와 비교

스테이블 디퓨전 3(Stable Diffusion 3)는스테이블 디퓨전 모델 중에서 가장 최신의 가장 대형 모델입니다. Stability AI의 발표에 따르면, 자신의 기존 모델(스테이블 캐스케이드 및 SDXL)보다 텍스트 생성 능력과 프롬프트를 이해하고 따르는 능력이 훨씬 뛰어나다고 합니다.이 글에서는 Stable Diffusion 3와, 스테이블 캐스케이드, SDXL을 비교합니다. 비교할 대상은 아래와 같습니다.이 글의 목차는 아래와 같습니다.스테이블 디퓨전 3 사용방법텍스트 렌더링프롬프트 이해 및 따르기자세 제어물체의 구도손 렌더링얼굴 렌더링스타일결론스테이블 디퓨전 3 사용방법스테이블 디퓨전 3는 자신의 컴퓨터에 설치해서 사용하는 방법은 불가능하며, 개발자 API 를 통해서만 사용할 수 있습니다. ..

ComfyUI로 스테이블 디퓨전 3 API 사용하기

Stable Diffusion 3는 Stability AI의 최신 txt2img(텍스트-이미지) 변환 모델입니다. 스테이블 캐스케이드(Stable Cascade) 및 스테이블 디퓨전 XL(SDXL)과 같은 이전 모델보다 텍스트를 생성하는 성능 및 프롬프트를 이해하고 따르는 능력이 훨씬 뛰어납니다.이 모델은 현재 많은 관심을 받고 있지만, API를 이용해서만 사용할 수 있습니다.이 글에서는 ComfyUI에서 Stable Diffusion3를 사용할 수 있는 방법을 알려드리겠습니다.따라하기1단계: ComfyUI 매니저 설치2단계: SAI API 노드 설치3단계: API 키 정의 4단계: 워크플로 불러오기샘플 이미지따라하기스테이블 디퓨전 개발사인 Stablility AI에서는 스테이블 디퓨전 3 API를 지원..

SD Forge를 사용해서 SVD 비디오 생성하기

스테이블 디퓨전 WebUI Forge를 사용하면 Stable Video Diffusion(SVD) 비디오를 생성할 수 있습니다. 특히 SD Forge를 사용하면 GUI내에서 모든 SVD 비디오 제작에 필요한 모든 단계를 수행할 수 있습니다.이 글은 SD Forge에 SVD 모델을 설정하고 실행시켜 아래와 같은 비디오를 생성하는 방법을 다룹니다.소프트웨어SVD 모델 설치SVD 모델을 사용해 비디오 생성하기SVD 설정소프트웨어이 글을 따라하시려면 먼저 SD Forge를 설치하셔야 합니다. 설치방법은 여기를 보시면됩니다. 스테이블 디퓨전을 처음 접하신다면 이 글부터 읽어보시기 바랍니다.SVD는 SD Forge 뿐만 아니라, ComfyUI 등에서도 실행시킬 수 있습니다. 이에 대한 자세한 내용은 이 글을 읽어보..

Stable Video 3D : 객체 회전시키기

Stable Video 3D(SD3D)는 이미지를 단 한장 입력받아서, 3차원으로 회전하는 동영상을 생성해주는 AI 모델입니다. Stability AI에서는 이 모델을 비 상업적 목적에 한해 공개했습니다. 아래는 입력 이미지와 이를 이용해 생성헌 3차원 회전 이미지입니다. 이 글의 목차는 아래와 같습니다. 소프트웨어 따라하기 이미지 조정 SV3D의 원리 소프트웨어 이 글에서는 ComfyUI를 사용합니다. ComfyUI 에 대해 잘 모르신다면 설치 및 사용법 기초와 투토리얼을 읽어보시기 바랍니다. 따라하기 1단계: SV3D 워크플로 불러오기 아래의 json 파일 혹은 이미지 파일을 다운로드 받은 후, ComfyUI 화면에 Drag&Drop하면 워크플로가 불러들여집니다. 이 워크플로는 대부분 그냥 그대로 사..

투명 배경 이미지를 생성하는 방법

배경이 투명한 이미지는 디자인 작업에 유용합니다. 동일한 이미지를 여러가지 배경에 반복적으로 사용할 수 있기 때문입니다. 이 글에서는 layer Diffusion 모델을 사용하여 Stable Diffusion v1.5 및 SDXL 모델 용 투명 이미지를 생성하는 방법을 소개합니다. 소프트웨어 SD Forge로 투명 배경 이미지 제작 최신 버전 업데이트 Layer Diffusion 확장 설치 SD v1.5 투명 배경 이미지 생성 SDXL 투명 배경 이미지 생성 참고 사항 기타 스타일 ComfyUI ComfyUI로 투명 배경 이미지 제작 SD 1.5용 투명 배경 이미지 Layer Diffusion의 원리 소프트웨어 이 글에서는 SD Forge와 ComfyUI 웹 GUI를 사용합니다. SD Forge는 AUT..

소프트 인페인트

소프트 인페인트(Soft inpainting)를 사용하면 원래의 이미지에 인페인트되는 내용을 이음매 없이 연결해 줍니다. 즉, 잡음 제거 강도(denoising strength)를 높게 유지하면서도 복잡한 장면에서 경계가 뚜렷하게 나타나는 현상을 막을 수 있습니다. 아래는 소프트 인페인트의 예입니다. 배경 일반 인페인트 소프트 인페인 소프트웨어 간단한 예제 일반 인페인트 소프트 인페인트 소프트 인페인트의 작동원리 소프트 인페인트 설정 소프트웨어 이 글에서는 스테이블 디퓨전 모델의 웹 GUI 중에서 가장 대중적이고 널리 사용되고 있는 AUTOMATIC1111을 사용합니다. 설치 방법은 이 글은 보시고, 메뉴를 비롯한 기초적인 내용은 AUTOMATIC1111 가이드를 읽어보세요. 간단한 예제 배경 생성 먼저..

스테이블 디퓨전에서 손가락 수정하기

스테이블 디퓨전에서 이미지를 생성하면 손 형태가 잘못되거나 손가락이 4개 혹은 6개 등 이상해 지는 경우가 적지 않게 발생합니다. 이 글에서는 이러한 결함이 발생한 손 이미지를 수정하는 방법을 다룹니다. 소프트웨어 간단한 인페인트 업스케일(Upscaling) SDXL 모델의 경우 Hand Refiner 소프트웨어 이 글에서는 스테이블 디퓨전용 웹 GUI 중에서 가장 널리 사용되고 있는 AUTOMATIC1111을 사용합니다. AUTOMATIC1111은 Mac 이나 Google Colab에서도 사용할 수 있지만, 제 블로그에서는 윈도11에서 사용하는 방법만 다루고 있습니다. 스테이블 디퓨전에 대해 좀 더 알고 싶으시면 기본적인 이론이나 초보자 가이드를 참고하세요. 간단한 인페인트 생성한 이미지중 일부가 잘못..

Text-to-Image(txt2img)란?

Text-to-Image(txt2img)는 인공지능 모델을 사용해서 입력된 텍스트(여러개의 단어)를 이미지로 생성해주는 것을 말합니다. txt2img AI 모델은 여러가지가 존재합니다. Text-to-image 모델의 작동 원리 Text-to-image 사용 방법 스테이블 디퓨전 txt2img 기본 설정 txt2img 모델 학습방법 Text-to-Image 모델의 종류 DALL-E Imagen 스테이블 디퓨전(Stable Diffusion) 미드저니(Midjourney) Text-to-image 모델의 작동 원리 txt2img 모델은 자연어 문장을 입력받아, 그 문장에 맞는 이미지를 생성해주는 신경망(neural network)입니다. 스테이블 디퓨전(Stable Diffusion)및 기타 인공지능 모델..

스테이블 디퓨전 3 - 상세 기능

스테이블 디퓨전(Stable Diffusion) 3가 발표되고, 이 모델에 대한 상세한 내용을 담은 연구논문이 공개되었습니다. 이 모델은 아직 사용할 수 없지만, 미리 시험하기 원하신다면 대기자명단에 등록하실 수 있습니다. 스테이블 디퓨전 3 모델이란? 스테이블 디퓨전 3 모델의 장점 텍스트 생성 능력 향상 프롬프트 이해도 향상 속도와 배포 안전 스테이블 디퓨전 3의 새로운 기능 잡음 예측기 샘플링 텍스트 인코더 더 나은 캡션 스테이블 디퓨전 3 모델이란? 스테이블 디퓨전은 Stabiltity AI에서 공개한 최신의 텍스트-이미지(text-to-image) AI 모델입니다. 그런데, 기존의 v1 모델이나 SDXL 모델과는 달리, 8억개 에서 80억개의 매개변수를 가지는 여러 모델의 집합입니다. 즉, 가장..

3D 카툰 캐릭터

이 글에 있는 워크플로를 사용하면 아래와 같은 3D 카툰 캐릭터를 생성할 수 있습니다. 소프트웨어 따라하기 소프트웨어 AUTOMATIC1111 이 글에 있는 워크플로는 가장 널리 사용되고 있는 스테이블 디퓨전용 웹 GUI인 AUTOMATIC1111을 사용합니다. AUTOMATIC1111의 설치 방법은 이 글을 보시고, 초보자 가이드도 참고하세요. 체크포인트 모델 이 글에서는 SDXL 의 미세조정 모델중 하나인 Samaritan 3D character 모델을 사용합니다. 모델을 다운로드 받은 후, stable-diffusion-webui\models\Stable-Diffusion 폴더에 넣어줍니다. 참고로 이 폴더 속에 하위 폴더를 설치해서 넣어도 됩니다. 저의 경우에는 SDXL 용 모델은 별도로 XL 이..

아날로그 카메라 사진 생성하기 - ComfyUI

AI 이미지는 어딘가 인위적인 느낌이 많이들고, 사실적인 느낌이 떨어지기 마련입니다. 이 글에서는 이미지에 입자(grain) 효과와 비네팅(vignett) 효과를 추가하여 사실적인 이미지를 만드는 워크플로를 소개합니다. 소프트웨어 따라하기 변형 방법 간략한 워크플로 설명 소프트웨어 ComfyUI 이 글에서는 노드 기반의 스테이블 디퓨전용 GUI인 ComfyUI를 사용합니다. ComfyUI는 AUTOMATIC1111보다 속도가 빠르고 유연하기 때문에 요즘 사용자가 급증하는 추세입니다. ComfyUI의 설치방법 및 기본적인 사용방법은 이 글을, 투토리얼은 이 글을 읽어보시기 바랍니다. 따라하기 1 단계 : ComfyUI 워크플로 불러오기 아래 그림이나 json 파일을 다운로드 받은 후, ComfyUI 화면에..

단어에 텍스트 효과 추가하기 - ComfyUI

꽤 오래전에, 위 그림과 같이 텍스트 효과를 입히는 방법에 대한 글을 썼습니다. AUTOMATIC1111 에서 콘트롤넷을 사용해 구현했는데, 꽤 괜찮은 결과물이 나왔었죠. 하지만, 이제 스테이블 디퓨전이 진화한 스테이블 캐스케이드(Stable Cascade)를 사용해서, 콘트롤넷을 사용하지 않고도 txt-to-image에서 텍스트효과를 추가할 수 있게 되었습니다. 아래는 몇가지 예입니다. 소프트웨어 따라하기 다른 이미지 생성 소프트웨어 이 글은 Stable Diffusion용 웹UI중 하나인 ComfyUI를 사용합니다. AUTOMATIC1111보다 복잡하지만, 속도가 빠르는 등 여러가지 장점이 있어서, 사용자가 급격히 늘고 있는 웹UI입니다. 설치하는 방법과 기본 사용 방법은 이 글을 보시고, 투토리얼을..