AI 이미지 40

Hyper-SD와 Hyper-SDXL 패스트 모델

Hyper-SD와 Hyper-SDXL은 1~8 단계만에 고품질의 이미지를 생성할 수 있다고 주장하는 농축형(distilled) 스테이블 디퓨전 모델입니다. 이글에서 다루는 내용은 다음과 같습니다.하이퍼 스테이블 디퓨전 모델의 작동원리LCM, Turbo, Lightning 등 다른 패스트 모델과의 차이AUTOMATIC1111 및 ComfyUI에서 사용하는 방법최적 이미지 설정다음은 목차입니다.소프트웨어하이퍼 스테이블 디퓨전 모델이란?ComfyUI에서 하이퍼 SDXL 사용방법하이퍼 SDXL 이미지 비교소프트웨어논문저자가 공개한  하이퍼-SD UNet과 LoRA모델을 사용하려면, ComfyUI를 사용할 필요가 있습니다. 다만, LoRA 모델은 어떠한 체크포인트 모델과도 호환됩니다.하이퍼-SD 방법론으로 학습된..

단계 정렬(Align Your Steps) 사용방법

단계 정렬(AYS, Align Your Steps)는 Nvidia 팀에서 역 디퓨전 공식을 보다 정확하게 풀기위하여 제안한 것으로, 샘플링 프로세스를 변경한 것입니다. 논문에 따르면 AYS를 사용하면 10단계만으로도 고품질의 이미지를 생성할 수 있다고 합니다.단계 정렬이란?ComfyUI에서 단계 정렬을 사용하는 방법단계 정렬(Align Your Steps) 리뷰결론단계 정렬이란?단계정렬(Align Your Steps 는 새로운 모델이 아니라, 기존 샘플링 프로세스에 변화를 준 것입니다. 좀 더 정확하게 말씀드리자면 잡음 스케줄(noise schedule)을 변경시킨 것입니다. 따라서 단계 정렬은 어떤 모델과도 함께 사용할 수 있습니다.단계 정렬을 이해하려면 먼저 샘플링 프로세스를 이해해야 합니다. 여기에..

Text-to-Image(txt2img)란?

Text-to-Image(txt2img)는 인공지능 모델을 사용해서 입력된 텍스트(여러개의 단어)를 이미지로 생성해주는 것을 말합니다. txt2img AI 모델은 여러가지가 존재합니다. Text-to-image 모델의 작동 원리 Text-to-image 사용 방법 스테이블 디퓨전 txt2img 기본 설정 txt2img 모델 학습방법 Text-to-Image 모델의 종류 DALL-E Imagen 스테이블 디퓨전(Stable Diffusion) 미드저니(Midjourney) Text-to-image 모델의 작동 원리 txt2img 모델은 자연어 문장을 입력받아, 그 문장에 맞는 이미지를 생성해주는 신경망(neural network)입니다. 스테이블 디퓨전(Stable Diffusion)및 기타 인공지능 모델..

3D 카툰 캐릭터

이 글에 있는 워크플로를 사용하면 아래와 같은 3D 카툰 캐릭터를 생성할 수 있습니다. 소프트웨어 따라하기 소프트웨어 AUTOMATIC1111 이 글에 있는 워크플로는 가장 널리 사용되고 있는 스테이블 디퓨전용 웹 GUI인 AUTOMATIC1111을 사용합니다. AUTOMATIC1111의 설치 방법은 이 글을 보시고, 초보자 가이드도 참고하세요. 체크포인트 모델 이 글에서는 SDXL 의 미세조정 모델중 하나인 Samaritan 3D character 모델을 사용합니다. 모델을 다운로드 받은 후, stable-diffusion-webui\models\Stable-Diffusion 폴더에 넣어줍니다. 참고로 이 폴더 속에 하위 폴더를 설치해서 넣어도 됩니다. 저의 경우에는 SDXL 용 모델은 별도로 XL 이..

단어에 텍스트 효과 추가하기 - ComfyUI

꽤 오래전에, 위 그림과 같이 텍스트 효과를 입히는 방법에 대한 글을 썼습니다. AUTOMATIC1111 에서 콘트롤넷을 사용해 구현했는데, 꽤 괜찮은 결과물이 나왔었죠. 하지만, 이제 스테이블 디퓨전이 진화한 스테이블 캐스케이드(Stable Cascade)를 사용해서, 콘트롤넷을 사용하지 않고도 txt-to-image에서 텍스트효과를 추가할 수 있게 되었습니다. 아래는 몇가지 예입니다. 소프트웨어 따라하기 다른 이미지 생성 소프트웨어 이 글은 Stable Diffusion용 웹UI중 하나인 ComfyUI를 사용합니다. AUTOMATIC1111보다 복잡하지만, 속도가 빠르는 등 여러가지 장점이 있어서, 사용자가 급격히 늘고 있는 웹UI입니다. 설치하는 방법과 기본 사용 방법은 이 글을 보시고, 투토리얼을..

가림천 뒤의 여인

이 글은 아래와 같은 이미지를 생성하는 방법을 다룹니다. 소프트웨어 따라하기 이미지 템플릿 참고사항 소프트웨어 AUTOMATIC1111 이 글에서는 스테이블 디퓨전용 대표적인 웹 UI인 AUTOMATIC1111을 사용합니다. 설치하는 방법은 이 글을 참고하세요. AUTOMATIC1111을 잘 모르신다면 초보자 가이드를 읽어보시기 바랍니다. 체크포인트 모델 이 글에서는 SD 1.5 의 미세조정 모델중 하나인 Realistic Vision v5.1 모델을 사용합니다. 다운로드 받으신 후, stable-diffusion-webui\models\Stable-Diffusion 폴더에 넣으세요. 콘트롤넷(ControlNet) AUTOMATIC1111에서 가장 중요한 확장중 하나인 ControlNet을 설치해야 합니..

ComfyUI 투토리얼-1

ComfyUI는 다재다능한 오픈소스 이미지 생성형 AI인 스테이블 디퓨전을 위한 GUI중 하나입니다. 원래는 AUTOMATIC1111이 훨씬 더 많이 사용되었지만, 여러가지 워크플로를 쉽게 생성하고 변경할 수 있어서 사용자가 급격하게 늘어나는 중입니다. 다만, ComfyUI는 스테이블 디퓨전의 기술적인 내용과 많은 관련이 있어서 사용하기가 쉽지 않습니다. 요즘 들어 ComfyUI 에 관한 글이 더 많아졌는데, 사용법이 잘 정리된 문서가 없어서 고민하던 중이었는데, 이 투토리얼은 아주 기초적인 내용부터 고급 사용법까지 아우르는 여러가지 내용을 담고 있습니다. 처음부터 따라해보면 ComfyUI를 좀 더 확실하게 이해하실 수 있게 될 것입니다. 이 투토리얼은 Open.ai 의 ComfyUI Academy 에 ..

LoRA는 필요없다 - ComfyUI IP-Adapter

스테이블 디퓨전에서 어떤 특정한 인물의 얼굴을 넣으려면 LoRA를 학습시키거나 또는 dreambooth 를 사용해 checkpoint모델을 학습 시켜야 합니다.하지만, 새로운 모델을 학습시키는 것은 매우 시간이 걸리는 일입니다. 그런데, 이렇게 학습시킬 필요 없이 어떤 얼굴을 즉시 삽입할 수 있다면 어떨까요? 이 ComfyUI 워크플로는 입력 이미지로부터 어떤 인물의 얼굴을 복사합니다. 마치 맞춤형 LoRA나 체크포인트 모델처럼 사용할 수 있지만, 학습 시킬 필요는 없는 겁니다. 심지어는 매우 빠르고 편리합니다. 소프트웨어 따라하기 다른 인물 사용 실험 김태리 조인성 송혜교 테스트 결과 요약 소프트웨어 이 글에서는 스테이블 디퓨전용 GUI중에서도 빠르면서도 유연하여 사용자 저변을 급속히 확대하고 있는 C..

Stable Diffusion 무분류기 안내(CFG) 척도란

무분류기 안내(CFG, Classifier Free Guidance) 척도(scale)은 스테이블 디퓨전 잡음 제거 샘플링 과정에서 프롬프트를 얼마나 잘 따를 것인지를 제어합니다. 이 값은 거의 모든 Stable Diffusion 기반의 인공지능 이미지 생성기에서 사용할 수 있습니다. 이제까지 제가 올린 글에는 CFG를 언급한 글이 매우 많은데, 이 글에서는 Stable Diffusion에서 CFG 척도가 무엇인지 좀 더 자세히 알아보겠습니다. CFG 척도가 하는 일 LCM과 turbo 모델의 CFG 척도 무분류기 안내란? 분류기 안내 무분류기 안내 무분류기 안내 척도 무분류기 안내의 학습 가장 좋은 CFG 척도는? CFG와 샘플링 단계의 관계 CFG를 납치하여 부정적 프롬프트 활성화 CFG 척도가 하는..

Stable Diffusion에서 임베딩 사용하는 방법

임베딩(embedding) 혹은 텍스트 인버전(textual inversion)은 스테이블 디퓨전에서 이미지 스타일을 제어할 수 있는 또다른 방법입니다. 이 글에서는 임베딩이 무엇인지, 어디에서 받을 수 있는지, 어떻게 사용할 수 있는지 알아보겠습니다. 임베딩이란? 임베딩을 찾을 수 있는 곳 임베딩 사용 방법 유용한 임베딩 BadDream UnrealisticDream EasyNegative 추천 임베딩 wlop_style Kuvshinov 임베딩, 드림부스, 하이퍼네트워크의 차이 임베딩이란? 임베딩은 모델을 변경시키지 않고 새로운 키워드를 정의하는 방법인 텍스트 인버전의 결과입니다. 이 기법은 3~5개의 샘플 이미지 만으로 모델에 새로운 스타일이나 새로운 객체를 삽입할 수 있어서 주목을 받았습니다. 텍..