전체보기 1765

스테이블 디퓨전에서 손가락 수정하기

스테이블 디퓨전에서 이미지를 생성하면 손 형태가 잘못되거나 손가락이 4개 혹은 6개 등 이상해 지는 경우가 적지 않게 발생합니다. 이 글에서는 이러한 결함이 발생한 손 이미지를 수정하는 방법을 다룹니다. 소프트웨어 간단한 인페인트 업스케일(Upscaling) SDXL 모델의 경우 Hand Refiner 소프트웨어 이 글에서는 스테이블 디퓨전용 웹 GUI 중에서 가장 널리 사용되고 있는 AUTOMATIC1111을 사용합니다. AUTOMATIC1111은 Mac 이나 Google Colab에서도 사용할 수 있지만, 제 블로그에서는 윈도11에서 사용하는 방법만 다루고 있습니다. 스테이블 디퓨전에 대해 좀 더 알고 싶으시면 기본적인 이론이나 초보자 가이드를 참고하세요. 간단한 인페인트 생성한 이미지중 일부가 잘못..

Text-to-Image(txt2img)란?

Text-to-Image(txt2img)는 인공지능 모델을 사용해서 입력된 텍스트(여러개의 단어)를 이미지로 생성해주는 것을 말합니다. txt2img AI 모델은 여러가지가 존재합니다. Text-to-image 모델의 작동 원리 Text-to-image 사용 방법 스테이블 디퓨전 txt2img 기본 설정 txt2img 모델 학습방법 Text-to-Image 모델의 종류 DALL-E Imagen 스테이블 디퓨전(Stable Diffusion) 미드저니(Midjourney) Text-to-image 모델의 작동 원리 txt2img 모델은 자연어 문장을 입력받아, 그 문장에 맞는 이미지를 생성해주는 신경망(neural network)입니다. 스테이블 디퓨전(Stable Diffusion)및 기타 인공지능 모델..

스테이블 디퓨전 3 - 상세 기능

스테이블 디퓨전(Stable Diffusion) 3가 발표되고, 이 모델에 대한 상세한 내용을 담은 연구논문이 공개되었습니다. 이 모델은 아직 사용할 수 없지만, 미리 시험하기 원하신다면 대기자명단에 등록하실 수 있습니다. 스테이블 디퓨전 3 모델이란? 스테이블 디퓨전 3 모델의 장점 텍스트 생성 능력 향상 프롬프트 이해도 향상 속도와 배포 안전 스테이블 디퓨전 3의 새로운 기능 잡음 예측기 샘플링 텍스트 인코더 더 나은 캡션 스테이블 디퓨전 3 모델이란? 스테이블 디퓨전은 Stabiltity AI에서 공개한 최신의 텍스트-이미지(text-to-image) AI 모델입니다. 그런데, 기존의 v1 모델이나 SDXL 모델과는 달리, 8억개 에서 80억개의 매개변수를 가지는 여러 모델의 집합입니다. 즉, 가장..

3D 카툰 캐릭터

이 글에 있는 워크플로를 사용하면 아래와 같은 3D 카툰 캐릭터를 생성할 수 있습니다. 소프트웨어 따라하기 소프트웨어 AUTOMATIC1111 이 글에 있는 워크플로는 가장 널리 사용되고 있는 스테이블 디퓨전용 웹 GUI인 AUTOMATIC1111을 사용합니다. AUTOMATIC1111의 설치 방법은 이 글을 보시고, 초보자 가이드도 참고하세요. 체크포인트 모델 이 글에서는 SDXL 의 미세조정 모델중 하나인 Samaritan 3D character 모델을 사용합니다. 모델을 다운로드 받은 후, stable-diffusion-webui\models\Stable-Diffusion 폴더에 넣어줍니다. 참고로 이 폴더 속에 하위 폴더를 설치해서 넣어도 됩니다. 저의 경우에는 SDXL 용 모델은 별도로 XL 이..

아날로그 카메라 사진 생성하기 - ComfyUI

AI 이미지는 어딘가 인위적인 느낌이 많이들고, 사실적인 느낌이 떨어지기 마련입니다. 이 글에서는 이미지에 입자(grain) 효과와 비네팅(vignett) 효과를 추가하여 사실적인 이미지를 만드는 워크플로를 소개합니다. 소프트웨어 따라하기 변형 방법 간략한 워크플로 설명 소프트웨어 ComfyUI 이 글에서는 노드 기반의 스테이블 디퓨전용 GUI인 ComfyUI를 사용합니다. ComfyUI는 AUTOMATIC1111보다 속도가 빠르고 유연하기 때문에 요즘 사용자가 급증하는 추세입니다. ComfyUI의 설치방법 및 기본적인 사용방법은 이 글을, 투토리얼은 이 글을 읽어보시기 바랍니다. 따라하기 1 단계 : ComfyUI 워크플로 불러오기 아래 그림이나 json 파일을 다운로드 받은 후, ComfyUI 화면에..

단어에 텍스트 효과 추가하기 - ComfyUI

꽤 오래전에, 위 그림과 같이 텍스트 효과를 입히는 방법에 대한 글을 썼습니다. AUTOMATIC1111 에서 콘트롤넷을 사용해 구현했는데, 꽤 괜찮은 결과물이 나왔었죠. 하지만, 이제 스테이블 디퓨전이 진화한 스테이블 캐스케이드(Stable Cascade)를 사용해서, 콘트롤넷을 사용하지 않고도 txt-to-image에서 텍스트효과를 추가할 수 있게 되었습니다. 아래는 몇가지 예입니다. 소프트웨어 따라하기 다른 이미지 생성 소프트웨어 이 글은 Stable Diffusion용 웹UI중 하나인 ComfyUI를 사용합니다. AUTOMATIC1111보다 복잡하지만, 속도가 빠르는 등 여러가지 장점이 있어서, 사용자가 급격히 늘고 있는 웹UI입니다. 설치하는 방법과 기본 사용 방법은 이 글을 보시고, 투토리얼을..

SD Forge로 SVD 비디오 생성방법

SD Forge는 AUTOMATIC1111으로부터 파생된 웹 UI로 사용법은 비슷하지만, 콘트롤넷 등의 필수 확장을 내장하였고, 속도가 빠른 것이 특징입니다. SD Forge 설치 방법은 이 글을 읽어보시기 바랍니다. 사용법은 AUTOMATIC1111 사용법 과 거의 비슷하니 참고하세요.이 글에서는 SD Forge를 사용하여 SVD 비디오를 생성하는 방법을 알아보겠습니다.스테이블 비디오 디퓨전(SVD)이란txt2img 로 이미지 생성SVD 비디오 생성GIF 변환스테이블 비디오 디퓨전(SVD)이란스테이블 비디오 디퓨전(Stable Video Diffusion)은 2023년 11월 1일 Stability.ai에서 발표한, 이미지를 사용하여 짧은 비디오(움짤)을 생성하는 img2vid 생성 모델입니다. 이 글..

SD Forge 설치방법

Stable Diffusion Forge WebUI (SD Forge)는 스테이블 디퓨전용 웹 UI 중 하나로서, VRAM이 적은 GPU에서도 빠르게 이미지가 생성되는 등 여러가지 장점이 있습니다.이 글은 Stable Diffusion용 고급 GUI인 SD Forge를 설치하는 방법을 설명합니다. SD Forge란?SD Forge의 장점SD Forge 설치방법(Windows)AUTOMATIC1111 과 모델 공유SD Forge란?SD Forge는 AUTOMATIC1111으로부터 파생된 웹 UI로 사용법은 비슷하지만, 콘트롤넷 등의 필수 확장을 내장하였고, 속도가 빠른 것이 특징입니다. SD Forge 설치 방법은 이 글을 읽어보시기 바랍니다. 사용법은 AUTOMATIC1111 사용법 과 거의 비슷하니 참..

ComfyUI 예제 - Stable Cascade

개요 Text-to-Image Image-to-Image Image Variations 다중 이미지 Remix Image Variations 개요 여기에 포함된 예제를 사용하기 위해서는 stable_cascade_stage_c.safetensors 및 stable_cascade_stage_b.safetensors 체크포인트 파일을 다운로드 받아, ComfyUI\models\checkpoints 폴더에 넣으셔야 합니다. 스테이블 캐스케이드는 3단계 프로세스로서, 제일 먼저 스테이지 C 모델에서 저해상도 잠상(잠재 이미지}를 생성한다. 그 다음 이 잠상을 스테이지 B 디퓨전 모델을 사용하여 확대한다. 마지막으로 이렇게 확대된 잠상이 스테이지 A로 전달되어 다시 한번 확대되고 이미지 공간으로 변환된다. 참고로..

Stable Diffusion 3

SDXL이 출시가 된지 이제 겨우 6개월이 된 듯하고, 1 주일 전에 Stable Cascade가 발표되었는데, 이제 스테이블 디퓨전 다음 버전이 공개되기 직전이라는 소식입니다. 이번 버전은 특히 프롬프트를 잘 이해하고, 이미지 품질이 높아지며, 아래처럼 글을 작성하는 능력이 아주 높아진다고 합니다. 또한 모델 크기가 다양하게 제공된다고 하니, 아마도 다양한 플랫폼에 적용시킬 수 있을 것으로 생각되네요. 스테이블 디퓨전의 팬으로써 또 어느 정도의 성능을 보여줄지 정말 많이 기대가 되네요. 아래는 https://stability.ai/news/stable-diffusion-3 를 그대로 번역한 내용입니다. 참고하세요~ 다중 주제 이미지 프롬프트가 가능하고, 이미지 품질, 철자 기능이 크게 향상된 Text-..