전체 글 1739

잡음제거 강도(Denoising strength)란?

잡음제거 강도는 샘플링 단계에 들어가기 전, 이미지에 얼마나 많은 잡음을 추가할 것인지를 결정합니다. 특히 스테이블 디퓨전에서 image-to-image이지지 생성에서 공통적으로 사용되는 설정입니다. 잡음제거 강도는 0부터 1.0까지 설정할 수 있습니다. 0은 입력 이미지에 아무런 잡음을 추가하지 않는다는 뜻이고, 1.0은 입력된 이미지가 완전한 노이즈로 대체된다는 뜻입니다. 이러한 점에서 잡음제거 강도는 원 이미지를 보존하는 것과 완전히 새로운 이미지를 생성하는 것 사이의 균형이라고 생각하셔도 좋습니다. 결론적으로 잡음제거 강도를 높일 수록 이미지가 많이 변화하게 됩니다. AUTOMATIC1111에서 잡음제거 강도 image-to-image에서 잡음제거 강도 인페인트에서 잡음제거 강도 ComfyUI에서..

일부만 움직이는 이미지 - ComfyUI

이 글은 animateDiff와 인페인트를 사용해서 일부분만 움직이는 이미지를 생성하는 ComfyUI에 대해 설명드립니다. 소프트웨어 따라하기 워크플로 설명 소프트웨어 이 글에서는 스테이블 디퓨전을 위한 GUI 중 하나인 ComfyUI를 사용합니다. 설치 및 기본 사용방법은 이 글을 보시면 됩니다. 조금 중복되는 부분도 있지만, 초보자 가이드도 참고하세요. 따라하기 0단계 : ComfyUI 워크플로 불러보기 아래의 그림을 다운로드 받고, ComfyUI 화면에 Drag&Drop하면 이 워크플로를 사용할 수 있습니다. 대부분 그냥 따라하면 그대로 사용할 수 있지만, 때때로 오류가 발생할 수 있습니다. 그러한 경우, 다음과 같은 작업이 필요할 수 있습니다. 처음 사용할 때 - ComfyUI Manager 를 ..

AI로 그린 판타지 바탕화면 월페이퍼 - ComfyUI

요즘은 그다지 컴퓨터 바탕 화면에 신경을 쓰지 않습니만, 한때는 고해상도 Wall paper를 구하느라 인터넷을 뒤적거렸던 기억이 나네요. 이 글에서는 여러가지 다양한 스타일의 바탕화면 이미지를 자동 생성해주는 ComfyUI 워크플로를 소개시켜 드립니다. 아래는 이 워크플로로 자동 생성한 월 페이퍼들입니다. 보시는 것처럼, 색깔/테마/계절 등이 다양하게 생성됩니다. 소프트웨어 따라하기 설정 변경 방법 Efficient 노드를 사용한 개선 버전 윈도11 바탕 화면 설정 윈도11 바탕 화면 설정 소프트웨어 이 글에서는 스테이블 디퓨전을 위한 GUI 중 하나인 ComfyUI를 사용합니다. 설치 및 기본 사용방법은 이 글을 보시면 됩니다. 조금 중복되는 부분도 있지만, 초보자 가이드도 참고하세요. 따라하기 1단..

Stable Diffusion에서 임베딩 사용하는 방법

임베딩(embedding) 혹은 텍스트 인버전(textual inversion)은 스테이블 디퓨전에서 이미지 스타일을 제어할 수 있는 또다른 방법입니다. 이 글에서는 임베딩이 무엇인지, 어디에서 받을 수 있는지, 어떻게 사용할 수 있는지 알아보겠습니다. 임베딩이란? 임베딩을 찾을 수 있는 곳 임베딩 사용 방법 유용한 임베딩 BadDream UnrealisticDream EasyNegative 추천 임베딩 wlop_style Kuvshinov 임베딩, 드림부스, 하이퍼네트워크의 차이 임베딩이란? 임베딩은 모델을 변경시키지 않고 새로운 키워드를 정의하는 방법인 텍스트 인버전의 결과입니다. 이 기법은 3~5개의 샘플 이미지 만으로 모델에 새로운 스타일이나 새로운 객체를 삽입할 수 있어서 주목을 받았습니다. 텍..

Stable Diffusion - 부정적 이미지 프롬프트

스테이블 디퓨전을 비롯한 많은 AI 이미지 생성기는 이미지를 프롬프트로 사용해서 비슷한 이미지를 생성하는 기능(이미지 프롬프트(image prompt)이 존재합니다. (AUTOMATIC1111에서는 이 글을 참고하세요) 일반적으로는 텍스트 프롬프트에 이미지에 추가하고자 하는 내용을, 부정적 프롬프트에 넣고 싶지 않은 내용을 지정합니다. 그런데, 이미지 프롬프트와 마찬가지로 이미지를 사용하여 내가 표현하고 싶지 않은 것을 지정하는 "부정적 이미지 프롬프트(negative image prompt)"가 있다면 어떨까요? 이 글에서는 스테이블 디퓨전에서 부정적 이미지 프롬프트를 구현하는 방법과, 재미있는 사례 몇 가지를 소개해 드립니다. 예를 들면, 아래 그림에서는 맨 왼쪽 사진에서 가운데 있는 잔디를 빼라고 ..

Stable Diffusion - 프롬프트에 관한 모든 것

좋은 프롬프트를 만드는 과정은 모든 스테이블 디퓨전 사용자가 마주치는 첫번째 단계입니다. 이 글에서는 여러가지 실험과 사용자 들의 반응을 종합한 프롬프트 제작 절차 및 기법을 요약한 글입니다. 참고: 이 글을 읽고 실제 프롬프트를 작성할 때에는 chatGPT로 프롬프트를 만드는 방법도 추천드립니다. 아래는 이 글의 목차입니다. 좋은 프롬프트의 구성 피사체(Subject, 주제) 이미지 종류(Media) 스타일(Style) 예술 작품 공유 웹사이트(Art-sharing website) 해상도(Resolution) 추가 세부사항(Additional detail) 색(Color) 조명(Lighting) 부정적 프롬프트 키워드 목록 좋은 프롬프트를 만드는 절차 프롬프트 관련 기술적 사항 비슷한 얼굴 생성 방법 ..

Fooocus: 아주 간편한 Stable Diffusion

Fooocus는 스테이블 디퓨전을 기반으로 한 무료, 오픈소스 AI 이미지 생성기입니다. Fooocus는 스테이블 디퓨전과 미디저니(Midjourney)의 장점을 결합하였습니다. 즉, 오픈소스, 오프라인, 무료로 사용할 수 있으며, 사용법이 매우 간단합니다. Fooocus는 스테이블 디퓨전 파이프라인을 최적화하여 고품질의 이미지를 생성합니다. 설정을 어떻게 바꿀까 고민할 필요가 없이, 그 시간에 어떤 이미지를 생성하고 싶은지를 고민하시면 됩니다. 아래는 이 글의 목차입니다. Fooocus의 장단점 Fooocus 설치 방법 Fooocus 사용 방법 고급 설정 성능(Performance) 설정 종횡비(Aspect Ratio) 설정 스타일(Style) 설정 모델(Model) 설정 이미지 확대(Upscale) ..

ComfyUI 인페인트 기법

ComfyUI로 인페인트를 적용하는 것은 AUTOMATIC1111을 사용할 때만큼 쉽지 않습니다. ComfyUI 예제 사이트에 올라온 워크플로를 포함해서 실제로 적용해보면 에러가 발생하는 경우가 많습니다. 이 글에서는 좀 더 괜찮은 인페인트 워크플로를 몇개 올립니다. 사실 저는 여기에 있는 워크플로보다, 엊그제 올린 자동 인페인트/아웃페인트 - ComfyUI 워크플로가 제일 마음에 듭니다만, 이 글도 참고하시길. 소프트웨어 워크플로 활용방법 일반 모델을 사용한 인페인트 인페인트 모델을 사용한 인페인트 콘트롤넷 인페인트 FaceDetailer 자동 얼굴 수정 기존 사진의 얼굴 수정 소프트웨어 이 글에서는 오픈소스 이미지 생성 AI 인 스테이블 디퓨전(Stable Diffusion)의 대표적인 GUI 중 하..

AI 패션 아이디어 생성기 - ComfyUI

패션 디자인에 관심있으신가요? 이 글에서 제공하는 ComfyUI 워크플로를 사용하면, 스테이블 디퓨전 모델에 학습된 수많은 패션 이미지를 사용하여, 완전히 새로운, 다종 다양한 아이디어를 얻을 수 있습니다. 아래는 이 글의 목차입니다. 이 워크플로의 기능 소프트웨어 따라 하기 설정 변경 이 워크플로의 기능 이 워크플로는 패션 모델 이미지를 입력으로 받은 후, 다시 생성하고자 하는 부분을 마스크로 가려주고, 적당한 프롬프트를 입력해주면 멋진 패션 디자인을 생성합니다. 생성하고자 하는 내용은 프롬프트로 제어할 수 있습니다. 소프트웨어 이 글은 스테이블 디퓨전의 대표적인 GUI중 하나인 ComfyUI를 사용합니다. 설치 방법은 ComfyUI 설치 및 사용법 기초를 참고하세요. ComfyUI 초보자 가이드도 읽..

자동 인페인트/아웃페인트 - ComfyUI

이미지 생성형 인공지능을 사용하다보면, 일부분만 새로 그리거나(인페인트) 바깥쪽을 더 그리고 싶은(아웃페인트) 경우가 있습니다. 그런데 인페인트 또는 아웃페인트를 자동으로 처리해주는 방법을 소개시켜 드립니다. 이 글의 목차는 아래와 같습니다. 인페인트/아웃페인트란? 자동 인페인트/아웃페인트가 해주는 것 소프트웨어 설치 따라 하기 워크플로 간단 설명 다른 예 DALL-E 3 이미지 아웃페인트 인페인트/아웃페인트란? 인페인트(inpainting)란 이미지의 일부만 다시 그리는 것을 말합니다. 옷이나 스타일을 바꾸고 싶거나 배경중 일부를 지우고 싶을 때 등에 사용합니다. 아래의 예에서는 얼굴을 새로 그렸습니다. SD1.5 초창기의 경우 손 발이 두개가 생기는 등의 오류가 많이 발생해서 인페인트는 거의 필수나 ..

다이내믹 프롬프트 사용법

이 글에서는 다이내믹 프롬프트를 사용하는 방법에 대해 말씀드립니다. 먼저 다이내믹 프롬프트가 무엇인지 간단하게 소개하고 AUTOMATIC1111에서 사용하는 방법, 그리고 ComfyUI에서 사용하는 방법을 설명합니다. 목차는 아래와 같습니다. Dynamic Prompt 란? AUTOMATIC1111 다이내믹 프롬프트 사용법 ComfyUI 다이내믹 프롬프트 사용법 다이내믹 프롬프트 문법 Dynamic Prompt 란? 다이내믹 프롬프트란, 프롬프트내의 일부 단어를 여러가지로 조합하여 사용할 수 있는 프롬프트를 말합니다. 예를 들어 "a {blue|yellow|red} flower" 이라는 프롬프트는 a blue flower/a yellow flower/a red flower 등 세 가지 프롬프트를 생성해 ..

스테이블 디퓨전 - 벤자민 버튼의 시간은 거꾸로 간다.

브레드 피트가 열연을 펼친 "벤자민 버튼의 시간은 거꾸로 간다"라는 영화를 보며, 자기에 맞는 얼굴을 갖는 게 얼마나 중요한지에 대해 생각했던 기억이 있습니다. 오늘 소개시켜드릴 워크플로도 사람이 점점 거꾸로 나이가 들어가는 동영상을 만드는 방법입니다. 이 기법은 ComfyUI + AnimateDiff 를 사용합니다. 아래는 생성 예입니다. 이 글의 목차는 아래와 같습니다. 소프트웨어 설정 따라 하기 참고사항 및 변경 방법 인생을 25초로 소프트웨어 설정 스테이블 디퓨전을 사용할 수 있는 GUI는 여러가지 종류가 있지만, 이 글에서는 ComfyUI를 사용합니다. ComfyUI가 처음이신 분은 설치 및 기본 사용 방법 및 초보자 가이드를 읽어보시기 바랍니다. 따라 하기 1 단계: 워크플로 불러오기 아래 그..

얼굴이 동일한 비디오를 빠르게 생성하기 - ComfyUI

이 글에서는 Video-to-video 기법, 즉 기존의 비디오를 소스로 해서 인물과 배경을 바꾼 새로운 비디오를 생성하는 기법을 설명합니다. 다만, 예전 글에서 설명한 것처럼, Video-to-video를 적용하면 화면이 번쩍거리던가 매 장면마다 사람 얼굴이 바뀌는 등의 문제가 발생하기 쉬운데, 여기서는 이런 문제를 해결한 비디오를 생성합니다. 여기서 다루는 사항은 아래와 같습니다. IP-adapter - 얼굴을 일관성있게 유지하는데 중요합니다. 다중 콘트롤넷 - 프레임간 움직임을 일정하게 유지하는데 중요합니다. AnimateDiff - 프레임간 일관성 유지에 필요합니다. 원래 짧은 비디오를 생성하는 img-to-video 모델입니다. LCM LoRA - 비디오 생성속도를 3배 이상 빠르게 합니다. D..

DALL-E 3와 Stable Diffusion XL 비교

DALL-E 3는 ChatGPT 혹은 "일상의 AI 컴패니언"을 표방하고 있는 마이크로소프트 Copilot에서 사용할 수 있습니다. 이 글에서는 DALL-E 3와 스테이블 디퓨전의 장단점을 비교해 보겠습니다. 아래는 이 글의 목차입니다. DALL-E 3란 스테이블 디퓨전이란 DALL-E 3와 Stable Diffusion XL 비교 프롬프트 이해 및 반영 텍스트 렌더링 스타일 인페인트와 아웃페인트 프롬프트 콘트롤넷 결론 DALL-E 3를 사용한 스테이블 디퓨전 개선 DALL-E 3란 DALL-E 3는 텍스트 문장을 이미지로 변환해주는 text-to-image 생성형 인공지능입니다. DALL-E 3의 학습 방법이나 모델 아키텍처는 제임스 벧커와 동료들이 저술한 "Improving Image Generati..

DALL-E 3 사용법 및 평가(Copilot)

저는 거의 스테이블 디퓨전을 사용해서 인공지능 이미지를 생성하지만, 이 글에서는 이미지 생성형 인공지능의 하나인 DALL-E 3 에 대해 알아보겠습니다. 이 글의 내용은 아래와 같습니다. DALL-E 3 개요 DALL-E 3 사용법 다른 예제 아이디어 탐구용 그림 생성 DALL-E 3 평가 DALL-E 3 개요 DALL-E 는 ChatGPT를 개발한 것으로 유명한 OpenAI에서 개발한 이미지 생성형 인공지능입니다. DALL-E 3는 2023년 9월 공개되었으며, 이전 모델에 비해, 그리고 경쟁 이미지 생성형 인공지능에 비해 프롬프트(문장 입력)를 훨씬 잘 반영하는 것으로 유명합니다. DALL-E 3 는 유료인 ChatGPT Plus에서 사용할 수 있으며, 마이크로소프트에서 "일상의 AI 컴패니언"이라고..