스테이블 디퓨전 106

Stable Diffusion - 부정적 이미지 프롬프트

스테이블 디퓨전을 비롯한 많은 AI 이미지 생성기는 이미지를 프롬프트로 사용해서 비슷한 이미지를 생성하는 기능(이미지 프롬프트(image prompt)이 존재합니다. (AUTOMATIC1111에서는 이 글을 참고하세요) 일반적으로는 텍스트 프롬프트에 이미지에 추가하고자 하는 내용을, 부정적 프롬프트에 넣고 싶지 않은 내용을 지정합니다. 그런데, 이미지 프롬프트와 마찬가지로 이미지를 사용하여 내가 표현하고 싶지 않은 것을 지정하는 "부정적 이미지 프롬프트(negative image prompt)"가 있다면 어떨까요? 이 글에서는 스테이블 디퓨전에서 부정적 이미지 프롬프트를 구현하는 방법과, 재미있는 사례 몇 가지를 소개해 드립니다. 예를 들면, 아래 그림에서는 맨 왼쪽 사진에서 가운데 있는 잔디를 빼라고 ..

Stable Diffusion - 프롬프트에 관한 모든 것

좋은 프롬프트를 만드는 과정은 모든 스테이블 디퓨전 사용자가 마주치는 첫번째 단계입니다. 이 글에서는 여러가지 실험과 사용자 들의 반응을 종합한 프롬프트 제작 절차 및 기법을 요약한 글입니다. 참고: 이 글을 읽고 실제 프롬프트를 작성할 때에는 chatGPT로 프롬프트를 만드는 방법도 추천드립니다. 아래는 이 글의 목차입니다. 좋은 프롬프트의 구성 피사체(Subject, 주제) 이미지 종류(Media) 스타일(Style) 예술 작품 공유 웹사이트(Art-sharing website) 해상도(Resolution) 추가 세부사항(Additional detail) 색(Color) 조명(Lighting) 부정적 프롬프트 키워드 목록 좋은 프롬프트를 만드는 절차 프롬프트 관련 기술적 사항 비슷한 얼굴 생성 방법 ..

ComfyUI 인페인트 기법

ComfyUI로 인페인트를 적용하는 것은 AUTOMATIC1111을 사용할 때만큼 쉽지 않습니다. ComfyUI 예제 사이트에 올라온 워크플로를 포함해서 실제로 적용해보면 에러가 발생하는 경우가 많습니다. 이 글에서는 좀 더 괜찮은 인페인트 워크플로를 몇개 올립니다. 사실 저는 여기에 있는 워크플로보다, 엊그제 올린 자동 인페인트/아웃페인트 - ComfyUI 워크플로가 제일 마음에 듭니다만, 이 글도 참고하시길. 소프트웨어 워크플로 활용방법 일반 모델을 사용한 인페인트 인페인트 모델을 사용한 인페인트 콘트롤넷 인페인트 FaceDetailer 자동 얼굴 수정 기존 사진의 얼굴 수정 소프트웨어 이 글에서는 오픈소스 이미지 생성 AI 인 스테이블 디퓨전(Stable Diffusion)의 대표적인 GUI 중 하..

AI 패션 아이디어 생성기 - ComfyUI

패션 디자인에 관심있으신가요? 이 글에서 제공하는 ComfyUI 워크플로를 사용하면, 스테이블 디퓨전 모델에 학습된 수많은 패션 이미지를 사용하여, 완전히 새로운, 다종 다양한 아이디어를 얻을 수 있습니다. 아래는 이 글의 목차입니다. 이 워크플로의 기능 소프트웨어 따라 하기 설정 변경 이 워크플로의 기능 이 워크플로는 패션 모델 이미지를 입력으로 받은 후, 다시 생성하고자 하는 부분을 마스크로 가려주고, 적당한 프롬프트를 입력해주면 멋진 패션 디자인을 생성합니다. 생성하고자 하는 내용은 프롬프트로 제어할 수 있습니다. 소프트웨어 이 글은 스테이블 디퓨전의 대표적인 GUI중 하나인 ComfyUI를 사용합니다. 설치 방법은 ComfyUI 설치 및 사용법 기초를 참고하세요. ComfyUI 초보자 가이드도 읽..

자동 인페인트/아웃페인트 - ComfyUI

이미지 생성형 인공지능을 사용하다보면, 일부분만 새로 그리거나(인페인트) 바깥쪽을 더 그리고 싶은(아웃페인트) 경우가 있습니다. 그런데 인페인트 또는 아웃페인트를 자동으로 처리해주는 방법을 소개시켜 드립니다. 이 글의 목차는 아래와 같습니다. 인페인트/아웃페인트란? 자동 인페인트/아웃페인트가 해주는 것 소프트웨어 설치 따라 하기 워크플로 간단 설명 다른 예 DALL-E 3 이미지 아웃페인트 인페인트/아웃페인트란? 인페인트(inpainting)란 이미지의 일부만 다시 그리는 것을 말합니다. 옷이나 스타일을 바꾸고 싶거나 배경중 일부를 지우고 싶을 때 등에 사용합니다. 아래의 예에서는 얼굴을 새로 그렸습니다. SD1.5 초창기의 경우 손 발이 두개가 생기는 등의 오류가 많이 발생해서 인페인트는 거의 필수나 ..

다이내믹 프롬프트 사용법

이 글에서는 다이내믹 프롬프트를 사용하는 방법에 대해 말씀드립니다. 먼저 다이내믹 프롬프트가 무엇인지 간단하게 소개하고 AUTOMATIC1111에서 사용하는 방법, 그리고 ComfyUI에서 사용하는 방법을 설명합니다. 목차는 아래와 같습니다. Dynamic Prompt 란? AUTOMATIC1111 다이내믹 프롬프트 사용법 ComfyUI 다이내믹 프롬프트 사용법 다이내믹 프롬프트 문법 Dynamic Prompt 란? 다이내믹 프롬프트란, 프롬프트내의 일부 단어를 여러가지로 조합하여 사용할 수 있는 프롬프트를 말합니다. 예를 들어 "a {blue|yellow|red} flower" 이라는 프롬프트는 a blue flower/a yellow flower/a red flower 등 세 가지 프롬프트를 생성해 ..

스테이블 디퓨전 - 벤자민 버튼의 시간은 거꾸로 간다.

브레드 피트가 열연을 펼친 "벤자민 버튼의 시간은 거꾸로 간다"라는 영화를 보며, 자기에 맞는 얼굴을 갖는 게 얼마나 중요한지에 대해 생각했던 기억이 있습니다. 오늘 소개시켜드릴 워크플로도 사람이 점점 거꾸로 나이가 들어가는 동영상을 만드는 방법입니다. 이 기법은 ComfyUI + AnimateDiff 를 사용합니다. 아래는 생성 예입니다. 이 글의 목차는 아래와 같습니다. 소프트웨어 설정 따라 하기 참고사항 및 변경 방법 인생을 25초로 소프트웨어 설정 스테이블 디퓨전을 사용할 수 있는 GUI는 여러가지 종류가 있지만, 이 글에서는 ComfyUI를 사용합니다. ComfyUI가 처음이신 분은 설치 및 기본 사용 방법 및 초보자 가이드를 읽어보시기 바랍니다. 따라 하기 1 단계: 워크플로 불러오기 아래 그..

얼굴이 동일한 비디오를 빠르게 생성하기 - ComfyUI

이 글에서는 Video-to-video 기법, 즉 기존의 비디오를 소스로 해서 인물과 배경을 바꾼 새로운 비디오를 생성하는 기법을 설명합니다. 다만, 예전 글에서 설명한 것처럼, Video-to-video를 적용하면 화면이 번쩍거리던가 매 장면마다 사람 얼굴이 바뀌는 등의 문제가 발생하기 쉬운데, 여기서는 이런 문제를 해결한 비디오를 생성합니다. 여기서 다루는 사항은 아래와 같습니다. IP-adapter - 얼굴을 일관성있게 유지하는데 중요합니다. 다중 콘트롤넷 - 프레임간 움직임을 일정하게 유지하는데 중요합니다. AnimateDiff - 프레임간 일관성 유지에 필요합니다. 원래 짧은 비디오를 생성하는 img-to-video 모델입니다. LCM LoRA - 비디오 생성속도를 3배 이상 빠르게 합니다. D..

DALL-E 3와 Stable Diffusion XL 비교

DALL-E 3는 ChatGPT 혹은 "일상의 AI 컴패니언"을 표방하고 있는 마이크로소프트 Copilot에서 사용할 수 있습니다. 이 글에서는 DALL-E 3와 스테이블 디퓨전의 장단점을 비교해 보겠습니다. 아래는 이 글의 목차입니다. DALL-E 3란 스테이블 디퓨전이란 DALL-E 3와 Stable Diffusion XL 비교 프롬프트 이해 및 반영 텍스트 렌더링 스타일 인페인트와 아웃페인트 프롬프트 콘트롤넷 결론 DALL-E 3를 사용한 스테이블 디퓨전 개선 DALL-E 3란 DALL-E 3는 텍스트 문장을 이미지로 변환해주는 text-to-image 생성형 인공지능입니다. DALL-E 3의 학습 방법이나 모델 아키텍처는 제임스 벧커와 동료들이 저술한 "Improving Image Generati..

DALL-E 3 사용법 및 평가(Copilot)

저는 거의 스테이블 디퓨전을 사용해서 인공지능 이미지를 생성하지만, 이 글에서는 이미지 생성형 인공지능의 하나인 DALL-E 3 에 대해 알아보겠습니다. 이 글의 내용은 아래와 같습니다. DALL-E 3 개요 DALL-E 3 사용법 다른 예제 아이디어 탐구용 그림 생성 DALL-E 3 평가 DALL-E 3 개요 DALL-E 는 ChatGPT를 개발한 것으로 유명한 OpenAI에서 개발한 이미지 생성형 인공지능입니다. DALL-E 3는 2023년 9월 공개되었으며, 이전 모델에 비해, 그리고 경쟁 이미지 생성형 인공지능에 비해 프롬프트(문장 입력)를 훨씬 잘 반영하는 것으로 유명합니다. DALL-E 3 는 유료인 ChatGPT Plus에서 사용할 수 있으며, 마이크로소프트에서 "일상의 AI 컴패니언"이라고..