Stable Diffusion 76

Stable Diffusion - 콘트롤넷(ControlNet) 1.1 사용방법(1)

콘트롤넷(ControlNet)은 구도와 피사체의 자세를 복제할 수 있는 신경망입니다. 콘트롤넷에 관한 자세한 이론은 Lvmin Zhang 등이 저술한 Adding Conditional Control to Text-to-Image Diffusion Models를 참고하시기 바랍니다. 스테이블 디퓨전을 조금이라도 써보신 분은 아시겠지만, 생성되는 이미지가 원하는 자세를 갖도록 하는 것은 거의 불가능합니다. 자세 뿐만 아니라 배경이나 인물까지도 모두 무작위로 생성되기 때문입니다. 해결 방법은 그저 이미지를 많이 생성하는 것 뿐이었습니다. ControlNet을 사용하면 이런 문제를 어느 정도 해결할 수 있습니다. ControlNet을 사용하면 파사체를 어디에 둘지, 어떤 모습을 가지게 할지 등을 정확하게 제어할..

ChatGPT로 스테이블 디퓨전 프롬프트 만들기

요약 ChatGPT는 프롬프트를 사용하여 원하는 이미지를 생성하는 데 도움을 줄 수 있습니다. ChatGPT에 대한 간단한 소개 후, ChatGPT를 사용하여 프롬프트를 생성하는 방법을 예시로 소개합니다. 특히 영어에 약한 동양인으로서, ChatGPT로 프롬프트 작성법은 필수적이라고 생각합니다. 다만, 이 글을 읽어보기에 앞서, 프롬프트에 들어가면 좋은 키워드 등의 일반적인 프롬프트 작성법에 관한 글 읽어 보시면 이 글을 이해하는데 도움이 될 수 있습니다. 개요 스테이블 디퓨전을 사용해서 원하는 이미지를 생성하려면, 고 품질의 프롬프트가 필수입니다. 하지만, 영어가 딸리는 동양인으로서 고품질 프롬프트를 만드는 것은 쉽지 않습니다. 저도 대부분 civitai.com 등 인공지능 이미지 공유사이트에 올려진 ..

Stable Diffusion 인공지능 이미지 생초보 가이드

이 글은 Stable Diffusion 또는 다른 이미지 생성형 AI에 대해 거의 아무것도 알지 못하는 초보자를 위한 안내서입니다. (예전에 써둔 글을 새로운 내용을 추가하고 일부 수정하였습니다) 저도 그림은 하나도 그릴 줄 모르지만, 위와 같은 그림도 쉽게 생성할 수 있습니다(이 그림은 DALL-E 3에서 생성하고 스테이블 디퓨전으로 아웃페인트한 결과입니다). 이 글은 스테이블 디퓨전 초보자 가이드 중 첫번째 글입니다. Part 1 : 생초보 가이드 Part 2 : 프롬프트 작성법 Part 3 : 인페인트 Part 4 : 모델에 관한 모든 것 아래는 이 글에 포함된 내용입니다. 이미지 생성형 인공지능의 종류 스테이블 디퓨전(Stable Diffusion) 이란? Stable Diffusion 사용방법은..

AI 이미지 2023.06.26

스테이블 디퓨전으로 동물 이미지를 생성하는 방법

이 글은 AUTOMATIC1111 이라는 스테이블 디퓨전 GUI를 사용하여 동물 이미지를 생성하는 방법을 다룹니다. AUTOMATIC1111 설치방법은 이 글을 읽어보시기 바랍니다. 멋진 동물 사진을 위한 프롬프트 선정 방법 좋은 이미지를 만들려면 가장 중요한 것 중 하나가 좋은 프롬프트입니다. 이미지의 종류 목표가 사실적인 사진 이미지이므로, 먼저 "photo" 키워드를 사용합니다. photo of 주제 그 다음에는 어떤 피사체를 그리고 싶은지를 선택합니다. 다음은 예시입니다. Lion (사자) Pack of wolf(늑대 무리) Red panda (레드 판다) Peacock (공작) teacup kitty(티컵 크기 고양이) 장면 장면은 배경과 주변 풍경을 제어 합니다. 프롬프트에는 연관 효과(키워드..

Stable Diffusion - 체크포인트 모델에 관한 모든 것

이 글은 스테이블 디퓨전 초보자 가이드중 마지막 글입니다. Part 1 : 생초보 가이드 Part 2 : 프롬프트 작성법 Part 3 : 인페인트 Part 4 : 모델에 관한 모든 것 스테이블 디퓨전 모델(model), 혹은 체크포인트(checkpoint) 모델은 일반적인 이미지 혹은 특정한 장르의 이미지를 생성하기 위한 목적으로 미리 학습된 스테이블 디퓨전 가중치(weight)입니다. 어떤 모델이 생성할 수 있는 이미지는 모델 학습에 사용된 이미지에 의해 결정됩니다. 고양이를 학습하지 않은 모델을 사용해서는 고양이를 생성할 수 없고, 고양이만 학습한 모델이라면 고양이 말고는 아무것도 생성하지 못합니다. 이 글에서는 모델이 무엇이고, 널리 사용되는 모델의 특성, 설치방법, 사용방법 등을 설명합니다. 설치..

Stable Diffusion으로 멋진 이미지 만들기

이 글은 제가 Stable Diffusion에 관한 글을 쓰면서, 원하는 이미지를 생성하는 방법에 관한 글을 모아둔 글입니다. 제가 Stable Diffusion에 대해 쓴 글 아래에는 모두 스테이블 디퓨전에 대해 알아두어야 할 사항들을 링크로 모아두었는데, 이미지 생성하는 방법은 아주 많고, 앞으로도 계속 늘어날 것 같아서 여기에 모아두기로 한겁니다. 계속 추가하겠습니다. Stable Diffusion으로 사실적인 인물 사진을 생성하는 방법 AI로 그린 흑인 인어 공주 사진 스테이블 디퓨전을 사용해서 비디오 만들기(Video2Video) 스테이블 디퓨전으로 QR 코드 만들기 Stable Diffusion 텍스트 효과 Stable Diffusion 조명 효과 스테이블 디퓨전 - 신비로운 테라리움과 수초어..

스테이블 디퓨전 - 신비로운 테라리움과 수초어항 생성하기

준비할 사항 Stable Diffusion AUTOMATIC1111 Web-UI를 사용합니다. 설치방법은 여기를 읽어보세요. Google Colab으로 구동할 수도 있고 Mac에도 설치할 수 있지만, 저는 윈도를 기준으로 설명합니다. 이 글에서는 Lyriel 모델을 사용합니다. Lyriel 모델은 전반적으로 어둡고 일러스트레이션 스타일의 이미지를 생성합니다. 또한 ControlNet도 사용하므로 ControlNet 설치 및 사용방법을 확인하세요. 1단계: Text-to-Image 파라미터 설정 프롬프트: spherical Terrarium, abstract dream, flower, brushes, ivy, foliage, wild, orb, fantasy, complex, gemstone, highly..

Stable Diffusion 조명 효과

조명과 관련된 키워드를 넣어주면 사진이 확 달라진다는 것은 잘 알려진 사실입니다. 이 글에서는 별도의 설명없이 그냥 여러가지 조명 관련 키워드를 넣었을 때의 효과를 보여드리겠습니다. 공통 설정사항은 아래와 같습니다. 모델 : DreamShaper v6 프롬프트: fashion photography, a woman 부정적 프롬프트: disfigured, ugly, bad, immature, cartoon, anime, 3d, painting, b&w, nsfw Width= 512, Height=768 CFG Scale: 7 Seed : 94858136 – 94858143 (시드번호에 94858136을 넣고 8장씩 돌리고 두개씩 골랐습니다.) 동일한 시드번호와 동일한 프롬프트를 사용하면 대부분 동일한 사진이..

Stable Diffusion 텍스트 효과

Stable Diffusion 을 사용해서 이미지를 생성하다보면 가끔 글씨가 포함되는 경우가 있습니다. 하지만, 대부분의 경우 무슨 내용인지 모르는 경우가 대부분이죠. 이번 글에서는 스테이블 디퓨전 ControlNet을 사용해서 텍스트를 만드는 방법을 알아보겠습니다. 방법 1 : ControlNet과 txt2img 사용 1. 아래처럼 검은 바탕에 흰색 글씨의 이미지를 만듧니다. 그림의 크기는 768x512 입니다. 2. AUTOMATIC1111 에서 txt2img 페이지를 엽니다. 3. ControlNet 부분을 펼치고 위에서 만들었던 이미지를 불러옵니다. 이 이미지는 depth map으로 사용합니다. Depth map에서 하얀색이 앞쪽을 나타내므로 글씨가 앞으로 튀어나오는 효과가 만들어집니다. 4. 콘..

스테이블 디퓨전으로 QR 코드 만들기

제가 구독하고 있는 (그리고 제일 많이 참고하는) stable-diffusion-art.com에 재미있는 글이 올라왔습니다. 스테이블 디퓨전으로 QR 코드를 제작할 수 있다는 내용입니다. 흑백에 네모네모한 QR 코드가 스테이블 디퓨전과 전혀 관계가 없을 것 같은데, 아래와 같은 걸 만든다는 겁니다. 보기에는 그냥 점들이 군데 군데 있는 것 빼고는 평범한 그림일 듯 싶고, QR 코드 냄새는 별로 안나는데도, QR코드 스캐너를 사용하면 진짜 읽히기까지 합니다!! (잘 읽히지 않으면 그림 크기를 변경하거나 카메라를 앞뒤로 움직여 보세요. 인식이 잘되는 건 아닙니다. 제 경험으로는 초점이 흐릿하게 잘 맞지 않을 때 인식이 더 잘되는 것 같더군요~ ㅎㅎ) 이 사이트의 주인장 Andrew씨도 Reddit 에 올라온..