AI 이미지/Stable Diffusion 53

SDXL : 고해상도 이미지 합성을 위한 디퓨전 모델 개선

스테이블 디퓨전의 후속모델인 SDXL 이 공개되었습니다. 베타버전에 이어 0.9 버전이 공개되었으며, 조만간 정식으로 공개될 예정으로 있습니다. 이 글은 0.9에서 어떤 부분을 개선했는지에 대한 stability.ai 사의 개발진이 작성한 논문입니다. 이 논문은 SDXL의 기술적인 측면을 다루고 있기 때문에 사용법만 알고싶은 분들은 그냥 읽지 않으셔도 무방합니다. 그냥 SDXL이 스테이블 디퓨전 1.5/2.1 보다 매우 성능이 뛰어나다고만 아시면 충분합니다. SDXL은 스테이블 디퓨전 1.5 및 2.1에 비해 매우 높은 수준의 이미지를 생성할 수 있습니다. 스테이블 디퓨전 1.5에서는 프롬프트외에도 LoRA나 ControlNet과 같은 보조적인 기법을 동원하고, 잘못된 이미지는 인페인트로 수정하는 등 여..

SDXL 0.9로 AI 이미지 생성 - Clipdrop

한달전, 스테이블 디퓨전을 개발해서 오픈 소스로 공개한 stability.ai에서 그 후속 모델인 SDXL 을 공개했습니다. 현재 사용가능한 버전은 0.9이며, 7월 중순에 1.0을 공개할 예정이라고 합니다(오늘 18일이니 약속시간이 좀 지난듯) 자세한 내용은 보도자료 글을 읽어보시면 됩니다. 스테이블 디퓨전 UNET의 매개변수는 8억 6천만개 정도인데, SDXL 0.9는 매개변수가 100억개 정도로 늘어나서 더 세밀하고 구도가 뛰어난 이미지를 생성할 수 있다고 합니다. 기본 생성 이미지의 해상도도 1024x1024로 커졌고요. 그래서... 이걸 사용해보고 싶기는 하지만, 현재는 AUTOMATIC1111에서 기본으로 지원하지 않고 확장으로 겨우겨우 시험해 볼 수 있는 상태에서 테스트가 만만하지는 않습니다..

SDXL 0.9: AI 이미지 생성의 혁신

한달전, Stable Diffusion을 개발한 stability.ai에서 Stable Diffusion의 후속 모델인 SDXL (Stable Diffusion XL) 베타 버전에 이어 0.9 버전을 발표했습니다. 얼마 후에는(원래 발표에 따르면 7월 중순이니까 이미 발표되었어야 하지만) 1.0이 정식 공개될 예정으로 있고요. 제가 아직 전체적으로 돌아보지는 못했지만, 아래와 같이 여러가지 도구들을 따로따로 분리해서 사용할 수 있어, 일반인들이 사용하기는 편리해질 듯 싶습니다. https://clipdrop.co/stable-diffusion 에 들어가면 직접 테스트 가능합니다. 또한 사용하는 파라미터 수가 대폭 늘어나서 훨씬 디테일이 살아있고 구도가 안정적인 이미지가 생성된다고 하네요. 아래는 위 사이..

DreamBooth 사용법 - Colab

며칠전에 DreamBooth 에 대한 소개 글을 올렸습니다. 간단히 요약하면, 나만의 피사체(우리 가족이나 우리집 멍뭉이, 내가 좋아하는 피규어, 내가 이번에 산 책등)의 사진을 4-5장 정도만 학습시켜 인공지능 이미지 생성에 사용할 수 있다는 내용입니다. 이미지 생성형 인공지능으로 자기 자신이던 누구던 아무나 끼워넣을 수 있고, 어떤 배경으로도 이미지를 생성할 수 있다는 겁니다. 그러고 보면 Dream(꿈) Booth(칸막이 공간), 즉 꿈의 사진관이라고 할까요... 드림부스를 설치하고 사용하는 방법에 대한 글 그리고 영상이 여기저기 올라와 있습니다만, 저도 나름대로 정리해보고자 합니다. 그런데.... 원래는 AUTOMATIC1111 에 Dreambooth 확장을 붙여서 학습하는 방법을 생각했었습니다...

DreamBooth 소개

인공지능 이미지 고유사이트를 돌아다니면서 만난 멋진 이미지를 따라 해보는 등 스테이블 디퓨전으로 이런 저런 이미지를 생성하다보면, 자신이 좋아하는 대상을 이미지로 표현해보고 싶은 욕구가 생기기 마련입니다. 우리집 멍뭉이, 내가 가지고 있는 피규어, 내가 이번에 산 책 등을 이미지로 표현하는 거죠. 이렇게 어떤 피사체를 이미지로 표현하기 위해서는 먼저 해당 피사체를 학습시켜 모델을 만들어야 합니다. 일반적으로 체크포인트 모델을 학습시키는 것이 가장 확실하지만, LoRA, 하이퍼네트워크, 텍스트 인버전 등을 학습시키는 방법도 존재합니다. 체크포인트는 모든 피사체의 모든 부분을 다 학습시키지만, 나머지는 인공지능 모델 중 일부만 학습시키는 방법입니다. 자세한 내용은 스테이블 디퓨전 기본 이론을 읽어보시기 바랍..

스테이블 디퓨전 프롬프트 작성법

요약 이 글은 스테이블 디퓨전에서 AI 이미지 작품을 생성하기 위한 좋은 프롬프트 작성법을 다룹니다. 좋은 이미지를 생성하기 위해 프롬프트에 피사체, 이미지 종류, 스타일, 예술가, 웹사이트, 해상도, 색상, 조명, 추가적인 세부사항 등을 포함하는 것이 좋습니다. 또한, 프롬프트 작성에는 자세하고 구체적인 설명, 괄호를 사용하여 가중치를 조절하는 등의 팁을 활용할 수 있습니다. 이러한 디테이블 디퓨전의 프롬프트 관련 문법/제한 등을 설명합니다. 이 글은 스테이이블 초보자 가이드중 네번째 글입니다. Part 1 : 생초보 가이드 Part 2 : 프롬프트 작성법 Part 3 : 인페인트 Part 4 : 모델에 관한 모든 것 참고: 이 글을 읽고 실제 프롬프트를 작성할 때에는 chatGPT로 프롬프트를 만드는..

ChatGPT로 스테이블 디퓨전 프롬프트 만들기

요약 ChatGPT는 프롬프트를 사용하여 원하는 이미지를 생성하는 데 도움을 줄 수 있습니다. ChatGPT에 대한 간단한 소개 후, ChatGPT를 사용하여 프롬프트를 생성하는 방법을 예시로 소개합니다. 특히 영어에 약한 동양인으로서, ChatGPT로 프롬프트 작성법은 필수적이라고 생각합니다. 다만, 이 글을 읽어보기에 앞서, 프롬프트에 들어가면 좋은 키워드 등의 일반적인 프롬프트 작성법에 관한 글 읽어 보시면 이 글을 이해하는데 도움이 될 수 있습니다. 개요 스테이블 디퓨전을 사용해서 원하는 이미지를 생성하려면, 고 품질의 프롬프트가 필수입니다. 하지만, 영어가 딸리는 동양인으로서 고품질 프롬프트를 만드는 것은 쉽지 않습니다. 저도 대부분 civitai.com 등 인공지능 이미지 공유사이트에 올려진 ..

스테이블 디퓨전으로 동물 이미지를 생성하는 방법

이 글은 AUTOMATIC1111 이라는 스테이블 디퓨전 GUI를 사용하여 동물 이미지를 생성하는 방법을 다룹니다. AUTOMATIC1111 설치방법은 이 글을 읽어보시기 바랍니다. 멋진 동물 사진을 위한 프롬프트 선정 방법 좋은 이미지를 만들려면 가장 중요한 것 중 하나가 좋은 프롬프트입니다. 이미지의 종류 목표가 사실적인 사진 이미지이므로, 먼저 "photo" 키워드를 사용합니다. photo of 주제 그 다음에는 어떤 피사체를 그리고 싶은지를 선택합니다. 다음은 예시입니다. Lion (사자) Pack of wolf(늑대 무리) Red panda (레드 판다) Peacock (공작) teacup kitty(티컵 크기 고양이) 장면 장면은 배경과 주변 풍경을 제어 합니다. 프롬프트에는 연관 효과(키워드..

Stable Diffusion - 체크포인트 모델에 관한 모든 것

이 글은 스테이블 디퓨전 초보자 가이드중 마지막 글입니다. Part 1 : 생초보 가이드 Part 2 : 프롬프트 작성법 Part 3 : 인페인트 Part 4 : 모델에 관한 모든 것 스테이블 디퓨전 모델(model), 혹은 체크포인트(checkpoint) 모델은 일반적인 이미지 혹은 특정한 장르의 이미지를 생성하기 위한 목적으로 미리 학습된 스테이블 디퓨전 가중치(weight)입니다. 어떤 모델이 생성할 수 있는 이미지는 모델 학습에 사용된 이미지에 의해 결정됩니다. 고양이를 학습하지 않은 모델을 사용해서는 고양이를 생성할 수 없고, 고양이만 학습한 모델이라면 고양이 말고는 아무것도 생성하지 못합니다. 이 글에서는 모델이 무엇이고, 널리 사용되는 모델의 특성, 설치방법, 사용방법 등을 설명합니다. 설치..

Stable Diffusion 조명 효과

조명과 관련된 키워드를 넣어주면 사진이 확 달라진다는 것은 잘 알려진 사실입니다. 이 글에서는 별도의 설명없이 그냥 여러가지 조명 관련 키워드를 넣었을 때의 효과를 보여드리겠습니다. 공통 설정사항은 아래와 같습니다. 모델 : DreamShaper v6 프롬프트: fashion photography, a woman 부정적 프롬프트: disfigured, ugly, bad, immature, cartoon, anime, 3d, painting, b&w, nsfw Width= 512, Height=768 CFG Scale: 7 Seed : 94858136 – 94858143 (시드번호에 94858136을 넣고 8장씩 돌리고 두개씩 골랐습니다.) 동일한 시드번호와 동일한 프롬프트를 사용하면 대부분 동일한 사진이..