Stable Diffusion은 생성형 AI(인공지능), 그중에서도 단어를 입력하면 그림을 생성해주는(text-to-image) 생성형 AI로서, 2022년 8월에 오픈소스로 공개된 인공지능 모델입니다. 며칠전부터 좌충우돌하며 만지고 있다가 까먹기 전에 정리해 두면 좋겠다 싶어서 오랜만에 블로그 카테고리도 추가하고 본격적으로 써보려고 합니다.
===
얼마전 MidJourney라는 사이트를 이용해 작성한 그림이 모 미술전에서 1등을 차지하였다는 뉴스 이후, 저도 자연스럽게 이 사이트에 관심을 갖게 되었습니다. 아래가 그 그림(스페이스오페라극장)입니다. 사실 이 그림을 보며 큰 충격을 받았습니다. 실제로 그린게 아니라 단어를 적당히 입력하기만 하면 그림이 그려진다니... 저처럼 그림에는 소질이 없는 사람이라면, 누구나 놀라지 않을 수 없을 겁니다. 물론 그림을 전공한 저희 집사람도 놀라긴 마찬가지지만요.^^
아래는 이걸 보고 제가 이 사이트에서 처음으로 그려본? 그림입니다. 입력한 문고는 "beautiful girl with red hari"였습니다. 맞습니다. (hair라고 쳐야 하는데 오타가 있었습니다^^) 단 5마디 단어만으로 이렇게 그림을 그려진다니... 지금도 그 때의 충격이 느껴질 정도입니다. (그런데 이 그림의 최종본은 없습니다. 맨 처음 입력해본 거라 이렇게 4컷으로 만들어지는 게 최종결과물인줄 알았거든요. 원래 이 중에서 마음에 드는 걸 선택한 후 조금씩 변형시켜가며 자신이 원하는 결과물을 만드는 건데 그것도 몰랐더랬습니다. ㅎㅎ)
이거 말고도 몇개 더 만들었습니다. 그중 그럴 듯한 거 하나만 더 보여드리면... 아래는 "20 years old asian girl with red hair and dark blue eye"라고 입력하고, 별도로 고흐의 별 헤는 밤을 관련 이미지로 넣어서 생성해 본 겁니다.
아무튼 이렇게 몇번 놀다가 그만 뒀습니다. 무료로 사용하면 횟수 제한이 있었던 것 같고... 제가 사용한 입문자(Novice)용 게시판에 워낙 사람이 많아서 휙휙 지나가는 바람에 편하지 않은 점도 있었는데... 무엇보다 제가 이렇게 인공지능으로 그림을 그린다는 게 무슨 의미가 있을지, 무슨 쓸모가 있지? 하는 생각이 들어서였습니다.
그렇게 잊고 지내다가, 엊그제 새로운 생성형 인공지능... 사진을 올리면 목소리와 함께 약간씩 움직이는 형태의 비디오를 만들어주는 사이트였습니다. 이 사이트를 이용할 때, 원래 사이트에서 제공해주는 인물과 목소리를 사용해도 되지만, 아무래도 주로 서양쪽 인물들 위주이기 때문에, 적절한 사진을 구해서 올리고, 인공지능 목소리 생성 사이트에 들어가 목소리를 생성해 올려주면 적절한 비디오를 생성해 줍니다. (자세한 건 생략합니다^^) 아래가 이렇게 만든 비디오입니다. 아는 형님 놀려먹기위한 목적이니 이해해 주시길~
===
이것을 만들기 위해 필요한 것중 하나가 예쁜 여성의 사진?이었습니다. 위 비디오에 등장한 여성 사진은 구글에서 "인공지능 여성 사진" 정도로 검색해서 그나마 선정성이 낮은 걸로 선택했던 것 같습니다. 아무튼 이렇게 검색을 하다보니, 인공지능을 이용해 생성한 사진이 매우 많다는 걸 알게 되었습니다. 그중에서는 실사 사진인지 인공지능이 생성한 사진인지 구분하기가 힘든 사진도 많았고요. 이 때문에 급 흥미가 생겨서 여기저기 뒤적거리다가 결국 관련 프로그램을 구해서 생성하게 되었고, 그러다보니 이렇게 글까지 작성하게 되었습니다.
다들 느끼겠지만, 사진이나 비디오 뿐만 아니라, 다양한 분야에서 인공지능이 인간의 영역을 침범하고 있습니다. 제일 빨리 사라질 직업중의 하나가 법조계 그중에서도 변호사라고 할 정도로 저급 일자리 뿐만 아니라 고급 일자리까지도 인공지능의 영향을 받기 시작하고 있습니다. 시간이 지날수록 이러한 현상은 더욱 가속화되겠죠. 인터넷이나 스마트폰이 처음 등장하던 때를 돌이켜 봤을때 세상이 이렇게 달라질 거라 생각하지 못했던 것처럼, 인공지능이 바꿀 세상은 지금으로서는 짐작할 수 없을 정도인 건 확실합니다.
저는 인공지능 전문가도 아니고, 개발 전문가도 아니고 그저 일반 사용자에 불과합니다. 그냥 뒤쫒아가면서 조금이라도 이해를 넓혀가고자 이 테마를 시작합니다.
마치기 전에... 생각난 김에 ChatGPT에 "인공지능 적용분야가 점점 넓어지는데 대한 일반인들의 대응방법"에 대해 한번 물어봤습니다. 그랬더니 1. 계속해서 학습하고 개발하기, 2. 다양한 산업의 변화를 살펴보기, 3. 인공지능 기술에 대한 이해를 높이기, 4. 인공지능의 윤리적인 문제에 대해 생각하기... 정도를 생각해봐야 한다고 말하네요. 어쨌든 인공지능 기술이 우리의 삶을 크게 변화시킬 것은 자명하고, 이에 대처할 방법에 대해 고민하고 적극적으로 활용하는 것이 중요하다고 합니다. ㅎㅎ
민, 푸른하늘
추가: 이후에 본격적으로 스테이블 디퓨전을 공부하고 있습니다. 아래 링크들이 도움이 되실 겁니다.
- Stable Diffusion 인공지능 이미지 생초보 가이드
- Stable Diffusion 대표 UI - AUTOMATIC1111 설치방법
- Automatic1111 GUI: 초보자 가이드(메뉴 해설)
- Stable Diffusion에 대한 기본적인 이론
- ChatGPT로 스테이블 디퓨전 프롬프트 만들기
- Stable Diffusion - 인페인트 가이드
- Stable Diffusion - 모델에 대한 모든 것
- Stable Diffusion - LoRA 모델 사용법
- Stable Diffusion - ControlNet 사용법(1)
- Stable Diffusion - ControlNet 사용법(2)
- Stable Diffusion - 하이퍼네트워크 사용법
- Stable Diffusion - AI 확대도구 사용법
- Stable Diffusion - 구역분할 프롬프트 사용법
- Stable Diffusion으로 멋진 이미지 만들기