Text-to-video는 말 그대로 단어로 쓰여진 설명을 사용해 비디오를 생성하는 매우 까다로운 작업입니다. 디퓨전 기반의 text-to-video 모델은 매우 빠른 속도로 발전하고 있습니다. 이 글에서는 자신의 PC에서 직접 사용할 수 있는 text-to-video 모델 중 가장 유명한 것중 하나인 AnimateDiff를 소개하고 그 작업과정을 보여드립니다. 참고: 2023년 9월 10일에 AnimateDiff v1.5_v2가 공개되어, 기존에 작성된 글을 수정합니다. 이 글에 있는 내용을 따라해보기 위해서는 먼저 AUTOMATIC1111을 설치하여야 합니다. AUTOMATIC1111은 Mac, 구글 Colab에서도 사용할 수 있지만, 저는 윈도 버전 설치방법만 설명하였으니 참고하세요. 1. Anim..