AI 이미지/AI Video 43

Flux-CogVideo 워크플로(ComfyUI)

이 워크플로는 Flux AI 모델을 사용하여 고품질 이미지를 생성하고 이를 CogVideo를 사용해 비디오로 전환하는 워크플로입니다. 이렇게 하면 텍스트 프롬프트만으로도 비디오를 생성할 수 있을 뿐 아니라, 원래의 CogVideo txt2vid 모델보다 품질이 좋은 비디오를 생성할 수 있습니다.소프트웨어따라하기소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 요즘 가장 널리 사용되고 있는 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.따라하기1 단계: Flux1 dev GGUF 모델 다운로드여기에는 간단하게만 정리했습니다. 더 자세한 내용은 이 글을 참고하세요.GGUF unet 모델아래 사이트에서 파일을 다운로드 받아, Comfy..

ComfyUI에서 CogvideoX GGUF 사용하기

CogVideo는 자신의 PC에서 돌릴 수 있는 최신 AI 비디오 생성기 입니다. 이 글에서는 ComfyUI에서 Cogvideo를 사용하는 방법을 설명합니다.소프트웨어CogvideoX 란?Txt2Vid따라하기Img2Vid따라하기참고소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 요즘 가장 널리 사용되고 있는 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.참고 :이 글에서는 Flux Dev GGUF 포맷을 사용합니다. GGUF에 대한 좀 더 자세한 사항은 이 글을 참고하세요.CogvideoX 란?현재 여러가지 text-to-video / img-to-video모델 및 서비스가 나와 있습니다. 그중에서도 CogVideoX는 텍스트-..

Flux GGUF + SVD 비디오 워크플로(ComfyUI)

이 워크플로는 높은 품질의 이미지를 생성하는 Flux1 dev 모델과, 이미지로부터 비디오를 생성하는 Stable Video Diffusion(SVD)를 결합하여 짧은 비디오를 생성하는 워크플로입니다.소프트웨어따라하기다른 예제소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제가 제일 좋아하는 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.참고 :이 글에서는 Flux Dev GGUF 포맷을 사용합니다. GGUF에 대한 좀 더 자세한 사항은 이 글을 참고하세요. 따라하기1단계: 모델 다운로드GGUF unet 모델저는 Flux dev GGUF 모델을 사용합니다(참고 Schnell 모델). 링크에 들어가면 아래와 같이 여러개의 파일이 ..

ComfyUI SVD 무비

이 ComfyUI 워크플로는 세 개의 이미지를 생성한 후, 각각을 기반으로 Stable Video Diffuision 비디오를 생성하고, 이들을 결합해 하나의 비디오로 만드는 워크플로입니다.소프트웨어따라하기비디오 변경 방법소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제가 제일 좋아하는 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.따라하기1단계: 모델 다운로드SVD TX 1.1 모델을 다운로드 받아야 합니다. 먼저 여기에서 사용 동의서를 작성한 후, 여기에서 모델을 다운로드 받으시면 됩니다. 이미지 생성에는 JuggernautXL 모델을 사용합니다. 이 두 개의 모델을 다운받은 후에는 ComfyUI\models\checkpo..

Hunyuan video LoRA

LoRA(Low-Rank Adaptation)은 Flux나 Stable Diffusion과 같은 이미지 모델을 세부 조정(finetuning)하는 기술로서 탄생했습니다. 모델 매개변수 일부를 조정하는 것에 초점을 맞춤으로써, LoRA는 전체 모델을 다시 학습할 필요 없이 효과적으로 미세조정을 할 수 있습니다.그런데, 대형 비디오 모델로서는 처음으로, Hunyuan Video 에서 LoRA를 사용할 수 있게 되었습니다.이번 글에서는 Hunyuan Video에 LoRA를 사용하는 방법을 알려드립니다. 이 기법에는 여러개의 LoRA를 사용하여 아래와 같은 장면에서 일관성있는 캐릭터를 생성할 수 있습니다.소프트웨어Hunyuan LoRA의 작동 원리사용 사례하나의 LoRA를 사용하는 워크플로두 개의 LoRA를 사..

Hunyuan 비디오를 이미지와 함께 사용하기

Hunyuan video는 텍스트 설명을 비디오로 바꾸어주는 비디오 모델입니다. 하지만 이미지를 비디오로 바꾸려면 어떻게 해야 할까요? 해답은 Image-to-video 모델입니다만, 아쉽게도 Hunyuan은 아직 공개하지 않고 있습니다. 만약 나온다면 일약 게임 체인저가 될텐데요. 당분간은 Image Prompt를 사용해 비디오를 제작하는 IP2V 를 사용해 비슷한 효과를 얻어야 합니다.이 워크플로는 이미지와 프롬프트를 입력받아 비디오를 생성합니다. 예를 들어, 배경이미지를 제공하고 프롬프트로 사람을 추가하면 아래와 같은 이미지를 생성할 수 있습니다.소프트웨어작동 원리Img2Vid와 IP2V의 차이유즈케이스따라하기이미지 프롬프트 조정소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제가 제일 좋아하..

Hunyuan Video 사용방법 (ComfyUI)

Hunyuan 비디오는 놀라움 품질의 비디오를 생성할 수 있는, 자신의 PC에서 돌릴 수 있는 새로운 오픈소스 비디오 모델입니다. 텍스트 프롬프트를 입력하면 몇 분만에 짧은 비디오 클립을 생성할 수 있습니다. 비디오에 B-roll(보조 영상)을 삽입하고자 하는 유튜버와 같은 크리에이터에게 필수라고 할 수 있을 것 같습니다.아래는 Hunyuan Video의 예입니다.A panda riding a motorcycle in a busy New York City street, camera zooms out.이 글에서는 Hunyuan Video를 사용하여, Text-to-Video 및 Image-to-Video 모드로 비디오를 생성하는 방법을 설명합니다.소프트웨어Hunyuan Video의 원리생성 시간하드웨어 요..

LTX 비디오

LTX Studio, Facetune, Videoleap 등의 앱을 개발한 Lightricks가 최초의 비디오 생성 모델인 LTX Video 0.9를 공개했습니다. 이 모델은 오픈소스이며, 5초짜리 AI 비디오를 단 4초만에 생성할 수 있다고 주장하고 있습니다.LTX는  5초짜리 768x512 해상도 (24 fps)의 비디오를 단 4초만에 생성할 수 있는 "실시간 비디오 생성기"라고 주장합니다. 여기에 사용된 하드웨어는 Nvidia H100 GPU를 사용했는데,  RTX4090의 경우엔 4초짜리 비디오를 10초 이내에 생성할 수 있습니다. RTX 3070의 경우에는 약 50초 정도 소요되고요.LTX  모델은 이 디퓨전 트랜스포머(DiT) 아키텍처를 사용하며, 모델의 크기가 20 억개로 작아서, 6 GB ..

춤추는 스파게티

어떤 물체를 춤추게 한다는 아이디어를 생각해 본 적이 있으신가요? 이 글에 있는 ComfyUI 워크플로를 사용하면 쉽게 생성할 수 있습니다 이 예제 워크플로는 댄싱 비디오를 춤추는 스파게티로 전환해 줍니다.소프트웨어이 워크플로의 원리따라하기비디오 변경소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제가 제일 좋아하는 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.이 워크플로의 원리이와 비슷한 작업을 두개의 샘플링 패스로 구현한 사례가 있지만, 이는 불필요합니다. 여기서는 단일 샘플링 패스를 사용해 동일한 결과를 얻는 방법을 보여드리겠습니다 입력 비디오는 흰색 피사체와 검은색 배경으로 이루어집니다. 이러한 비디오는 Depth 전처..

천사의 패션쇼

이 글은 아래의 비디오를 생성하는 따라하기 워크플로를 소개합니다.소프트웨어따라하기소프트웨어이글에서는 SD Forge 웹UI에서 Flux AI 모델을 사용하여 이미지를 생성하고, 이 이미지를 사용하여 Kling AI 서비스를 이용해 고품질 비디오로 전환합니다. 따라하기1단계: 소프트웨어 준비VRAM이 적은 PC에서 Flux AI 실행시키기에 따라 소프트웨어 및 Flux1 dev NF4 모델을 준비합니다. 2단계: 이미지 생성SD Forge 웹UI를 열과 아래와 같이 설정합니다.UI: fluxCheckpoint: flux1-dev-bnb-nf4-v2.safetensors프롬프트: An angel with large wings, blonde, exquisite clothes walking on a catwal..