AI 이미지/AI Video 43

생성속도가 더 빠른 Hunyuan Video 워크플로

Hunyuan Video는 자신의 PC에서 돌릴 수 있는 여러가지 비디오 모델중 가장 품질이 좋은 축에 속하는 모델입니다. 거기다가 다른 모델에 비하면 속도도 상당히 빠른 편입니다. Hunyuan Video 는 텍스트-비디오, 참조이미지를 사용한 비디오, 이미지-비디오 등을 지원하며, LoRA와 함께 사용하는 것도 가능한, 다재다능한 모델입니다.다만, 많은 사용자들이 지적하는 가장 큰 문제는 생성 속도가 상당히 늦다는 것이었습니다. (49 프레임, 480p 비디오를 생성할 때 약 6분 정도 소요되었습니다. 여기를 읽어보세요) 이 글에서는 Hunyuan 이미지-비디오 생성속도를 3배 올리는 방법을 소개시켜드립니다. 소프트웨어Hunyuan 이미지-비디오 모델 개요Hunyuan 이미지-비디오(Image-to-..

Teacache와 Sage Attention을 사용해 Wan 2.1 비디오를 빠르게 생성하기

Wan 2.1 비디오는 자신의 PC에서 사용할 수 있는 최신 비디오 생성형 AI 모델입니다. 하지만, 좋은 품질의 비디오를 생성하려면 상당한 시간이 소요됩니다(제 RTX 3070을 사용할 경우, 720p 비디오는 2시간, 480p 비디오는 20분 정도 소요됐습니다). 특히 여러 비디오를 생성해서 좋은 것을 선택해야 하므로, 생성에 필요한 시간은 막대한 수준입니다.이 글에서 소개하는  Wan 2.1 워크필로는 Teacache와 Sage Attention을 사용하여 생성시간을 약 30%가량 줄여줍니다. 머... 한 70% 정도 줄여주면 좋겠지만, 이정도로도 감지덕지 해야죠.소프트웨어속도가 빨라지는 원리Fast Wan 2.1 Teacache/Sage 어텐션 워크플로이미지-비디오(Image-to-Video) 따..

캐릭터 찌그러뜨리기 - Wan 2.1 LoRA

Wan 2.1 Video는 소비자용 컴퓨터를 사용해서 고품질의 비디오를 생성할 수 있는 생성형 인공지능 비디오 모델입니다. 그런데, AI 비디오 기업 중 하나인 Remade AI에서 Wan 2.1 Video를 위한 재미있는 LoRA모델을 공개했습니다. 보통의 LoRA는 특정 캐릭터나 스타일을 만들어 넣는 것이 보통이지만, 이 LoRA는 Wan 2.1 비디오에 캐릭터를 회전시키거나 찌브러뜨리거나 부풀리는 등의 특수 효과를 넣어주는 역할을 합니다. rotate 소프트웨어Remade LoRA for Wan 2.1 VideoLotation LoRA 따라하기다른 LoRA 사용하기소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제일 강력하며, 현재 거의 대세로 자리잡고 있는 ComfyUI를 사용합니다. Com..

LTX Video 0.9.5

LTX Video 0.9.5는 예전에 소개시켜 드렸던 LTX 비디오 모델의 업그레이드 버전입니다. 이 모델은 매우 빠르게 비디오를 생성할 수 있는 것이 장점입니다. RTX 4090의 경우 4초짜리 비디오를 17초만에 생성할 수 있다고 합니다.소프트웨어LTXV 0.9.5에서 개선된 사항LTXV 0.9.5 Text-to-Video 워크플로 따라하기LTXV 0.9.5 Image-to-Video 워크플로 따라하기첫 프레임과 마지막 프레임을 지정한 비디오참고사항소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제가 제일 좋아하는 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.LTXV 0.9.5에서 개선된 사항라이선스LTXV 0.9.5는 상..

Hunyuan 이미지-비디오 (ComfyUI)

Hunyuan 비디오 모델은 오픈소스 AI 커뮤니티에서 엄청하게 호평을 받고 있습니다. Hunyuan 비디오는 텍스트-비디오(Text-to-Video) 뿐만 아니라, 참조 이미지를 사용해 비디오를 제작하는 방법도 있고, LoRA 모델과 함께 사용할 수도 있습니다.하지만, 지금까지는 비디오 모델에서는 가장 중요하다고 생각되는 이미지-비디오(Image-to-Video) 기능이 없었습니다. 그런데 이제 Hunyuan 이미지-비디오 모델을 사용할 수 있겠다는 소식입니다.소프트웨어Hunyuan 이미지-비디오 모델 개요Hunyuan 이미지-비디오(Image-to-Video) 따라하기참고소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제일 강력하며, 현재 거의 대세로 자리잡고 있는 ComfyUI를 사용합니다. ..

Wan 2.1 Video 모델로 비디오 생성하기(ComfyUI)

Wan 2.1 Video는 일련의 개방형 인공지능 비디오 생성 모델입니다. 이 모델은 다양한 비디오 생성을 지원합니다. 텍스트-이미지 및 이미지-비디오를 지원할 뿐 아니라, 특히 480p(720x480) 또는 720p(1280x720) 해상도의 비디오를 생성할 수 있습니다. 소프트웨어Wan 2.1 샘플 비디오Wan 2.1 모델이란이미지-비디오(Image-to-Video) 따라하기텍스트-비디오(Text-to-Video) 따라하기결론소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제일 강력하며, 현재 거의 대세로 자리잡고 있는 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.Wan 2.1 샘플 비디오아래의 남자가 나타나는 비디오는 이..

알리바바, Wan 2.1 공개

2025년 2월 25일, 알리바바에서 고급 비디오 생성 작업을 위해 설계된 오픈 소스 AI 모델인 Wan 2.1을 공개했습니다. 2025년 2월의 공식적으로 공개되었으며, 현재 Apache 2.0 라이선스하에 자유롭게 사용할 수 있어, 전세계의 개발자들이나 기업들이 거의 아무런 제한없이 사용할 수 있습니다.Wan 2.1 이란?중요 기능 및 벤치마크 성능Wan 2.1을 Latenode의 자동 워크플로에 통합하기Wan 2.1 이란?Wan 2.1은 텍스트 프롬프트 또는 이미지 프롬프트를 입력받아 비디오를 생성할 수 있는 대규모언어모델(LLM, large language model)입니다. VBench에서 행해진 독립적인 평가에 따르면 Wan 2.1은 약 84.7%에 달하는 점수를 획득하여, 최고 성능의 AI ..

Mochi GGUF txt2vid (ComfyUI)

Mochi는 PC에서 돌릴 수 있는 최고의 비디오 AI 모델중 하나입니다. Mochi를 사용하면 텍스트 프롬프트를 480p 비디오로 바꿀 수 있습니다.이 글에서는 ComfyUI에서 Mochi GGUF를 설치하고 돌릴 수 있는 방법을 알려드립니다.소프트웨어Mochi AI 모델따라하기소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제일 강력한 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.참고 :이 글에서는 Mochi GGUF 포맷을 사용합니다. GGUF에 대한 좀 더 자세한 사항은 이 글을 참고하세요.Mochi AI 모델Mochi란?Mochi는 Genmo AI에서 개발한 개방형 비디오 AI 모델입니다. 아래에서 보시는 것처럼 비디..

SVD/CogVideo/LTX/Kling/HailouAI 비교

요즘 여러가지 AI 비디오 생성 모델과 서비스가 등장하고 있습니다. 물론 가장 유명한 것은 소라(Sora)입니다. 2분가까이 되는 긴 영상을, 거의 완전한 물리적 법칙을 따르고 있는 듯한 비디오로 이름이 높습니다. 물론 유료고요. ChatGPT를 유료로 사용하면 소라도 사용할 수 있는데, 저는 아직 한번도 사용해 보지 않았습니다. 이 글에서는 제가 알고있는 몇가지 서비스에 대해 동일한 조건으로 비디오를 생성해 보고 비교해보겠습니다. 여기에서 CogVideo는 GGUF 버전이라 다른 모델/서비스보다 품질이 떨어질 수 있습니다. 또한 완벽한 비교는 아니고, 그냥 저의 느낌 정도니까 그냥 그러려니 해주시면 감사하겠습니다.Flux GUFF + SVDCogVideo GGUF Image2VideoFlux -> Kl..

Flux-LTX img2vid 워크플로-ComfyUI

LTX 비디오는 고품질 비디오를 아주 빠르게 생성할 수 있는, 자신의 PC에서 돌릴 수 있는 비디오 모델입니다. LTX 는 img2vid 모드가 있어서, 이미지를 비디오로 바꿔줄 수 있습니다.Flux 모델은 현재 고품질의 이미지를 생성할 수 있는 가장 좋은 선택지중 하나입니다. 이 글에서는 Flux의 이미지 품질과 LTX의 빠른 비디오 생성을 통합한 워크플로를 선보입니다.소프트웨어Flux 모델과 Flux Fill 모델을 사용한 인페인트 비교따라하기워크플로 설명개인적인 느낌소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제가 제일 좋아하는 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.따라하기1 단계: 모델 다운로드여기에는 간단하..