전체 글 1872

Mochi GGUF txt2vid (ComfyUI)

Mochi는 PC에서 돌릴 수 있는 최고의 비디오 AI 모델중 하나입니다. Mochi를 사용하면 텍스트 프롬프트를 480p 비디오로 바꿀 수 있습니다.이 글에서는 ComfyUI에서 Mochi GGUF를 설치하고 돌릴 수 있는 방법을 알려드립니다.소프트웨어Mochi AI 모델따라하기소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제일 강력한 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.참고 :이 글에서는 Mochi GGUF 포맷을 사용합니다. GGUF에 대한 좀 더 자세한 사항은 이 글을 참고하세요.Mochi AI 모델Mochi란?Mochi는 Genmo AI에서 개발한 개방형 비디오 AI 모델입니다. 아래에서 보시는 것처럼 비디..

TeaCache: 생성속도를 두배로

AI 이미지 생성속도를 올리고 싶으신가요? TeaCache를 사용하면 품질에는 거의 영향을 미치지 않으면서도 디퓨전 모델의 속도를 올릴 수 있습니다. 구현하기도 쉽고, 무엇보다 Flux와 Hunyuan Video와 같은 최신 이미지/비디오 생성모델에 적용할 수 있다는 장점이 있습니다.이 글에서는 TeaCache의 작동원리와 함께, Flux 및 HunyuanVideo에 적용하는 워크플로를 소개시켜드립니다.소프트웨어TeaCache 란?TeaCache의 작동 원리Flux에서 TeaCache 사용하기Hunyuan에서 TeaCache 사용하기소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제일 강력한 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기..

SVD/CogVideo/LTX/Kling/HailouAI 비교

요즘 여러가지 AI 비디오 생성 모델과 서비스가 등장하고 있습니다. 물론 가장 유명한 것은 소라(Sora)입니다. 2분가까이 되는 긴 영상을, 거의 완전한 물리적 법칙을 따르고 있는 듯한 비디오로 이름이 높습니다. 물론 유료고요. ChatGPT를 유료로 사용하면 소라도 사용할 수 있는데, 저는 아직 한번도 사용해 보지 않았습니다. 이 글에서는 제가 알고있는 몇가지 서비스에 대해 동일한 조건으로 비디오를 생성해 보고 비교해보겠습니다. 여기에서 CogVideo는 GGUF 버전이라 다른 모델/서비스보다 품질이 떨어질 수 있습니다. 또한 완벽한 비교는 아니고, 그냥 저의 느낌 정도니까 그냥 그러려니 해주시면 감사하겠습니다.Flux GUFF + SVDCogVideo GGUF Image2VideoFlux -> Kl..

Flux GGUF와 이미지 프롬프트

이미지는 많은 것을 이야기 합니다. 스타일이나 분위기 처럼 말로는 할 수 없는 것을 표현할 수 있죠. 이것이 스테이블 디퓨전에서 이미지 프롬프트 어댑터(IP-Adapter)가 강력한 이유입니다. 이제 Flux  모델에서도 IP adpter를 사용할 수 있게 되었습니다.이 글에서는 Flux.1 dev GGUF모델에서 이미지 프롬프트를 사용하기 위한 세가지 워크플로를 소개합니다.Flux Redux : 변형 이미지 생성. 이것은 크기가 다르면서도 비슷한 이미지를 생성하는 데 사용됩니다. 새로운 이미지는 이미지 프롬프트만으로 제어합니다.Flux Redux Control : 텍스트 프롬프트와 이미지 프롬프트를 사용해 이미지를 제어합니다.Flux Redux Advanced : 텍스트와 이미지 프롬프트의 상대적인 가..

Flux Fill GGUF 를 사용한 자동 인페인트 아웃페인트

제가 꽤 오래전에 SDXL 모델을 사용한 자동 인페인트 아웃페인트 워크플로를 소개시켜드렸습니다. 인페인트(inpainting)란 이미지의 일부만 다시 그리는 것을 말합니다. 옷이나 스타일을 바꾸고 싶거나 배경중 일부를 지우고 싶을 때 등에 사용합니다. 아웃페인트(outpainting) 이란 이미지를 바깥쪽을 채우는 방식으로 이미지를 키우는 것을 말합니다. 아래는 예전 글에서 만들어 둔 예로서, 좌측 원본 이미지(1024x1024)를 1536x1024 크리고 늘린 이미지입니다.특히 이 워크플로에서는 이미지를 분석해서 프롬프트를 자동으로 만들어주는 기능이 들어 있어서 그냥 원하는 새로 그리고자 하는 부분만 지정하면 자동으로 인페인트/아웃페인트가 되는 장점이 있습니다.이러한 워크플로는 Flux.1 dev Fi..

Flux-LTX img2vid 워크플로-ComfyUI

LTX 비디오는 고품질 비디오를 아주 빠르게 생성할 수 있는, 자신의 PC에서 돌릴 수 있는 비디오 모델입니다. LTX 는 img2vid 모드가 있어서, 이미지를 비디오로 바꿔줄 수 있습니다.Flux 모델은 현재 고품질의 이미지를 생성할 수 있는 가장 좋은 선택지중 하나입니다. 이 글에서는 Flux의 이미지 품질과 LTX의 빠른 비디오 생성을 통합한 워크플로를 선보입니다.소프트웨어Flux 모델과 Flux Fill 모델을 사용한 인페인트 비교따라하기워크플로 설명개인적인 느낌소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제가 제일 좋아하는 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.따라하기1 단계: 모델 다운로드여기에는 간단하..

Flux.1 Fill GUFF 인페인트 - ComfyUI

일반 Flux 체크포인트 모델로 인페인팅을 할 수도 있지만, 잡음 제거 강도를 세밀하게 조정하는 등 여러가지 어려움이 있을 수 있습니다. 너무 올리면 이미지 일관성이 깨지고, 너무 낮게 잡으면 아무것도 변하지 않습니다. 그런데, 중간 정도로 설정하게 되면 원래 색상에서 크게 벗어나지 않는다는 점이 문제가 됩니다.이 글에서는 Flux.1 Fill GUFF 모델을 사용해서 이러한 한계를 극복할 수 있는 워크플로를 소개해 드립니다.소프트웨어Flux Fill 모델이란Flux 모델과 Flux Fill 모델을 사용한 인페인트 비교따라하기워크플로 설명스타일 변경소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제가 제일 좋아하는 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및..

Flux 모델에서 LoRA 사용하기 - ComfyUI

이 워크플로는 Flux dev GGUF 모델을 사용하여 사이버펑크 스타일 이미지를 생성하는 워크플로입니다. 생성된 이미지는 AI 업스케일러를 사용해 4배 확대합니다.소프트웨어따라하기워크플로 설명스타일 변경소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제가 제일 좋아하는 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.따라하기1 단계: Flux1 dev GGUF 모델 다운로드여기에는 간단하게만 정리했습니다. 더 자세한 내용은 이 글을 참고하세요.GGUF unet 모델아래 사이트에서 파일을 다운로드 받아, ComfyUI\models\unet 폴더에 넣어줍니다.flux1-dev GGUF여기에는 아주 많은 파일이 들어있는데, 다 받을 ..

Stable Diffusion 3.5 GGUF를 ComfyUI에서 사용하기

Stability Ai에서 Stable Diffusion 3.5 Large 모델과 더 빠른 Turbo 버전을 공개했습니다. Stable Diffusion Medium의 실패를 바로잡고, SD 3.5 Large는 괄목할만한 성능 향상이 이루어졌습니다. 프롬프트의 이해도가 높아졌고, 다양한 스타일의 이미지를 생성할 수 있습니다.이 글에서는 Stable Diffusion 3.5 Large 모델에 대해 알아보고, 3070에서는 메모리 부족문제로 SD 3.5 Large를 직접 돌릴 수 없기 때문에 SD 3.5 GGUF 를 이용해 ComfyUI에서 돌릴 수 있는 방법을 알아보겠습니다.소프트웨어SD 3.5 Large 모델따라하기8bit 모델 테스트워크플로 설명간편 워크플로소프트웨어이 글에서는 스테이블 디퓨전용 GUI..

Flux-CogVideo 워크플로(ComfyUI)

이 워크플로는 Flux AI 모델을 사용하여 고품질 이미지를 생성하고 이를 CogVideo를 사용해 비디오로 전환하는 워크플로입니다. 이렇게 하면 텍스트 프롬프트만으로도 비디오를 생성할 수 있을 뿐 아니라, 원래의 CogVideo txt2vid 모델보다 품질이 좋은 비디오를 생성할 수 있습니다.소프트웨어따라하기소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 요즘 가장 널리 사용되고 있는 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.따라하기1 단계: Flux1 dev GGUF 모델 다운로드여기에는 간단하게만 정리했습니다. 더 자세한 내용은 이 글을 참고하세요.GGUF unet 모델아래 사이트에서 파일을 다운로드 받아, Comfy..

ComfyUI에서 CogvideoX GGUF 사용하기

CogVideo는 자신의 PC에서 돌릴 수 있는 최신 AI 비디오 생성기 입니다. 이 글에서는 ComfyUI에서 Cogvideo를 사용하는 방법을 설명합니다.소프트웨어CogvideoX 란?Txt2Vid따라하기Img2Vid따라하기참고소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 요즘 가장 널리 사용되고 있는 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.참고 :이 글에서는 Flux Dev GGUF 포맷을 사용합니다. GGUF에 대한 좀 더 자세한 사항은 이 글을 참고하세요.CogvideoX 란?현재 여러가지 text-to-video / img-to-video모델 및 서비스가 나와 있습니다. 그중에서도 CogVideoX는 텍스트-..

Flux1 dev GUFF 모델에서 ControlNet 사용하기

Xlabs AI에서 ComfyUI에서 사용할 수 있는 Flux용 ControlNet 모델과 관련 커스톰 노드(x-flux-comfyui)를 개발했습니다. 이 글은 이 것들을 사용하는 방법에 관한 글입니다.소프트웨어따라하기참고다른 ContolNet소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 요즘 가장 널리 사용되고 있는 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.따라하기1단계: 모델 다운로드참고로, 3070에서 이 워크플로를 돌리려고 하니, F16은 메모리 부족 에러를 일으켰습니다. 그래서 Q3_K_S 모델로 바꿨더니 겨우겨우 돌아가네요. ㅠㅠGGUF unet 모델저는 Flux dev GGUF 모델을 사용합니다(참고 Sch..

Flux GGUF + SVD 비디오 워크플로(ComfyUI)

이 워크플로는 높은 품질의 이미지를 생성하는 Flux1 dev 모델과, 이미지로부터 비디오를 생성하는 Stable Video Diffusion(SVD)를 결합하여 짧은 비디오를 생성하는 워크플로입니다.소프트웨어따라하기다른 예제소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제가 제일 좋아하는 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.참고 :이 글에서는 Flux Dev GGUF 포맷을 사용합니다. GGUF에 대한 좀 더 자세한 사항은 이 글을 참고하세요. 따라하기1단계: 모델 다운로드GGUF unet 모델저는 Flux dev GGUF 모델을 사용합니다(참고 Schnell 모델). 링크에 들어가면 아래와 같이 여러개의 파일이 ..

ComfyUI에서 Flux GGUF 사용하기

GGUF(GGML Universal File) 파일 형식은 텐서와 메타데이터를 단일 파일에 저장하는 바이너리 형식 포맷으로서, 모델 데이터를 빠르게 저장하고 로드할 수 있도록 설계되었다....(중략).... GGUF 파일은 일반적으로 PyTorch나 Tensor와 같은 다른 머신 러닝 라이브러리로 개발된 모델을 변환하여 생성된다.(출처: GGUF-wiki)저는 머신러닝에 대해선 거의 모르지만, GGUF는 그냥 공통 파일 포맷 정도로 생각하면 되고, 무엇보다 대형모델을 빠르게 돌릴 수 있는 장점이 있다고 합니다.사실 제가 GGUF까지 관심을 둘만한 일은 아닙니다. 그런데... Stable Diffusion 보다 성능이 좋다는 Flux 모델을 사용하고 싶은데, SD-Forge에서는 소형모델이나마 지원해주는데..

이미지속 숨겨진 글자

아래의 이미지에서 뭔가 숨겨진 게 보이시나요? 눈을 거의 감길 것처럼 찌그리고 쳐다보세요. 스테이블 디퓨전 AI 를 사용하면 이렇게 단어가 숨겨져 있는 이미지를 쉽게 생성할 수 있습니다.이러한 이미지를 생성하는 가장 좋은 도구는 ControlNet 과 ADetailer 입니다. 이미지 자체는 텍스트 프롬프트로만 사용합니다. 따라서 얼마든지 다양하고 독특한 이미지를 생성할 수 있습니다.이 글에서는 AUTOMATIC1111 에서 이러한 이미지를 생성하는 방법을 세밀하게 알려드립니다.소프트웨어따라하기참고다른 프롬프트짧은 생각소프트웨어이 글에 있는 워크플로는 가장 널리 사용되고 있는 스테이블 디퓨전용 웹 GUI인 AUTOMATIC1111을 사용합니다. AUTOMATIC1111의 설치 방법은 이 글을 보시고, 초..