전체 글 1839

FLUX 실행을 위한 최적 요구사항

FLUX AI 모델은 출시된지 단 몇주만에 이미지 생성 분야의 게임체인저가 되었습니다. Stable Diffusion 3에 실망한 많은 오픈소스 커뮤니티 뿐만 아니라, DALL-E나 Midjourney와 같은 대형 독점적 서비스에 익숙해진 사용자들에게도 인기를 끌고 있습니다.하지만, FLUX를 잘 활용하려면 시스템과  GPU 요구사항을 잘 파악하는 것이 중요합니다. 특히 FLUX는 다양한 버전으로 제공되며, 버전별로 특정 하드웨어 구성에 맞도록 조정되어 있다고 생각되기 때문입니다. FLUX 실행 요구사항을 한마디로 요약하자면, 최소 VRAM 요구사항은 6GB이지만, 편안하게 사용하려면 최소 12GB가 필요하고, Black Forest Labs에서 요구하는 사양은 24GB라는 것입니다.이 글에서는 FLUX..

Flux 모델의 이해와 사용을 위한 모든 것

Flux AI는 Stable Diffusion의 제작자들이 설립한 인공지능 회사인 Black Forest Labs가 개발한 혁신적인 이미지 생성 모델입니다. Flux는 고품질의 이미지를 매우 빠르게 생성할 수 있어, 극사실주의(photorealism), 일러스트레이션 및 그래픽 디자인 분야에서 효율성을 놀랍게 높여줍니다. Black Forest Labs는 (미디저니와 같은 독점적 서비스에 대비해) 이미지 생성형 AI에 대한 접근성을 민주화한다는 비전에 충실하여, 전문가, 개발자, 개인 사용자를 위한 옵션을 제공합니다.Flux 사용방법Flux 프롬프트 사용법Flux 모델의 종류Flux로 생성한 이미지의 예Flux 모델의 특징FAQFlux 사용방법Flux는 별도로 설치하지 않고 온라인에서 직접 사용할 수도 ..

Flux를 위한 프롬프트 20선

Black Forest Labs가 공개한 FLUX의 등장으로, 이미지 생성형 AI는 새로운 전환점을 맞았습니다.2024년 8월 초에 발표된 이래, Flux는 이미 미드저니나 DALL-E 3와 같은 동종 업계의 선두 주자와 경쟁할 수 있는, 심지어는 이를 능가할 수 있는 능역으로 화제를 모으고 있습니다. 하지만, 아무리 도구가 강력해도 어떻게 사용하느냐에 따라 그 가치가 달라질 수 밖에 없습니다. 그래서 우리는 AI 이미지 생성 전문자 및 크리에이터가 제공하는, 여러분의 창의력을 높여줄 수 있는 프롬프트를 제공하고자 합니다.극 사실적 사진에서 기발한 일러스트레이션, 이해하기 쉽지않은 추상적 개념에 이르기까지, 이 글에서 제공하는 여러가지 프롬프트를 사용하면, Flux의 다양한 측면을 탐험해 볼 수 있을 것..

FLUX: 새롭고 혁신적인 이미지 생성 모델

2024년 8월 1일, Black Forest Labs가 출범하며, Flux 시리즈의 이미지 생성 모델을 발표하였습니다(링크). 생성형 인공지능이 전세계적으로 급속하게 성정하고 있는 가운데, Flux는 Stablility AI의 Stable Diffusion을 대체하는 생성모델로 각광을 받으며 화려하게 등장했습니다.미디어용 생성형 AI에 특화된 신생 스타트업인 Black Forest Labs가 발표한 Flux는, 오픈 소스 이면서도 인상적인 성능을 보여주고 있으며, Stable Diffusion 3 뿐만 아니라 DALL-E와 미디저니와 같은 이미지 AI의 선두 업체들과도 경쟁할 수 있는 제품입니다.FLUX.1기술적 특징FLUX.1 사용 방법사업 전략과 라이선스향후 전망FLUX.1 이란대규모의 이미지와 캡..

RunDiffusion에서 ComfyUI 실행하기

숨막히는 AI 이미지를 생성하고 싶은데, 자신의 PC는 너무나 꼬져서 이미지 한장 생성하는데에도 허덕거리시나요?이럴 때 가장 좋은 방법은 클라우드(Cloud) 서비스를 사용하는 것입니다. RunDiffusion 클라우드 서비스에서 ComfyUI 인터페이스를 실행하면 현재의 최고의 이미지 생성모델(SD3.5, Flux 등)을 이용해 이미지와 비디오를 생성할 수 있습니다.특히 RTX3070과 같이 어중간한 GPU를 가지고 있다면, 간단한 이미지 생성에는 자신의 PC를 사용하고, 복잡한 워크플로나 비디오 생성과 같이 시간이 많이 소요되는 경우에는 클라우드 서비스를 활용해 보완할 수 있습니다.RunDiffusion이란?RunDiffusion의 장점RunDiffusion의 비용RunDiffusion에서 Comfy..

AI 360 파노라마 생성하기

제가 한동안 360 파노라마 사진에 빠져 있었습니다. 360 파노라마 카테고리를 보시면 그 흔적을 보실 수 있습니다.그런데 엊그제 Reddit을 뒤적거리다가 ComfyUI용 360 파노라마 뷰어를 개발했다는 글을 보았습니다. 이 글에는 당연히 파노라마를 생성하는 도구도 포함되어 있었고요. 이 글들을 정리해서 파노라마를 생성하고 돌려볼 수 있는 워크플로를 정리했습니다. 이 워크플로를 따라하시면 아래와 같은 360 파노라마를 생성하실 수 있습니다.소프트웨어따라하기참고다른 예제개인적인 느낌소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제일 강력한 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.따라하기1 단계: 모델 다운로드체크포인트..

딮시크(DeepSeek)가 공개한 이미지 생성 모델 Janus-Pro-7B

ChatGPT를 추월하였다고 세상을 떠들썩하게 만들었던 딮시크에서 이미지 생성 모델, 더 정확히 말하자면 이미지 생성도 가능한 멀티 모달 모델 Janus Pro-7B를 오픈소스로 공개했다는 소식입니다. 이 모델은 현재 Hugging Face 플랫폼에 MIT 라이선스로 공개되어, 제한없이 상업적으로도 사용할 수 있습니다.나무위키에 따르면 Janus 자체는 10월경 Janus-1.3B (매개변수가 13억개)를 발표한 이래, 11월에 JanusFlow-1.3B를 발표한 바 있으며, 2025년 1월 27에 Janus-Pro(1B 및 7B)를 발표한 것이라고 합니다.딮시크 Janus-Pro-7B란고성능 멀디 모달 모델Janus-Pro-7B의 성능최초 사용자들의 엇갈린 반응앞으로의 가능성딮시크 Janus-Pro-7..

ComfyUI 커스톰 노드 만들기

ComfyUI를 사용하려면 커스톰 노드가 필수적입니다. 커스톰 노드(Custom Node)란 ComfyUI에서 기본으로 제공하는 노드에서는 제공하지 않는 새로운 노드를 말합니다. 대부분의 경우, 커스톰 노드를 새로 만들 필요는 거의 없습니다. 어딘가 찾아보면 누군가가 이미 해당 기능을 하는 커스톰 노드를 만들어 두었을 가능성이 높기 때문입니다. 그래도 커스톰 노드가 어떻게 만들어지는지를 알아두면 혹시 원하는 기능을 제공하는 노드가 없을 때 새로운 노드를 만들거나, 마음에 안드는 노드를 수정할 수가 있을 것입니다.다만, 여기에서 다루는 것은 매우 기초적인 내용이므로 참고만 하시기 바랍니다.SDXL_prompt_styler 커스톰 노드의 구조노드 클래스의 내용따라하기 1 - combine_text따라하기 2..

SDXL용 QR Code 이미지 생성기

예전에도 QR Code를 숨긴 이미지를 생성하는 글(A1111 용, ComfyUI 용)을 올렸습니다만, 이번엔 총정리하는 느낌으로 새로운 QR Code 이미지 생성 워크플로를 소개합니다.소프트웨어따라하기Lumina 2.0, Flux.1 Dev, SDXL 비교스타일 비교결론소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제일 강력한 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.따라하기1 단계: 모델 다운로드체크포인트 모델Juggernaut XL 모델을 다운로드 받은 후, ComfyUI\models\checkpoints 폴더에 넣어줍니다(A1111과 모델을 공유하실 경우엔 여기를 보세요). QR Monster ControlNet ..

Lumina Image 2.0 사용하기

Lumina Image 2.0은 텍스트 프롬프트로부터 이미지를 생성하는 중국의 OpenGVLab에서 공개한 오픈 소스 AI 모델입니다. 이 모델은 특히 예술적 스타일에 뛰어난 강점을 보이며 프롬프트를 따르는 능력이 높습니다. 소프트웨어Lumina Image 2.0이란?따라하기Lumina 2.0, Flux.1 Dev, SDXL 비교스타일 비교결론소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제일 강력한 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.Lumina Image 2.0 이란?Lumina Image 2.0은 매개변수가 26억개이며 1024x1024 해상도이 이미지를 생성할 수 있는 이미지 생성형 AI 모델입니다. 텍스트 ..

AI 이미지 2025.02.09

ComfyUI에서 이미지 배경 생성하기

기존의 이미지에서 배경만 새로운 인공지능 배경으로 생성할 수 있습니다. 이 워크플로는 이미지의 전경(또는 주체)는 변경하지 않고, 원 이미지의 배경과 일관성이 있는 새로운 배경을 생성합니다. 원하는 배경을 지정할 수도 있고요.아래는 원 이미지 입니다(인터넷에서 향수로 검색해서 찾은 이미지중 하나입니다).아래는 새로운 인공지능 배경으로 교체한 이미지입니다.소프트웨어워크플로 개요따라하기개인적인 느낌소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제일 강력한 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.워크플로 개요이 워크플로는 이미지 배경 삭제하기에서 사용했던 BRIA 모델을 사용해서 배경을 삭제하고 마스크를 만든 후, SDXL ..

Mochi GGUF 무비 비디오

Mochi는 짧은 비디오 움짤을 생성할 수 있는 최신의 로컬 비디오 모델입니다. 비디오를 몇개 이어서 스토리를 만들고 싶다면 어떻게 해야 할까요? Mochi 무비 비디오 워크플로를 이용하면 4개의 비디오 클립을 생성하고 이를 결합해 긴 비디오를 만들 수 있습니다. 이 무비 비디오는 ComfyUI에서 텍스트 프롬프트를 이용해 생성합니다.소프트웨어따라하기개인적인 느낌소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제일 강력한 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.참고 :이 글에서는 Mochi GGUF 포맷을 사용합니다. GGUF에 대한 좀 더 자세한 사항은 이 글을 참고하세요.따라하기1 단계: Mochi  GGUF 모델 다..

Mochi GGUF txt2vid (ComfyUI)

Mochi는 PC에서 돌릴 수 있는 최고의 비디오 AI 모델중 하나입니다. Mochi를 사용하면 텍스트 프롬프트를 480p 비디오로 바꿀 수 있습니다.이 글에서는 ComfyUI에서 Mochi GGUF를 설치하고 돌릴 수 있는 방법을 알려드립니다.소프트웨어Mochi AI 모델따라하기소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제일 강력한 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.참고 :이 글에서는 Mochi GGUF 포맷을 사용합니다. GGUF에 대한 좀 더 자세한 사항은 이 글을 참고하세요.Mochi AI 모델Mochi란?Mochi는 Genmo AI에서 개발한 개방형 비디오 AI 모델입니다. 아래에서 보시는 것처럼 비디..

TeaCache: 생성속도를 두배로

AI 이미지 생성속도를 올리고 싶으신가요? TeaCache를 사용하면 품질에는 거의 영향을 미치지 않으면서도 디퓨전 모델의 속도를 올릴 수 있습니다. 구현하기도 쉽고, 무엇보다 Flux와 Hunyuan Video와 같은 최신 이미지/비디오 생성모델에 적용할 수 있다는 장점이 있습니다.이 글에서는 TeaCache의 작동원리와 함께, Flux 및 HunyuanVideo에 적용하는 워크플로를 소개시켜드립니다.소프트웨어TeaCache 란?TeaCache의 작동 원리Flux에서 TeaCache 사용하기Hunyuan에서 TeaCache 사용하기소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제일 강력한 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기..

SVD/CogVideo/LTX/Kling/HailouAI 비교

요즘 여러가지 AI 비디오 생성 모델과 서비스가 등장하고 있습니다. 물론 가장 유명한 것은 소라(Sora)입니다. 2분가까이 되는 긴 영상을, 거의 완전한 물리적 법칙을 따르고 있는 듯한 비디오로 이름이 높습니다. 물론 유료고요. ChatGPT를 유료로 사용하면 소라도 사용할 수 있는데, 저는 아직 한번도 사용해 보지 않았습니다. 이 글에서는 제가 알고있는 몇가지 서비스에 대해 동일한 조건으로 비디오를 생성해 보고 비교해보겠습니다. 여기에서 CogVideo는 GGUF 버전이라 다른 모델/서비스보다 품질이 떨어질 수 있습니다. 또한 완벽한 비교는 아니고, 그냥 저의 느낌 정도니까 그냥 그러려니 해주시면 감사하겠습니다.Flux GUFF + SVDCogVideo GGUF Image2VideoFlux -> Kl..