이미지 생성 AI 71

ComfyUI-TeaCache 사용방법

Flux, HiDream 등 새로운 이미지 생성형 인공지능들이 예전의 모델에 비해 매개변수 수가 커지면서 생성 시간이 늘어나고 있습니다. 물론 생성되는 이미지 품질이 가장 중요하지만, 생성속도도 무시할 수 없죠.그런데 품질에는 거의 영향을 미치지 않으면서도 디퓨전 모델의 생성 속도를 올릴 수 있는 방법이 있습니다. TeaCache를 사용하는 것입니다. TeaCache는 구현하기도 쉽고, 무엇보다 Flux와 Hunyuan Video와 같은 최신 이미지/비디오 생성모델에 적용할 수 있다는 장점이 있습니다.제 블로그에서는 예전에도 FLUX 용 TeaCache 및 Wan 2.1 용 TeaCache를 사용하여 생성 속도를 올리는 방법을 소개해 드린 적이 있습니다. 이 글에서는 2025년 5월말 현재 TeaCach..

구글 Whisk에서 고양이 비틀즈 생성하기

고양이 비틀즈가 Abbey Road를 건너가는 모습을 생성하려고, 여느 때처럼 구글 Image FX에 접속하자, 아래와 같이 새로운 실험 서비스인 Whisk를 사용해 보라는 알림이 떴습니다. 물론 바로 접속해서 생성을 시도했습니다.이 글에서는 이미지를 생성하고, 생성된 이미지를 다시 비디오로 생성하는 과정을 보여드립니다.이미지 생성비디오 생성짧은 감상이미지 생성맨 먼저 "의인화 고양이 Beatles가 Abbey road 횡단보도를 건너간다."라고 프롬프트를 주고 생성한 결과입니다. 두 장이 생성되는데, 그럴 듯한 것을 선택했습니다.이미지 좌측 위를 보면 애니메이션으로 바꾸는 기능과 세부 조정하는 기능이 있습니다. 일단 위의 이미지를 약간 수정하기로 하고 "세부 조정"을 눌렀습니다.그뒤, 고양이 품종을 다..

ComfyUI에서 API 노드 사용하기

얼마전 ComfyUI에서 GPT-Image-1 API 사용하기라는 글을 올리면서, 다른 API도 사용할 수 있게 될지도 모른다고 말씀드렸는데, 드디어 그 해결책이 나왔습니다. ComfyUI 에서 GPT 뿐만 아니라, Veo2, Flux Ultra와 같이 API를 제공하는 서비스를 사용할 수 있는 API노드를 정식으로 제공하기 시작한 것입니다.API 노드란?지원 모델API 노드 사용법이미지/비디오 생성비용향후 추가 개발 사항API 노드란?API 노드는 ComfyUI에 새롭게 추가된 기본 노드로서, Veo2 또는 Flux Ultra와 같은 유료 모델의 API를 호출할 수 있는 노드입니다. 기본적으로 ComfyUI는 자신의 PC 에 저장된 모델을 사용하지만, 이미지 혹은 비디오 제작자 들은 무엇보다 품질이 우..

F Lite: Freepik과 Fal.ai에서 개발한 오픈소스 이미지 생성 모델

이미지 공유 사이트로 유명한 Freepik에서 이미지 생성 AI 개발자 플랫폼을 운영하는 Fal.ai와 함께 F Lite라고 하는 텍스트-이미지 (Text-to-Image) 생성모델을 개발하고 오픈소스로 공개했습니다. 자세한 내용은 Freepik 블로그의 공지를 보시면 됩니다.얼마전에도 Seedream이 공개되었고, HiDream, Ideogram, Reve 등 수많은 텍스트-이미지 모델이 공개되었는데, 오픈소스로는 Flux 이후 처음인 듯 싶습니다(Janus Pro 도 있기는 하지만 품질이 워낙 개판이라...). 이번에 공개된 F Lite는 무엇보다, Freepik의 스톡 라이브러리(stock library)에 올려져 있는 고품질이고 법적으로 문제 없으며 저작권문제에서 안전한 이미지만을 사용하여 학습되..

플랫 일러스트레이션 AI 프롬프트

이 글에서는 인공지능으로 생성하는 플랫 일러스트레이션(Flat Illustration)에 키워드가 미치는 영향을 알아봅니다. 이를 위해서 기본 플랫 디자인 아트 4가지를 생성하고, 각각의 키워드를 추가해가면서 그 효과를 알아보겠습니다.또한 AI 모델간의 차이를 확인하기 위하여, ChatGPT에서 사용할 수 있는 GPT-4o 이미지 모델, 구글에서 개발한 Image FX 및 Flux.1 dev를 사용하여 이미지를 생성하여 서로 비교해 보겠습니다.아래는 기본으로 사용하는 프롬프트입니다. 아래는 모두 Flux.1 dev 로 생성하였습니다.a flat vector illustration of the galaxya flat vector illustration of a fashionable woman wearin..

ComfyUI에서 GPT-Image-1 API 사용하기

ChatGPT를 개발한 OpenAI의 최신 이미지 생성모델 GPT-Image-1을 ComfyUI에서 기본으로 사용할 수 있게 되었습니다.[OpenAI GPT Image 1] 노드는 아주 흥미롭습니다. 복잡한 API 키나 코드를 관리할 필요 없이 ComfyUI 워크플로에서 GPT-Image-1 을 직접 접근할 수 있을 뿐 아니라, 다른 API도 사용할 수 있는 길이 열려있기 때문입니다. 즉, 가까운 미래에 BlackForestLabs(FLUX)나 ReCraft와 같은 다른 API도 사용할 수 있을 것으로 예측됩니다.이 글에서는 ComfyUI에서 GPT-Image-1 API를 사용하는 방법을 설명합니다.설치 및 사전 요구사항GPT-Image-1 노드 사용법사용시 주의사항사용 비용결론설치 및 사전 요구사항새로..

ComfyUI 데스크탑 설치방법

지금까지 사용해 왔던 ComfyUI는 (AUTOMATIC1111 등을 포함) 웹 UI 버전으로서, 모두 로컬에서 돌리기는 하지만 인테페이스는 웹UI를 사용했습니다. 즉, 크롬이나 MS Edge등을 켜지 않으면 실행시킬 수 없었습니다. 웹 UI 버전의 설치방법은 이 글을 참고하세요.이에 비해 ComfyUI 데스크톱은 일반 소프트웨어처럼 설치할 수 있는 독립형 설치 버전입니다. ComfyUI 데스크톱은 쉽고 빠르게 설치할 수 있으며, Python 환경을 자동으로 구성해주기 때문에 복잡한 설치과정이 필요없는 장점이 있습니다. 또한 기존 ComfyUI 설정, 모델, 워크플로 및 파일을 원클릭으로 가져올 수 있어, 기존 ComfyUI와 함께 사용하는 것도 가능합니다.무엇보다 ComfyUI 데스크톱은 WebUI ..

NVidia 50 시리즈와 ComfyUI

NVidia 50시리즈가 여러가지로 문제를 일으키고 있나봅니다. 저도 5070ti를 주문해놓고 낼모레 배송을 기다리고 있는데, ComfyUI가 Blackwell 아키텍처에서 문제가 있다는 모양입니다.업데이트:그냥 아래 링크에서 다운로드 받아 설치하면 된다고 하네요. 안전화버전의 PyTorch 2.7 cu128 버전에서 돌아가는 ComfyUI입니다.https://github.com/comfyanonymous/ComfyUI/releases/download/latest/new_ComfyUI_windows_portable_nvidia_cu128_or_cpu.7z업데이트:이제는 더 이상 신경쓸 필요 없습니다!!문제의 원인ComfyUI를 설치하고 실행시키면 로그가 나오는데 문제는 Pytorch 버전때문입니다.Co..

FLUX와 HiDream 비교

제가 2년전 Stable Diffusion에 대해서 글을 쓰기 시작한 이래, 이미지 생성 인공지능 분야에 오늘날 같은 춘추전국시대가 도래할지는 아무도 예상하지 못했을 것입니다. 현재 텍스트-이미지 리더보드를 보면, 10위 이내의 서비스/모델이 모두 작년 10월 이후에 서비스를 시작했고 올해 시작된 것이 6개라는 것만 봐도 얼마나 치열한 경쟁과 개선이 이루어지고 있는지를 알 수 있을 것입니다.이 중에서 오픈소스로 공개되어 자신의 PC로 돌릴 수 있는 모델은 HiDream이 4위를 차지하고 있고, Flux는 7위에 올라 있습니다. 지금은 거의 잊혀진거나 다름없이 보이는 SDXL 3.5는 18위에 올라 있네요. 엊그제 ComfyUI 에서 HiDream-li 모델을 지원하게 되었으니, Flux1.dev와 비교..

대표 이미지 생성형 AI 서비스 비교

2025년 4월 3일 현재, 현재 Text to Image Model Leaderboard에 나타난 순위는 아래와 같습니다. GPT-4o가 등장한지 겨우 1주일만에 1등을 차지했고, 그 바람에 Recraft AI는 2 등으로, Reve(Halfmoon)는 1등을 차지한지 한달도 못채우고 3등으로 밀려나고, 구글의 Imagen 3는 5등으로, BFL의 FLUX1.1은 6등이 되었네요. 그 사이로 새로 Ideogram 3.0이 끼어들었구요. 완전 엎치락 뒤치락하고 있네요.이 시점에서 이들 서비스의 이미지 생성 품질을 비교해보려고 합니다. 물론 위의 이미지 리더보드는 수많은 사람들이 평가한 결과이기 때문에 이 결과를 뛰어넘을 수는 없겠지만, 그래도 제 나름대로의 기준으로 한번 비교해 보려고요.테스트 방식은 ..