AI 이미지 258

ComfyUI에서 GPT-Image-1 API 사용하기

ChatGPT를 개발한 OpenAI의 최신 이미지 생성모델 GPT-Image-1을 ComfyUI에서 기본으로 사용할 수 있게 되었습니다.[OpenAI GPT Image 1] 노드는 아주 흥미롭습니다. 복잡한 API 키나 코드를 관리할 필요 없이 ComfyUI 워크플로에서 GPT-Image-1 을 직접 접근할 수 있을 뿐 아니라, 다른 API도 사용할 수 있는 길이 열려있기 때문입니다. 즉, 가까운 미래에 BlackForestLabs(FLUX)나 ReCraft와 같은 다른 API도 사용할 수 있을 것으로 예측됩니다.이 글에서는 ComfyUI에서 GPT-Image-1 API를 사용하는 방법을 설명합니다.설치 및 사전 요구사항GPT-Image-1 노드 사용법사용시 주의사항사용 비용결론설치 및 사전 요구사항새로..

구글 AI 비디오 생성 서비스 Veo-2 사용법

이제 구글 AI Studio 에서 구글 AI 비디오 생성 모델인 Veo-2를 사용할 수 있게 되었습니다. 관련 공지는 이 글을 읽어보시기 바랍니다. Veo-2는 텍스트-비디오(Text-to-Video) 뿐만 아니라, 이미지-비디오(Image-to-Video)도 지원합니다. 또한 최대 8초짜 고해상도(720p) 비디오를 생성할 수 있습니다.2025년 4월 24일 현재 Artificial Intelligence의 텍스트-비디오 리더보드에 따르면 아래와 같이 구글 Veo-2가 Kling이나 Open AI의 Sora까지 제치고 1등을 차지하고 있습니다. 오픈소스 비디오 모델인 Wan 2.1, Hunyuan, Mochi 등은 10위권 근처에서 도토리 키재기를 하고 있네요. 따라서 현재 Kling이나 Runway..

ComfyUI 데스크탑 설치방법

지금까지 사용해 왔던 ComfyUI는 (AUTOMATIC1111 등을 포함) 웹 UI 버전으로서, 모두 로컬에서 돌리기는 하지만 인테페이스는 웹UI를 사용했습니다. 즉, 크롬이나 MS Edge등을 켜지 않으면 실행시킬 수 없었습니다. 웹 UI 버전의 설치방법은 이 글을 참고하세요.이에 비해 ComfyUI 데스크톱은 일반 소프트웨어처럼 설치할 수 있는 독립형 설치 버전입니다. ComfyUI 데스크톱은 쉽고 빠르게 설치할 수 있으며, Python 환경을 자동으로 구성해주기 때문에 복잡한 설치과정이 필요없는 장점이 있습니다. 또한 기존 ComfyUI 설정, 모델, 워크플로 및 파일을 원클릭으로 가져올 수 있어, 기존 ComfyUI와 함께 사용하는 것도 가능합니다.무엇보다 ComfyUI 데스크톱은 WebUI ..

NVidia 50 시리즈와 ComfyUI

NVidia 50시리즈가 여러가지로 문제를 일으키고 있나봅니다. 저도 5070ti를 주문해놓고 낼모레 배송을 기다리고 있는데, ComfyUI가 Blackwell 아키텍처에서 문제가 있다는 모양입니다.업데이트:그냥 아래 링크에서 다운로드 받아 설치하면 된다고 하네요. 안전화버전의 PyTorch 2.7 cu128 버전에서 돌아가는 ComfyUI입니다.https://github.com/comfyanonymous/ComfyUI/releases/download/latest/new_ComfyUI_windows_portable_nvidia_cu128_or_cpu.7z문제의 원인ComfyUI를 설치하고 실행시키면 로그가 나오는데 문제는 Pytorch 버전때문입니다.ComfyUI의 Python 버전 3.12.8 / P..

VRAM이 작은 PC에서 긴 Video를 생성하기

프레임팩(FramePack)은 비디오 길이에 관계없이 VRAM을 적게(6 GB) 소모하는 비디오 생성 기법입니다. 프레임팩은 이미지-비디오(Image-to-Video), 즉 텍스트 명령과 이미지를 상용하여 비디오를 생성합니다.이 글에서는 프레임팩이 무엇인지 소개하고 윈도에서 사용하는 방법을 설명합니다.프레임팩이란?프레임팩 설치 방법(윈도)프레임팩 사용 방법프레임팩이란?프레임팩(FramePack)은 비디오에서 이전 프레임을 기반으로 다음 프레임을 예측합니다. 이 과정에서 비디오의 길이에 관계없이 틀랜스포머(transformer)내에서 고정된 콘텍스트 길이를 사용합니다. 이를 통해 많은 비디오 생성기(Wan 2.1, Hunyuan, LTX Video 등)들에서 볼 수 있는, 메모리에 따라 비디오 길이가 제..

FLUX와 HiDream 비교

제가 2년전 Stable Diffusion에 대해서 글을 쓰기 시작한 이래, 이미지 생성 인공지능 분야에 오늘날 같은 춘추전국시대가 도래할지는 아무도 예상하지 못했을 것입니다. 현재 텍스트-이미지 리더보드를 보면, 10위 이내의 서비스/모델이 모두 작년 10월 이후에 서비스를 시작했고 올해 시작된 것이 6개라는 것만 봐도 얼마나 치열한 경쟁과 개선이 이루어지고 있는지를 알 수 있을 것입니다.이 중에서 오픈소스로 공개되어 자신의 PC로 돌릴 수 있는 모델은 HiDream이 4위를 차지하고 있고, Flux는 7위에 올라 있습니다. 지금은 거의 잊혀진거나 다름없이 보이는 SDXL 3.5는 18위에 올라 있네요. 엊그제 ComfyUI 에서 HiDream-li 모델을 지원하게 되었으니, Flux1.dev와 비교..

HiDream 기본 워크플로(ComfyUI)

얼마전, HiDream이라는 새로운 오픈소스 이미지 생성 AI 가 등장했다는 소식을 알려드렸는데, 드디어 2025년 4월 17일 발표된 ComfyUI v0.3.29에서 HiDream을 지원하게 되었습니다. HiDream은 현재 인공지능 Text-Image Arena에서 4등을 차지하고 있는데, 오픈소스만 봤을 때는 Black Forest Labs의 Flux와 Stable Diffusion 3.5 등을 제치고 수위를 달리고 있습니다.소프트웨어따라하기HiDream 모델별 설정 소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제일 강력하며, 현재 거의 대세로 자리잡고 있는 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.따라하기1 단계..

Flux-Hunyuan 텍스트-비디오 워크플로

이 워크플로는 이미지 생성 AI 모델(FLUX)과 비디오 생성 AI 모델(Hunyuan)을 이용해 비디오를 생성합니다.Flux를 사용하여 AI 이미지를 생성합니다.이렇게 생성된 이미지를 첫 프레임으로 사용하여, Hunyuan 이미지-비디오 모델을 이용해 비디오로 전환합니다. 아래는 이렇게 생성한 비디오의 예입니다.소프트웨어워크플로 작동 원리따라하기소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제일 강력하며, 현재 거의 대세로 자리잡고 있는 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.워크플로 작동 원리이 워크플로 전반부는 Flux.1 dev를 사용하여 고품질의 이미지를 생성합니다. 이 부분은 제가 요즘 자주 사용하는 워크플로..

Mogao: 새로운 미스터리 AI - Seedream 3.0

갱신: Mogao는 ByteDance 의 최신 모델인 Seedream 3.0 으로 밝혀졌습니다. 현재는 이미지 아레나에서 2등으로 내려앉았네요.====이미지 생성형 인공지능 세계에 또다른 게임체인저가 등장해서 시장을 흔들고 있습니다. 그의 이름은 모가오(Mogao) 입니다. 현제 웹사이트도, 주소도 없고, 심지어는 로고도 없습니다. 그냥 며칠전에 이미지 아레나에 등장해서 2025년 4월 14일 현재 1위를 차지했습니다. GPT-4o까지 밀어내고요!4월 초부터 ArtificialAnalysis.ai의 이미지 아레나의 변화상황을 주의 깊게 살펴본 사람들은, 공식 순위에는 없지만 블라인드 테스트에서 매우 활발하게 나타난 모가오라는 모델을 주목했습니다.하지만, 그 결과는 그다지 눈에 띄지 않았습니다. 저 개인적..

기계 곤충 비디오(ComfyUI)

이 워크플로는 텍스트 프롬프트로부터 아름다운 기계 곤충 비디오를 생성하는 워크플로입니다. 이 워크플로는 FLUX AI를 사용하여 고품질의 이미지를 생성한 후, Wan 2.1 Video를 사용하여 비디오를 생성합니다.소프트웨어워크플로 작동 원리따라하기소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제일 강력하며, 현재 거의 대세로 자리잡고 있는 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.워크플로 작동 원리이 워크플로 전반부는 Flux.1 dev를 사용하여 고품질의 이미지를 생성합니다. 이 부분은 제가 요즘 자주 사용하는 워크플로를 약간 수정한 겁니다. 수정한 부분은 맨 오른쪽으로, 생성된 이미지를 [Image Sender] 노..