전체보기 1806

FLUX: 새롭고 혁신적인 이미지 생성 모델

2024년 8월 1일, Black Forest Labs가 출범하며, Flux 시리즈의 이미지 생성 모델을 발표하였습니다(링크). 생성형 인공지능이 전세계적으로 급속하게 성정하고 있는 가운데, Flux는 Stablility AI의 Stable Diffusion을 대체하는 생성모델로 각광을 받으며 화려하게 등장했습니다.미디어용 생성형 AI에 특화된 신생 스타트업인 Black Forest Labs가 발표한 Flux는, 오픈 소스 이면서도 인상적인 성능을 보여주고 있으며, Stable Diffusion 3 뿐만 아니라 DALL-E와 미디저니와 같은 이미지 AI의 선두 업체들과도 경쟁할 수 있는 제품입니다.FLUX.1기술적 특징FLUX.1 사용 방법사업 전략과 라이선스향후 전망FLUX.1 이란대규모의 이미지와 캡..

RunDiffusion에서 ComfyUI 실행하기

숨막히는 AI 이미지를 생성하고 싶은데, 자신의 PC는 너무나 꼬져서 이미지 한장 생성하는데에도 허덕거리시나요?이럴 때 가장 좋은 방법은 클라우드(Cloud) 서비스를 사용하는 것입니다. RunDiffusion 클라우드 서비스에서 ComfyUI 인터페이스를 실행하면 현재의 최고의 이미지 생성모델(SD3.5, Flux 등)을 이용해 이미지와 비디오를 생성할 수 있습니다.특히 RTX3070과 같이 어중간한 GPU를 가지고 있다면, 간단한 이미지 생성에는 자신의 PC를 사용하고, 복잡한 워크플로나 비디오 생성과 같이 시간이 많이 소요되는 경우에는 클라우드 서비스를 활용해 보완할 수 있습니다.RunDiffusion이란?RunDiffusion의 장점RunDiffusion의 비용RunDiffusion에서 Comfy..

AI 360 파노라마 생성하기

제가 한동안 360 파노라마 사진에 빠져 있었습니다. 360 파노라마 카테고리를 보시면 그 흔적을 보실 수 있습니다.그런데 엊그제 Reddit을 뒤적거리다가 ComfyUI용 360 파노라마 뷰어를 개발했다는 글을 보았습니다. 이 글에는 당연히 파노라마를 생성하는 도구도 포함되어 있었고요. 이 글들을 정리해서 파노라마를 생성하고 돌려볼 수 있는 워크플로를 정리했습니다. 이 워크플로를 따라하시면 아래와 같은 360 파노라마를 생성하실 수 있습니다.소프트웨어따라하기참고다른 예제개인적인 느낌소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제일 강력한 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.따라하기1 단계: 모델 다운로드체크포인트..

딮시크(DeepSeek)가 공개한 이미지 생성 모델 Janus-Pro-7B

ChatGPT를 추월하였다고 세상을 떠들썩하게 만들었던 딮시크에서 이미지 생성 모델, 더 정확히 말하자면 이미지 생성도 가능한 멀티 모달 모델 Janus Pro-7B를 오픈소스로 공개했다는 소식입니다. 이 모델은 현재 Hugging Face 플랫폼에 MIT 라이선스로 공개되어, 제한없이 상업적으로도 사용할 수 있습니다.나무위키에 따르면 Janus 자체는 10월경 Janus-1.3B (매개변수가 13억개)를 발표한 이래, 11월에 JanusFlow-1.3B를 발표한 바 있으며, 2025년 1월 27에 Janus-Pro(1B 및 7B)를 발표한 것이라고 합니다.딮시크 Janus-Pro-7B란고성능 멀디 모달 모델Janus-Pro-7B의 성능최초 사용자들의 엇갈린 반응앞으로의 가능성딮시크 Janus-Pro-7..

ComfyUI 커스톰 노드 만들기

ComfyUI를 사용하려면 커스톰 노드가 필수적입니다. 커스톰 노드(Custom Node)란 ComfyUI에서 기본으로 제공하는 노드에서는 제공하지 않는 새로운 노드를 말합니다. 대부분의 경우, 커스톰 노드를 새로 만들 필요는 거의 없습니다. 어딘가 찾아보면 누군가가 이미 해당 기능을 하는 커스톰 노드를 만들어 두었을 가능성이 높기 때문입니다. 그래도 커스톰 노드가 어떻게 만들어지는지를 알아두면 혹시 원하는 기능을 제공하는 노드가 없을 때 새로운 노드를 만들거나, 마음에 안드는 노드를 수정할 수가 있을 것입니다.다만, 여기에서 다루는 것은 매우 기초적인 내용이므로 참고만 하시기 바랍니다.SDXL_prompt_styler 커스톰 노드의 구조노드 클래스의 내용따라하기 1 - combine_text따라하기 2..

SDXL용 QR Code 이미지 생성기

예전에도 QR Code를 숨긴 이미지를 생성하는 글(A1111 용, ComfyUI 용)을 올렸습니다만, 이번엔 총정리하는 느낌으로 새로운 QR Code 이미지 생성 워크플로를 소개합니다.소프트웨어따라하기Lumina 2.0, Flux.1 Dev, SDXL 비교스타일 비교결론소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제일 강력한 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.따라하기1 단계: 모델 다운로드체크포인트 모델Juggernaut XL 모델을 다운로드 받은 후, ComfyUI\models\checkpoints 폴더에 넣어줍니다(A1111과 모델을 공유하실 경우엔 여기를 보세요). QR Monster ControlNet ..

Lumina Image 2.0 사용하기

Lumina Image 2.0은 텍스트 프롬프트로부터 이미지를 생성하는 오픈 소스 AI 모델입니다. 이 모델은 특히 예술적 스타일에 뛰어난 강점을 보이며 프롬프트를 따르는 능력이 높습니다. 소프트웨어Lumina Image 2.0이란?따라하기Lumina 2.0, Flux.1 Dev, SDXL 비교스타일 비교결론소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제일 강력한 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.Lumina Image 2.0 이란?Lumina Image 2.0은 매개변수가 26억개이며 1024x1024 해상도이 이미지를 생성할 수 있는 이미지 생성형 AI 모델입니다. 텍스트 인코더로는 Gemma-2-2B 를 활..

AI 이미지 2025.02.09

ComfyUI에서 이미지 배경 생성하기

기존의 이미지에서 배경만 새로운 인공지능 배경으로 생성할 수 있습니다. 이 워크플로는 이미지의 전경(또는 주체)는 변경하지 않고, 원 이미지의 배경과 일관성이 있는 새로운 배경을 생성합니다. 원하는 배경을 지정할 수도 있고요.아래는 원 이미지 입니다(인터넷에서 향수로 검색해서 찾은 이미지중 하나입니다).아래는 새로운 인공지능 배경으로 교체한 이미지입니다.소프트웨어워크플로 개요따라하기개인적인 느낌소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제일 강력한 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.워크플로 개요이 워크플로는 이미지 배경 삭제하기에서 사용했던 BRIA 모델을 사용해서 배경을 삭제하고 마스크를 만든 후, SDXL ..

Mochi GGUF 무비 비디오

Mochi는 짧은 비디오 움짤을 생성할 수 있는 최신의 로컬 비디오 모델입니다. 비디오를 몇개 이어서 스토리를 만들고 싶다면 어떻게 해야 할까요? Mochi 무비 비디오 워크플로를 이용하면 4개의 비디오 클립을 생성하고 이를 결합해 긴 비디오를 만들 수 있습니다. 이 무비 비디오는 ComfyUI에서 텍스트 프롬프트를 이용해 생성합니다.소프트웨어따라하기개인적인 느낌소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제일 강력한 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.따라하기1 단계: Mochi 모델 다운로드아래 사이트에서 pig-mochi...gguf 파일을 찾아 ComfyUI\models\diffusion_models 에 넣..

Mochi GGUF txt2vid (ComfyUI)

Mochi는 PC에서 돌릴 수 있는 최고의 비디오 AI 모델중 하나입니다. Mochi를 사용하면 텍스트 프롬프트를 480p 비디오로 바꿀 수 있습니다.이 글에서는 ComfyUI에서 Mochi GGUF를 설치하고 돌릴 수 있는 방법을 알려드립니다.소프트웨어Mochi AI 모델따라하기소프트웨어이 글에서는 스테이블 디퓨전용 GUI중에서도 제일 강력한 ComfyUI를 사용합니다. ComfyUI가 처음이시라면, 설치 및 기본 사용방법 및 초보가이드를 확인하시기 바랍니다.Mochi AI 모델Mochi란?Mochi는 Genmo AI에서 개발한 개방형 비디오 AI 모델입니다. 아래에서 보시는 것처럼 비디오 생성 리더보드에서 2 등으로 평가받는, 매우 뛰어난 모델입니다.라이선스공개된 버전은 Mochi 1 Preview로..