Flux AI는 Stable Diffusion의 제작자들이 설립한 인공지능 회사인 Black Forest Labs가 개발한 혁신적인 이미지 생성 모델입니다.
Flux는 고품질의 이미지를 매우 빠르게 생성할 수 있어, 극사실주의(photorealism), 일러스트레이션 및 그래픽 디자인 분야에서 효율성을 놀랍게 높여줍니다.
Black Forest Labs는 (미디저니와 같은 독점적 서비스에 대비해) 이미지 생성형 AI에 대한 접근성을 민주화한다는 비전에 충실하여, 전문가, 개발자, 개인 사용자를 위한 옵션을 제공합니다.
Flux 사용방법
Flux는 별도로 설치하지 않고 온라인에서 직접 사용할 수도 있습니다. 구글링만 해봐도 FLUX 온라인 서비스는 아주 많습니다. 이중에는 무료로 제공되는 서비스도 있지만, 대부분 품질이 떨어지는 Flux Schenell 또는 Flux Dev에 대해서는 무료로 제공하거나, 가입할 때 약간의 크레딧을 제공할 뿐이고, 고품질의 Flux Pro 또는 Ultra를 사용할 경우에는 비용을 지불해야합니다. 온라인 서비스 중에는 Replicate, Fal.ai, DZine 등이 가장 인기있는 서비스라고 합니다.
Flux 모델을 다운로드 받아서 직접 로컬에서 돌릴 수도 있습니다. 대부분의 경우, ComfyUI 혹은 Forge 등의 웹UI를 기반으로 Flux를 사용하게 됩니다. 다만 Flux는 품질이 높은 만큼 고사양의 GPU를 요구합니다. Flux.1 Dev 모델의 경우 적어도 VRAM이 20GB 이상인 모델이 필요하고, Flux.1 Schenell의 경우에도 12GB이상을 요구합니다. 다만, 이들 모델의 정확도를 떨어뜨린 양자화(Quantization) 버전(GGUF 포맷)의 경우엔 8GB VRAM에서도 실행시킬 수 있습니다. 참고로 제가 가진 RTX 3070에서 FLUX GGUF 모델로 이미지를 생성하면, 처음 모델을 읽어들이는 과정을 제외하고 순수히 샘플링하는 시간만 1:30 정도 소요됩니다. FLUX GGUF in ComfyUI 와 FLUX Dev in Forge를 참고하세요.
기존에 다른 이미지 생성형 모델에는 관심이 없고, Flux만 사용하고 싶다면 Black Forest Labs의 Github에서 제공한 파이썬 프로그램을 사용하여 돌릴 수도 있습니다.
마지막으로, Diffus나 RunDiffusion과 같은 클라우드 호스팅 서비스를 이용할 수도 있습니다. 이러한 서비스를 사용하면 높은 사용의 컴퓨터나 복잡한 설치 등의 필요 없이, 자신의 컴퓨터에 설치된 것과 거의 동일한 인터페이스를 사용할 수 있습니다. RunDiffusion 클라우드 서비스 사용방법은 이 글을 참고하세요.
Flux프롬프트 사용법
FLUX는 Stable Diffusion에서 흔히 사용되었던 프롬프트, 즉 중요한 키워드를 쉼표로 구분하여 입력하는 형태보다는, 장황하고 서술적인 스타일의 프롬프트가 적합한 경향이 있습니다. 그렇다고 하여 SD 스타일의 프롬프트도 잘 작동하므로 기존의 프롬프트가 있다면 먼저 시험해보는 것도 좋습니다.
참고: 프랑스인 크리에이터 7인이 공유한 자신들의 FLUX 프롬프트 |
FLUX 프롬프트가 문장 스타일을 선호하기 때문에, ChatGPT를 이용해 프롬프트 만드기가 더 유용해졌습니다. 원하는 내용을 한글로 입력한 후, "이것을 영문 프롬프트로 만들어줘" 라고 덧붙이면 훌륭한 프롬프트가 만들어집니다. 또한 조명을 추가하는 등 추가적인 요구사항을 넣어주면 계속 고쳐주므로, 프롬프트를 조금씩 개선해 나가는 것도 좋은 방법입니다.
특히 다른 모델과는 달리, FLUX는 텍스트(단어가 아니라 문장 전체)를 정확하게 렌더링할 수 있습니다. 이 기능만으로도 이미지에 텍스트를 통합하려는 디자이너에게 무한한 가능성을 열어줍니다. 아래의 예를 참고해보세요.
프롬프트: cinematic still of a man and a woman holding a sign with the text "Nothing bad can happen to us now". messy hairs. Blood stain. horror, survival, 80's Horror movie, highly detailed, high quality photo.
프롬프트: A mystical, fog-shrouded landscape under a blood moon, with a dark ruined tower in the distance. The foreground features a wood and neon signpost with Hotel 5 stars text, amidst heavy fog, dark shadows, and dim moonlight reflections in water.
Flux 모델의 종류
Flux는 현재 3가지 버전으로 제공되며, 각각 특정한 요구사항을 충족하도록 설계되어 있습니다.
![]() |
FLUX1.1 Pro Pro 버전은 가장 강력한 버전으로서, 가장 뛰어난 품질을 제공합니다. 하지만 이 버전은 사용자가 다운로드 받아 사용할 수는 없고, Black Forest Labs API를 통해서만 사용할 수 있습니다. 이 서비스는 Flux의 기능을 자체 어플리케이션이나 서비스에 통합하고자하는 전문 고객용입니다. |
![]() |
FLUX.1 Dev Flux.1 Dev 는 개발자 및 연구자를 위한 버전입니다. 이 버전은 모델이 공개되어 있어 사용자가 원하는대로 맞춤화 및 실험이 가능합니다. 개발자들은 자신의 필요에 맞춰 조정하고, 새로운 아키텍처를 시험해보거나 특정한 데이터세트를 사용해 미세조정할 수도 있습니다. 이 버전은 강력하지만, 상업용으로는 적합하지 않습니다. |
![]() |
FLUX.1 Schenell 마지막으로 Schenell 버전은 가장 접근성이 높습니다. 오픈소스이면서 무료이므로 개인 프로젝트, 프로토타입, 소규모 실험에 이상적입니다. Pro 및 Dev 버전에 비하면 성능이 떨어지지만, 빠르고 효율적으로 이미지를 생성합니다. Schnell 벉전은 취미인부터 학생 및 일반인까지 아무런 장벽없이 자유롭게 활용할 수 있습니다. |
Flux로 생성한 이미지의 예
아래의 이미지들은 이 글에 있는 워크플로를 사용해 생성하였습니다. LoRA나 ControlNet 등의 부가적인 모델은 전혀 사용하지 않고 생성한 이미지임을 강조드립니다.
![]() ![]() ![]() ![]() |
![]() ![]() ![]() ![]() |
![]() ![]() ![]() |
Flux 모델의 특징
하이브리드 모델
Flux는 디퓨전 기법 및 트랜스포머 기법을 통합한 하이브리드 아키텍처를 사용합니다. 이를 통해 시각적으로 높은 품질의 이미지를 보다 효율적으로 생성할 수 있습니다. 이 모델은 간단한 텍스트 프롬프트를 처리하여 단 2초이내에 세밀한 이미지를 생성할 수 있습니다.
트랜스포머와 디퓨전 모델은 인공지능 분야에서 가장 핵심적인 두 가지 아키텍처입니다.
"Attention is All You Need"라는 기념비적 논문에서 도입된 트랜스포머는, 어텐션(Attention) 메커니즘을 사용하여 일련의 데이터를 처리하고, 이를 통해 병렬처리와 맥락적인 관계를 이해하는 역할을 합니다. 트랜스포머는 이미지 생성뿐 만 아니라, ChatGPT와 같은 대형 언어 모델(LLM) 자연어 처리에도 널리 이용됩니다.
한편 디퓨전 모델은 데이터에 점진적으로 노이즈를 추가한다음 이 과정을 역방향으로 학습하여, 새로운 고품질의 데이터를 생성하는 방식입니다. 이러한 접근 방식은 사실적인 이미지를 생성할 때 뛰어난 성능을 발휘하였으며, GAN과 같은 전통적인 생성 모델에 대한 안정적이고 효율적인 대안을 제공하였습니다.
이 두가지 아키텍처는 멀티미디어 콘텐츠 생성 및 인공지능 분야에서 중요한 발전을 이루는 전기를 마련했습니다.
뛰어난 품질
FLUX의 성능을 한마디로 요약하면 뭐라고 할 수 있을까요. 답은 "예외적"입니다.
SD3에 대한 실망 이후, Flux는 많은 커뮤니티에서 "우리가 기다려온 모델"이라고 열광적인 찬사를 받았습니다. 이미지 충실도, 생성 속도, 전반적인 품질 등 모든 면에서 기존 오픈소스 이미지 생성 모델을 뛰어 넘었습니다.
FLUX.1 Pro와 Flux.1 Dev 모델은, 출시 이후 여러 측면에서 새로운 기준을 세우고 있으며, 시각적 품질, 프롬프트 이해도, 이미지 크기 및 종횡비의 다양성, 타이포그래피 및 결과의 다양성 등 거의 모든 측면에서 미드저니 v6.0, DALL-E 3(HD), 또는 이디오그램(Ideogram)등의 상업적 서비스에 준하거나 뛰어 넘는 성과를 보이고 있습니다.
특히 2024년 10월 2일에 출시된 새로운 FLUX1.1 버전은 artificiallanalysis.ai의 순위에서 타의 추종을 불허하는 1위를 차지하였습니다.
더군다나, Flux 1 Schnell은 동급 모델 중에서 현재까지 가장 진보된 모델로 평가받고 있어, 농축 모델 분야의 직접적인 경쟁 모델뿐 아니라, 더 강력한 비 농축 모델까지 앞지르고 있습니다.
모든 Flux 모델은 기존의 모델에 비해 생성되는 이미지의 품질, 정확도 및 다양성 등의 측면에서 근본적으로 향상된, 새로운 가능성을 제공하고 있습니다.
참고자료:
FAQ
FLUX를 PC에 설치할 수 있는가?
가능합니다. Dev 모델 및 Schnell 모델은 자유롭게 다운로드 받아 사용할 수 있습니다. 단 Dev 모델은 상업적으로 사용할 수 없습니다. 반면 Pro 모델은 API로만 사용할 수 있습니다.
FLUX AI를 무료로 사용할 수 있는가?
가능합니다. Schnell 및 Dev를 자신의 PC에 설치하면 무료로 사용할 수 있습니다. 또한, 온라인 서비스 중에도 일부 무료로 제공하는 경우가 있습니다.
FLUX AI의 개발자는?
FLUX AI 모델은 독일 Freiburg im Breisgau에 소재한 스타트업 기업인 Black Forest Labs(이하 BFL)에서 개발했습니다. BFL은 경험이 풍부한 연구자들과 엔지니어의 팀이 공동 설립하였으며, 이들 중 다수는 VQGAN, Latent Diffusion, Stable Diffusion과 같은 생성형 AI 분야에서 중요한 혁신을 이루었던 핵심 멤버였습니다.
FLUX AI 중에서 가장 좋은 모델은?
BFL에서 공개한 최신 버전인 FLUX 1.1 Pro가 가장 최고 품질의 이미지(특히 사진)를 제공합니다. 하지만 이 모델은 자유롭게 공유되지 않으므로, Flux.1 Dev를 설치하여 사용하는 것이 최선의 대안입니다.
FLUX는 비디오를 생성할 수 있는가?
아닙니다. FLUX는 텍스트-이미지(text-to-image) 모델이라서, 텍스트로부터 비디오를 생성할 수는 없습니다. 대안으로써, FLUX로 생성한 이미지를 사용하여 LTX Video등의 다른 이미지-비디오(image-to-video) 모델 혹은 Kling과 같은 서비스를 사용하여 비디오를 생성할 수 있습니다.
FLUX로 극사실적 이미지를 생성할 수 있는가?
가능합니다. 사실은 이 분야에서 FLUX는 거의 독보적입니다. 특히 API 서비스로만 가능한 Pro 버전의 경우, DALL-E 3 혹은 미드저니와 같은 기존의 상업적 서비스와 대등하거나 오히려 뛰어넘었다고 평가받고 있습니다.
FLUX로 벡터 이미지를 생성할 수 있는가?
글쎄요. 우선 FLUX는 SVG와 같은 벡터 이미지를 직접적으로 생성할 수없습니다. 하지만, 행성한 이미지를 적당히 벡터 포맷으로 변환하면 어느 정도 가능합니다. 이 글을 참고하세요.
FLUX로 NSFW 이미지를 생성할 수 있는가?
글쎄요. FLUX가 다양한 주제에 대해 고품질의 이미지를 생성할 수 있습니다만, 누드 사진이나 NSFW 이미지의 경우, 민감한 부분은 블러 처리가 되는 등 한계가 있습니다. 물론 LoRA 등을 사용하면 어떠한 제한 없이 원하는 이미지를 생성할 수 있습니다.