AI 이미지/Flux AI

Flux: 모델별 성능 비교

하늘이푸른오늘 2025. 2. 28. 19:53

Flux 모델 개요

이미지 생성형 AI인 Flux를 개발한 Black Forest Labs는 2024년 8월 Flux.1 Schnell, Flux.1 Dev, Flux.1 Pro  등 세가지 모델을 공개하였고, 2024년 10월에는 Flux 1.1 Pro(Ultra) 모델을 공개하였습니다.

이러한 버전은 다음과 같은 특징이 있습니다.

모델 이름 특징 라이센스 VRAM 사양 API or Model Download Link
FLUX 1.1 Pro Ultra 최고의 성능과 품질을 제공하는 대표 모델, 선명하고 고해상도 이미지 제공. 상용 라이센스   API 호출
FLUX.1 Pro 고품질 이미지를 제공하는 상용 버전 상용 라이센스   API 호출
FLUX.1 Dev 비-상용 연구용 오픈소스 버전. FLUX.1 Pro와 유사한 이미지 품질과 효율성을 제공. 비상용 라이센스 16GB 이상 Download
FLUX.1 Schnell 경량화된 상용 버전. 빠른 실행 속도와 높은 효율성 Apache 2.0 12GB 이상 Download

이 이외에도 저사양의 PC를 위해서 개발된 GGUF 버전도 있습니다. 좀 더 자세한 사항은 이 글을 참고하시기 바랍니다.

Flux는 HuggingFace의 Text-to-Image-Leaderboard 에서 확인할 수 있듯이, Midjourney나 Stable Diffusion 3.5, DALL-E 등을 제치고 2,4,6 등을 차지하고 있습니다(참고로 이 사이트는 [Image Arena]에 참여한 분들의 평가를 기초로 집계된 것입니다).

이처럼 Flux 는 공개된 버전인 dev마저도 최신의 Midjouney와 필적할 정도의 성능을 보여주고 있다고 평가받고 있습니다. 그런데 각 모델간에는 어느 정도의 차이가 있을까요? 이 글에서는 여러가지 프롬프트를 사용하여 이러한 내용을 알아보겠습니다.

이미지 생성 방법

이 글에 포함된 모든 이미지는 Replicate의 Black Forest Labs 템플릿 중에서 아래의 4가지를 기본 설정으로  생성하였습니다. 매번 동일한 프롬프트를 사용해 편집이나 수정없이 4개의 이미지를 생성하였습니다.

- https://replicate.com/black-forest-labs/flux-1.1-pro  (생성비용 이미지당 $0.04)
- https://replicate.com/black-forest-labs/flux-pro         (생성비용 이미지당 $0.055)
- https://replicate.com/black-forest-labs/flux-dev        (생성비용 이미지당 $0.025)
- https://replicate.com/black-forest-labs/flux-schnell   (생성비용 이미지당 $0.003)

프롬프트 이해도

Flux 모델은 여러가지 요소가 포함된 프롬프트를 잘 이해하고, 이를 이미지로 재현하는 능력이 뛰어납니다. 4가지 버전 모두 프롬프트 이해도는 뛰어난 편이나, 상위버전에서 하위버전으로 내려갈수록(1.1 Pro -> Pro -> Dev -> Schnell) 이해도가 낮아지는 걸로 보입니다.

프롬프트: A captivating vintage-inspired movie poster featuring a black cat wearing a white suit and a red tie pointing a gun at the viewer. To his left, a smaller white cat wears a black tuxedo and is counting money from a bundle of bills. The background is a dark alley in a big city. (흰색 정장에 빨간 넥타이를 매고 총을 겨누고 있는 검은 고양이가 등장하는 빈티지풍의 매력적인 영화 포스터. 그 왼쪽에는 검은색 턱시도를 입은 작은 흰색 고양이가 지폐 다발에서 돈을 세고 있습니다. 배경은 대도시의 어두운 골목입니다.)
Flux 1.1 Pro Flux Pro
Flux Dev Flux Schnell
프롬프트: Photo of a red sphere on top of a blue cube. Behind them is a green triangle, a dog on the right, a cat on the left.(파란색 큐브 위에 빨간색 구가 있는 사진. 그 뒤에는 녹색 삼각형이 있고 오른쪽에는 개가, 왼쪽에는 고양이가 있습니다.)
Flux 1.1 Pro Flux Pro
Flux Dev Flux Schnell

텍스트 표현

Flux 모델은 텍스트 표현 부분에서도 뛰어난 성능을 발휘합니다. 하지만 문장이 길어지거나 숫자와 섞이는 등 문장이 복잡해지면 오타가 발생하는 확률이 높아집니다. 또한, 하위 버전으로 내려갈 수록 글자들이 섞이거나 잘못 표현되는 경우가 늘어납니다. 

프롬프트: A woman with sandy hair clad in cyberpunk style clothes is marching in the street holding a sign that says “I’M ONLY HERE BECAUSE I LIKE HOLDING UP SIGNS” (사이버 펑크 스타일의 옷을 입은 모래색 머리를 한 여성이 “나는 단지 표지판을 들고 있는 것이 좋아서 여기 있습니다”라고 적힌 팻말을 들고 거리를 행진하고 있습니다.)
Flux 1.1 Pro Flux Pro
Flux Dev Flux Schnell
프롬프트 : A rounded fridge magnet that says "Flux is the best model to generate text", 80's design with flowers and rainbow (“플럭스는 텍스트를 생성하는 최고의 모델입니다"라고 적힌 둥근 냉장고 자석, 꽃과 무지개가 있는 80년대 디자인)
Flux 1.1 Pro Flux Pro
Flux Dev Flux Schnell

사실적 사진

이미지 생성용 인공지능이 가장 많이 사용되는 분야가 사실적 사진 생성입니다. Flux는 LoRA 등을 사용하지 않아도 높은 품질의 사실적 사진을 생성합니다. 다만 schnell의 경우에는 인공적인 텍스처가 눈에 띄기도 합니다.

프롬프트: Portrait photo of a 25 year old american man in crowded pub (붐비는 술집에 있는 25세 미국인 남성의 인물 사진)
Flux 1.1 Pro Flux Pro
Flux Dev Flux Schnell

인체 표현

사실적 인물 사진 생성에서 인체의 해부학적 구조 및 비율은 매우 중요한 요소입니다. 다행히, 손가락이 더 적게 혹은 더 많게 표현되는 시대는 끝난듯합니다. Flux 는 사실적이고 비례에 맞는 인체를 생성하는데 있어, 기존의 SDXL과 같은 오픈소스 모델보다 성능이 뛰어납니다.

프롬프트: Portrait of a smiling person with hands resting on knees, clearly showing details of hands and face. (무릎에 손을 얹고 웃는 사람의 초상화, 손과 얼굴의 디테일이 선명하게 드러납니다.)
Flux 1.1 Pro Flux Pro
Flux Dev Flux Schnell
프롬프트: High quality photo of a bearded man wearing a tuxedo and showing his hands to the camera (턱수염을 기른 남성이 턱시도를 입고 카메라를 향해 손을 내미는 고화질 사진)
Flux 1.1 Pro Flux Pro
Flux Dev Flux Schnell

예술적 스타일

Flux 는 사실적 사진을 생성하는데 강점이 있지만, 다른 예술적 스타일도 생성가능합니다. Flux가 처음 공개되었을 때, 사용자들은 이 분야에서만큼은 SDXL보다 못하다는 게 중평이었습니다. 하지만 기본 모델도 여러가지 스타일의 이미지를 생성할 수 있습니다. 다만 경우에 따라 다르지만, 상위버전에 가까울 수록 사실적인 이미지로 렌더링되는 경향이 있는 듯 합니다.

프롬프트: Star wars Jedi Knight in pixel art, holding a purple light saber.(보라색 광선검을 들고 있는 픽셀 아트 스타일의 스타워즈 제다이 기사)
Flux 1.1 Pro Flux Pro
Flux Dev Flux Schnell
프롬프트: The Shepard robot sits quietly in a secure spot with a little lamb on its lap, In the style of studio ghibli anime.(셰퍼드 로봇이 어린 양을 무릎에 앉힌 채 안전한 곳에 조용히 앉아 있습니다. 스튜디오 지브리 애니메이션 스타일)
Flux 1.1 Pro Flux Pro
Flux Dev Flux Schnell
프롬프트: blue ink ballpoint pen drawing of a high speed coupe sports car, fast, drifting, speed(고속 쿠페 스포츠카의 파란색 잉크 볼펜 드로잉, 빠른, 드리프트, 속도)
Flux 1.1 Pro Flux Pro
Flux Dev Flux Schnell

결론

모든 버전이 각각 장단점이 있지만, 최신의 Flux 1.1 Pro (및 Ultra)가 가장 성능이 뛰어나다는 것은 분명합니다. 하지만, Pro 버전의 상세함과 사실성이 필요하지 않다면, 대부분의 경우 Dev 버전만으로도 충분히 좋은 결과물을 얻을 수 있습니다. 다만 Schnell 버전은 속도가 빠르기는 하지만 이미지 품질면에서는 살짝 미흡해 보입니다.

하지만, Dev 와 Schnell은 다운로드 받아서 무료로 사용할 수 있으며, LoRA와 같은 새로운 모델을 학습시켜 사용하는 것도 자유롭습니다. 이러한 유연성 덕분에 연구자들이나 개발자들은 자신의 특정한 목적에 맞는 파생 모델을 개발할 수 있습니다. 다만 Dev 모델의 경우 비-상업적 라이선스가 적용되므로 유의해야 할 것입니다.

이들 모델중 어떤 버전을 선택할 것인지는 생성 속도나 이미지 품질면에서의 특정한 요구사항 뿐 만 아니라, 장기적인 목표에 따라 달라질 것입니다. 상업적 용도로 Pro 버전의 고품질 이미지가 필요한 것인지, 파생 모델을 개발할 수 있는 Dev 버전의 유연성을 택할 것인지, 완전히 자유롭게 사용할 수 있는 Schenell 버전이 필요한지를 생각해볼 필요가 있을 것입니다.

바로 이러한 다양한 옵션이 Flux 의 또다른 강점이라고 할 수 있습니다. 

이상입니다.

이 글은 stablediffusion.blog의 글을 번역하면서 제가 테스트한 결과로 대체하여 작성하였습니다.