AI 이미지/Flux AI

FLUX 실행을 위한 최적 요구사항

하늘이푸른오늘 2025. 2. 17. 13:18

FLUX AI 모델은 출시된지 단 몇주만에 이미지 생성 분야의 게임체인저가 되었습니다. Stable Diffusion 3에 실망한 많은 오픈소스 커뮤니티 뿐만 아니라, DALL-E나 Midjourney와 같은 대형 독점적 서비스에 익숙해진 사용자들에게도 인기를 끌고 있습니다.

하지만, FLUX를 잘 활용하려면 시스템과  GPU 요구사항을 잘 파악하는 것이 중요합니다. 특히 FLUX는 다양한 버전으로 제공되며, 버전별로 특정 하드웨어 구성에 맞도록 조정되어 있다고 생각되기 때문입니다. 

FLUX 실행 요구사항을 한마디로 요약하자면, 최소 VRAM 요구사항은 6GB이지만, 편안하게 사용하려면 최소 12GB가 필요하고, Black Forest Labs에서 요구하는 사양은 24GB라는 것입니다.

이 글에서는 FLUX.1 버전에 따른 권장 구성 및 양자화(Quantization)가 성능에 미치는 영향을 알아보겠습니다.

FLUX 모델의 종류

FLUX 개발자인 Black Forest Labs는 세가지 종류의 버전(Pro, Dev, Schnell)을 제공하며, 각각 특정한 요구사항 및 하드웨어 구성에 따라 조정되었습니다. 이 이외에도 GGUF 포맷과 같은 다양한 이진/양자화 기법을 사용한 몇가지 버전을 더 알아보아야 합니다.

양자화란?

양자화란 모델 매개변수의 수치 정밀도를 낮추는 것을 의미합니다. 실제로는 양좌화를 적용하면 성능을 크게 희생하지 않고도 여러가지 하드웨어 구성에 맞게 모델을 조정할 수 있습니다.

양자화가 이루어지면 처음에 32비트 부동 소수점 형식으로 저장된 매개변수 값을, 낮은 정밀도 포맷(16, 8, 4 등)으로 변환하게 됩니다. 이러한 결과로 모델의 크기가 줄어들게 되고, 이에 따라 VRAM 요구량도 줄어들게 됩니다.

요약하자면, FLUX 모델에 대한 양자화 버전은 아래와 같습니다.

  • 원래의 FP16 모델 : 이 모델은 가장 정확하고, 양자화를 적용하지 않은 버전으로서, 24 GB의 VRAM이 필요합니다.
  • Q8, FP8, NF4  버전 : 이미지 품질은 거의 유지되면서도 VRAM 요구량이 상당히 감소(16GB 이하)합니다.
    이중에서도 Q8 GGUF가 가장 좋은 옵션으로, FP16  버전과 거의 유사한 성능을 발휘합니다.
    Flux NF4는 6~12GB의 VRAM을 가진 기기에서 사용할 수 있는 훌륭한 대안입니다.
  • Q2~Q6 버전 : 보다 공격적으로 양자화를 적용하여, 초급 ~ 중급 GPU(6GB 이하)에서도 사용가능합니다.

따라서 어떤 버전을 사용할지는 사용자의 하드웨어 및 이미지 생성 목표에 따라 달라집니다. 아래에서는 각 버전별로 VRAM 요구사항을 상세하게 설명하여, 어떤 버전이 적합할지 선택하는데 도움이 되고자합니다.

참고: 모델 일부를 VRAM이 아닌 RAM에 올릴 수 있는 인터페이스도 있지만, FLUX 모델 전체를 VRAM으로 올릴 수 있는 GPU 를 사용하는 것이 좋습니다.

버전별 추천 GPU

아래는 여러가지 양자화 버전별 비교 표입니다.

버전 VRAM 성능 추천 GPU 용도
Flux.1 Dev 24 GB 최고 성능, 최고 품질 Nvidia RTX 4090,
A6000
최고 품질의 이미지 생성
Flux-FP8 16 GB 고품질 Nvidia RTX 3080,
RTX 4080
고품질의 이미지 생성
GGUF-Q8 8~12 GB FP16에 준하는 품질 (99%) 최고 최적화 Nvidia RTX 3060 Ti,
RTX 3070
일반적인 이미지 생성
Flux.1 NF4 6~12 GB 4비트 양자화. 저성능 PC에 적합 Nvidia GTX 1650,
RTX 2060
초급 GPU, 빠른 생성

참고로, 위의 링크를 따라가면 해당 버전을 다운로드 받을 수 있습니다. 그런데 양자화버전의 경우 매우 많은 종류가 있으니 적절히 선택하셔야 합니다.

하드웨어 추천

하드웨어에 따라 Flux.1 의 성능을 극대화하기 위해서, 여기에서는 양자화 FLUX를 기준으로 3 가지 단계의 권장 하드웨어 사양을 소개합니다. 각 단계는 초급 입문 사용자로부터 전문가 수준의 사용자까지 요구사항별로 정리하였습니다.

초급 입문자용 구성

이 구성은 오래된 하드웨어를 사용해 Flux.1으로 이미지를 생성하려는 사용자를 위한 구성입니다.

  • 프로세서 : 2.0 GHz 이상의 듀얼코어
  • RAM : 8 GB
  • VRAM : 6 GB (NVidia GTX 1650, RTX 2060)
  • 저장공간 : 250 GB이상의 여유 공간
  • 운영체제 : Window 10 또는 Linux
  • 사용 예 : 이 수준의 하드웨어는 Flux.1 NF4와 같은 양자화 모델을 사용할 수 있습니다. 보급형 GPU에서 좋은 성능을 발휘합니다. (참고: VRAM이 적은 PC에서 Flux AI 실행하기)

중급용 구성

이 구성은 중간 수준의 그래픽 카드를 사용하여, 속도와 품질 사이에 균형을 유지할 수 있는 구성입니다.

  • 프로세서: 2.5 GHx 이상의 쿼드코어
  • RAM : 16 GB
  • VRAM : 8~12 GB (GGUF-Q8의 경우 Nvidia RTX 3060Ti, RTX 3070, Schnell의 경우 RTX 4060Ti, RTX 4070)
  • 저장공간 : 500 GB 이상의 여유 공간
  • 운영 체제 : Window 10 또는 Linux
  • 사용 예: 이 수준의 하드웨어는 적절한 균형을 원하는 사용자에게 적합합니다. GGUF-Q8이 가장 이상적이며, Flux.1 Schnell을 사용하면 빠르게 이미지를 생성할 수 있습니다.

고급 구성

이 구성은 최고 품질의 이미지를 생성하고자하는 까다로운 사용자에게 권장됩니다.

  • 프로세서: 3.5 GHx 이상의 헥사코어
  • RAM : 32 GB (대규모 프로젝트의 경우 64 GB)
  • VRAM : 16~24 GB (Flux-FP8의 경우 NVidia RTX 3080, RTX 4070, Flux.1 Dev의 경우 RTX 4090, A6000)
  • 저장공간 : 1~2 TB SSD
  • 운영 체제 : Window 10 또는 Linux
  • 사용 예: 최고 수준의 성능을 요구하는 전문 사용자 또는 대형 프로젝트에 이상적입니다. 

AMD의 경우

Nvidia 와 AMD GPU 모두 FLUX.1 을 실행시킬 수 있습니다. 하지만, Nvidia의 CUDA를 보다 잘 지원하고 드라이버가 최적화되어 있어, 동급사양이라면 Nvidia가 성능이 더 좋습니다. 테스트 결과 Nvidia 카드가 특히 추론 속도 및 안정성 측면에서 AMD 카드보다 우수한 성능을 발휘합니다.

그럼에도 불구하고 이미 AMD GPU를 가지고 있거나, 비용을 절약하고자 하는 경우 AMD는 훌륭한 대안입니다. 

참고로, 여러 사용자에 따르면 FLUX의 GGUF 양자화 버전은 AMD 하드웨어에서도 잘 작동하지만, 생성시간이 더 긴 경우가 많다고 합니다.

Mac의 경우

일반적인 인식과는 달리, Apple Silocon 칩이 장착된 Mac에서 Flux 모델을 사용하는 것은 전혀 문제가 없습니다. 이러한 모델은 AI 모델을 실행하는데 필요한 MPS 구현에서 실직적으로 유리한 부분이 있습니다.

M1, M2, M3 Mac에서는 빠르지는 않지만, Flux를 실행시킬 수 있습니다.

클라우드 대안

위에서 보신 것처럼 FLUX를 로컬에서 실행하려면 일정 수준 이상의 GPU 를 갖춘 기기가 필요합니다. 하지만, 이러한 기기가 없다면, 클라우스 서비스를 이용하는 것도 좋은 대안입니다.

FLUX.1이 오픈소스이기 때문에 FLUX는 이미 수많은 사이트에 통합되어 있습니다. 구글에서 "Flux online image generator"정도로 검색해보면 한글로 서비스하는 사이트를 비롯해 수많은 서비스가 존재합니다. 이중에는 일부 무료로 생성할 수 있는 크레딧을 제공하는 사이트도 있으니 확인해 보시기 바랍니다.

이런 서비스는 대부분 프롬프트와 이미지 크기 정도만 설정할 수 있는 것이 대부분입니다. 실제로 FLUX는 프롬프트의 이해도가 매우 높기 때문이 이 정도 설정만으로도 좋은 결과물을 얻을 수 있는 것이 사실입니다.

하지만, 더 많은 제어 기능이 필요하시거나, 로컬에서 실행하는 것과 거의 비슷한 환경을 원한다면 Rundiffusion과 ThinkDiffusion 클라우드 서비스를 선택하는 것도 좋은 방법입니다. RunDiffusion에서 ComfyUI 실행하기를 읽어보시면 도움이 되실 겁니다.

===

결론적으로 Flux.1의 기능을 최대한 활용하려면 적절한 하드웨어 구성이 필수적입니다. 초급용이든 최고급 사양이든, 적절한 FLUX 버전을 찾아 사용하시면서 필요에 따라 클라우드를 활용하시면 필요한 만큼의 결과물을 얻을 수 있을 것입니다.

VRAM, 양자화 버전 등을 종합적으로 고려하여 시스템을 구성하면, 워크플로의 효율성을 극대화하면서도 현재의 기기에서 가장 최고 수준의 이미지 품질을 확보할 수 있으실 겁니다.

이상입니다.

이 글은 stablediffusion.blog의 글을 번역하며 제가 생성한 결과로 대체하여 작성한 글입니다.