Recraft 에서는 10월 30일, 이미지 생성 분야에서 최고의 성능을 발휘한다고 평가받는 Recraft V3를 공개하였습니다. Recraft V3는 Artificial Analysis의 Text-to-Image Leaderboard에서 모든 경쟁 모델을 제치고 1등을 차지하였습니다.
무엇보다 새로운 Recraft V3는 이미지 품질이 뛰어나고, 프롬프트를 잘 이해하고 따르며 인체를 정확하게 표현하는 등, 기존의 이미지 생성 인공지능의 기능에서 중요한 요소를 성공적으로 해결한 것으로 보입니다. 그 위에 래스터 이미지외에도 벡터 이미지를 지원하고, 텍스트 위치와 크기를 지정하거나, 브랜드 이미지를 입력받아 스타일을 지정하는 등의 기존의 이미지 AI에서는 보기 힘든 기능을 제공하여, 특히 전문 디자이너에게 필수적인 기능을 제공하고 있습니다. 기타 배경제거나 인페인팅 아웃페인팅 등의 여러가지 도구도 제공하고 있고요. Recraft V3는 데크탑 앱, 모바일 앱(iOS 및 Android) 및 API를 통해 무료 및 유료 사용자로 제공됩니다.
제가 테스트를 하고 적은 게 아니라, 보도자료를 보고 정리하면서 제 느낌을 적은 것이기는 하지만, 텍스트 이미지 리더보드에서 몇달간 계속 1위를 차지하고 있는 이유가 아닐까하고 생각해봤습니다.
이미지 생성 품질 벤치마크 우승
Recraft v3는 공식적으로 공개하기전, Red panda라는 이름으로 텍스트-이미지 리더보드에 참여해서, ELO 등급 1172점으로 1위를 차지했습니다. 미드저니, Flux, DALL-E 등 주요 인공지능 이미지 생성 분야의 경쟁자보다 더 품질이 높다고 평가받은 것입니다.
이 리더보드는 여러가지 작업 및 데이터세트에서 머신 러닝 모델의 성능을 평가하고 비교하는 유명한 사이트입니다. 특히 이 순위는 여러 사이트 중에서 임의로 생성한 두가지 결과물을 보여주고, (단, 어떤 모델로 생성되었는지는 숨긴 채) 사용자가 품질을 평가하는 방식(ELO 레이팅)으로 이루어지므로, 가장 신뢰도가 높다고 할 수 있습니다.
아래는 2025년 3월 4일 현재의 순위로, 1149 점으로 점수는 약간 내려왔지만, 여전히 1위에 올려져 있습니다. 그 동안 순위는 큰 변화가 없는데, 구글의 Imagen 3가 3위로 끼어든 게 가장 눈에 띄네요.
Recraft V3의 강점
Recraft V3의 최고 강점은 텍스트 생성 품질, 인체 묘사의 정확성, 뛰어난 프롬프트 이해도 및 심미적 가치입니다. 거의 모든 분야에서 강점을 가지고 있다고 주장하고 있네요.
텍스트 생성
Recraft V3는 현재 출시된 수많은 텍스트-이미지 생성 모델 중에서 긴 문장을 정확하게 렌더링할 수 있는 모델이라고 합니다. 아래에서 보시는 것처럼 (기존의 이미지 생성모델에 비해서는) 엄청나게 긴 문장도 정확하게 표현하고 있습니다. 이 부분에 대해서는 정말 그럴까 싶은 정도네요.
![]() |
![]() |
인체 묘사 정확성
인공지능 이미지를 접해본 분이시라면, 대부분 손발의 갯수가 맞지 않거나, 손가락의 수나 형태가 이상한 이미지를 많이 보셨을 겁니다. 오픈 소스 이미지 생성모델 중에서는 SDXL에서 약간 해결되었고, Flux에 들어서 거의 해결되었는데, Recraft V3는 손가락/손/발의 수, 신체 비율, 장면내 공간적 일관성, 피사체와 배경 객체의 자연스런 위치 등의 측면에서 매우 뛰어나가도 주장하고 있습니다.
뛰어난 프롬프트 이해도
프롬프트를 이해하고 따르는 능력은 프롬프트에서 지정된 세부적인 정보와 생성된 이미지가 얼마나 정확하게 일치하는지를 나타냅니다. 이 역시 오픈 소스 이미지 생성모델 중에서는 SDXL에서 약간 해결되었고, Flux에 들어서 거의 해결되었는데, Recraft V3도 자신의 모델이 매우 뛰어나다고 주장하고 있습니다. 특히 개체의 갯수, 색상, 위치 등을 포함한 복잡한 장면을 정확하게 재현한다고 합니다.
![]() |
![]() |
심미적 가치
미적 가치는 이미지의 "아름다움"에 대한 주관적인 척도입니다. 이제까지는 특히 미드저니(Midjourney)가 가장 뛰어나다고 알려져 있었습니다. Recraft V3 는 이 점을 고려해서 미적 가치가 높은 이미지를 생성하도록 학습시켰다고 합니다.
제어 및 디자인 기능
Recraft는 전문 디자이너의 요구를 해결할 수 있는 이미지를 생성하고자하는 목표로부터 시작했습니다. 그런데, 텍스트-이미지 생성이 아무리 뛰어나다고 해도, 실 세계의 디자인 작업에서는 미흡할 수 밖에 없었습니다. 텍스트가 생성된다고 해도 어디에 어떤 크기로 어떤 폰트로 생성되는지를 제어할 수 없는 등, 기본적인 제어 기능도 없기 때문입니다.
Recraft V3는 이러한 문제를 해결하기 위해 기존의 AI 모델보다 이미지 생성시 더 자세하게 제어할 수 있도록 학습시켰다고 합니다.
위치 제어 및 그래픽 디자인 생성
Recraft V3를 사용하면 이미지에 나타나는 텍스의의 위치와 크기를 지정할 수 있습니다.
또한 다른 이미지 요소의 위치도 지정할 수 있어서 복잡한 그래픽 디자인을 생성할 수 있습니다. 이런 기능은 정말 디자이너에게 꿈같은 소식이겠네요. 물론 글씨 없이 생성한 다음, 후 편집하는 방법도 있겠지만, 처음부터 이렇게 지정을 하고 이미지를 생성할 수 있으면 훨씬 디자인 작업이 편해질 것 같습니다.
스타일 제어
Recraft V3는 스타일을 입력 받을 수 있습니다. 즉, 자신의 브랜드를 대표하는 스타일의 이미지를 몇장 선택하여 해당 스타일의 출력물을 생성할 수 있다는 것입니다. 스타일을 텍스트로만 지정하는 것이 아니라, 이미지로 지정할 수 있다는 것은 정말 괜찮은 방식인 것 같습니다. 예전에 이러한 방식을 사용하려면 먼저 브랜드 이미지를 사용해 LoRA 등을 만드는 방법을 생각할 수 있는데, Recraft V3는 모델을 다시 학습시킬 필요가 없다고 합니다.
기타 AI 지원 기능
Recraft V3 는 이러한 디자인 지향의 이미지 생성외에도, 벡터 이미지 생성을 지원합니다. Raster 이미지를 생성한 다음 벡터로 전환할 필요가 없을테니 경우에 따라서는 작업 효율이 많이 높아질 듯 합니다. 이외에도 AI 지우개, 영역 수정, 인페인팅, 아웃페인팅, AI 목업, 크리에이티브 업스케일러, 크리스프 압스케일러, AI 미세보정 등 다양한 AI 지원 기능을 제공한다고 하네요.
API 지원
무엇보다 Recraft는 개발자와 기업들이, SOTA 이미지 생성 및 AI 디자인 기능을 워크플로에 통합할 수 있도록 지원하는 API를 지원합니다. 이러한 API를 사용하면 Recraft 모델에 접근하여 래스터 및 벡터 이미지를 생성하고, 브랜드 일관성을 보장하는 사용자 정의 스타일을 명시할 수 있습니다. 아울러 API는 위에서 언급한 여러가지 AI 지원기능도 지원한다고 합니다.
API 문서 페이지에 들어가면 API 사용 예제들을 볼 수 있는데, 왠만한 작업은 API만으로도 모두 접근 가능해 보입니다. 물론 잘 사용하려면 프로그래밍이 필수지만요.
이상입니다.
이 글은 Recraft V3 공개 보도자료를 참고하여 제 의견을 첨부하여 작성하였습니다.
- ComfyUI로 설치 및 사용법 기초
- ComfyUI 투토리얼
- ComfyUI를 위한 유용한 정보
- ComfyUI와 SDXL 사용법(1) - 기초
- ComfyUI에서 ControlNet 사용법
- 편리한 ComfyUI 워크플로 모음
- LCM-LoRA - 초고속 스테이블 디퓨전
- Stable Video Diffusion(비디오 스테이블 디퓨전)