AI 이미지/AI 기타

HiDream: 새로운 오픈소스 T2I 챔피온

하늘이푸른오늘 2025. 4. 10. 14:50

HiDream.ai에서 새로운 이미지 생성형 인공지능인 HiDream-l1을 공개하였습니다. 2025년 4월 7일 월요일부터 사용가능한 이모델은 완전한 오픈소스 모델일 뿐 아니라, 매우 뛰어난 시각적 품질, 고급 자연어 이해 및 허용적인 라이선스(MIT)를 채택하고 있어 특히 눈길을 끌고 있습니다.

HiDream-l1

출처: https://github.com/HiDream-ai/HiDream-I1

디퓨전 트랜스포머와 함께 여러가지 전문 텍스트 인코더(T5-XXL, CLIP, LLaMA 3.1)를 결합한 하브리드 아키텍처로 설계된 HiDream-l1은 사실적인 사진, 일러스트레이션, 카툰, 디지털 아트 등과 같은 다양한 스타일의 이미지를 생성할 수 있습니다. FLUX 가 사실적인 이미지에는 뛰어나지만, 다른 스타일에는 취약했던 점에 비해 아주 고무적이네요.

특히 먼저 사용해본 몇몇 분들에 따르면 프롬프트가 짧든 길든 아주 정확하게 이해를 하고 구현한다고 합니다. (이것도 FLUX의 경우엔 T5-XXL 과 CLIP을 사용하는데 비해, LLaMA 3.1을 추가로 사용하기 때문에 충분히 이해가 가네요)

객체의 갯수, 색상 충실도, 속성 관리 등이 이 모델에서 돋보입니다. GenEval, DPG  등의 특수한 벤치마크에 따르면, 기존의 기록을 갈아치우며 최고점을 달성하고 있으며, 심지어는 몇몇 독점 모델에 비해서도 뛰어난 성능을 보인다고 합니다.

4월 10일 현재 Image Leader 보드에는 등장하자마자 Reve나 Imagen 3 등을 뛰어넘고 3위를 차지하였습니다. 지금 추세로 보면 금방 Recraft AI를 따라잡고 2위로 올라서지 않을까 싶네요. 거기다가 지금까지 오픈소스 진영에서 최 강자로 손꼽히고 있었던 Black Forest Labs의 FLUX.1 을 멀찍히 추월하고 있네요.

이번 공개에서 HiDream.ai는 미디저니나 Ideogram과 같은 고가중치 서비스에 대한 믿을 수 있는 오픈 소스 대안을 제공하는 것이 목표라고 주장하고 있습니다. 이러한 서비스들은 모두가 닫힌 인터페이스를 채택하고 있으나, HiDream-l1은 자체적인 호스트를 구축하거나, 사용자의 서비스에 삽입하거나 확장하는 것도 허용됩니다. 이러한 특징은 개발자나 크리에이터, 연구자 등에게 특히 관심을 끌 것으로 기대됩니다.

아래는 HiDream.ai 에서 공개한 비디오입니다.

모델의 종류

HiDream-l1은 아래와 같이 세가지 모델로 공개되었습니다.

  • Full 버전: 최적의 렌더링을 제공하는 완전 버전(50 추론 단계 필요)
  • Dev 버전: 농축 버전(28 단계 필요). Full 버전보다는 가볍지만 뛰어난 품질을 유지하고 있음
  • Fast 버전: 가속 버전(16 단계 필요). 실시간 어플리케이션 용

이 세가지 모델 모두 동일한 17억개의 매개변수에 기초하고 있으며, 렌더링 일관성과 성능 일관성을 유지하고 있습니다.

HiDream-l1 테스트 방법

현재 이 모델을 시험할 수 있는 방법은 아래와 같습니다.

  • 온라인: Vivago AI 사이트에서 무료로 사용할 수 있습니다.
  • Hugging Face에서는 Dev 버전의 Gradio demo를 사용할 수 있습니다.
  • GitHub에 있는 설명을 따르면 자신의 PC 에 직접 설치하여 사용할 수도 있습니다.

SNS 반응

현재 소셜미디어에서는 반응이 열광적이라고 합니다. 

Reddit의 경우, 이미지 품질이 오픈소스인 Midjourney 6와 동등한 수준"이라고 여러 사용자들이 언급하고 있으며, X의 경우 Dev 버전으로 생성된 이미지 스타일이 인삭적이라고 평가하고 있습니다. 오픈소스 커뮤니티에서는 이미 ComfyUI나 A1111 과 같은 기존 워크플로에 통합하는 중이라고 합니다.

HiDream.ai는 이 모델을 통해, 자유로우면서도 고성능의 목표를 제공한다는 웅대한 목표를 달성한 것으로 보입니다. 앞으로 HiDream-l1은 가히  인공지능 이미지 생성분야의 필수품이 되지 않을까... 하고 기대해 봅니다.

흠... ComfyUI에는 언제쯤 등장할까요? 많이 기대되네요~

이상입니다. 

이 글은 stablediffusion.blog의 글을 참고하여 작성한 글입니다.