이미지 생성 AI 59

새로운 GPT-4o 이미지 - ChatGPT

OpenAI에서 엊그제 GPT-4o 챗봇에 이미지 생성 기능을 추가하였습니다. (관련 공지 링크) 사실 그냥 "추가"라고 하기에는 너무 센세이션을 일으키고 있습니다. 제가 이제까지 여러가지 이미지 생성 모델이나 서비스를 다루어 왔지만, 이번 GPT-4o에 추가된 이미지 생성기능은 그야말로 혁명적이라고 할 수 있기 때문입니다.GPT 4o 이미지의 장점GPT 4o 이미지 생성방법언제 사용할 수 있나?결론4o 이미지의 장점고품질의 이미지제가 사용하는 ChatGPT에는 아직 새로운 이미지 생성기능이 반영이 되어 있지 않아 직접 시험해 보지는 못했지만, 여러 SNS에 올려진 사용기를 보면 이미지 품질은 정말 뛰어나다고 합니다. 또한 여러가지 스타일의 이미지도 자유자재로 생성이 된다고 하고요. 이 글을 읽어보면 그..

새로운 이미지 AI 강자 탄생 - Reve Image 1.0

얼마전부터 이미지 생성행 AI 에 새로운 폭풍이 몰아치고 있습니다. 캘리포니아에 소재한 Reve AI라는 회사에서 출시한 Reve Image 1.0 입니다. 며칠전 Halfmoon(반달)이라는 이름으로 처음 등장하더니, 이제는 얼마전까지만 해도 1위를 차지하고 있던 Recraft AI를 제치고 Text-to-Image Leader 보드에서 1위를 차지했습니다. 보시는 것처럼, Google Imagen 3, BFL의 FLUX1.1 pro, Midjourny 등을 모두 제쳤네요.Reve AI: 캘리포니아의 새로운 도전자그런데 아직까지도 이 모델에 대한 공식적인 공지 나 보도자료는 나오지 않고 있습니다. 이 모델을 제작한 Reve AI, Inc 에 대해서도 별로 알려진 게 없는 상태고요. 본사가 캘리포니아에 ..

Gemini에서 이미지 생성 방법

구글 DeepMind의 이미지 생성 AI 인 Imagen 3가 발표된지 몇주만에 이미지 생성을 위한 새로운 첨단 모델중 하나로 자리잡았습니다. 아직 시도해 보지 않으셨거나 무료로 그 효과를 느껴보고 싶다면, 구글의 챗봇인 Gemini를 통해서 무료로 사용할 수 있습니다(참고로 Image FX 사이트에서도 사용할 수 있습니다).Gemini의 Imagen3Gemini에서 프롬프트 잘쓰기Gemini로 생성한 이미지의 예Gemini의 Imagen3Gemini란? 영어로 Gemini란 쌍둥이라는 뜻입니다. 구글에서 개발한 다재다능한 대화형 비서에 왜 쌍둥이란 이름을 붙였는지는 잘 모르겠네요. 아마 구글과 Gemini는 한 몸이라는 뜻으로 붙이지 않았을까... 상상해 봅니다. 어쨌든 현재 대규모 언어 모델(LLM,..

구글 Imagen 3 개요

Imagen 3는 구글 Deepmine에서 개발한 최신 인공지능 이미지 생성 모델입니다. 이 모델은 1532x1532 해상도의 뛰어난 품질의 이미지를 생성합니다. 특히 놀라운 디테일, 생상하고 사실적인 색상 렌더링 능력이 돋보입니다. Imagen 3는 극 사실주의로부터 추상 미술, 애니메이션까지 다양한 예술 스타일을 표현하는데 뛰어난 강점을 가지고 있습니다.Imagen 3는 Gemini 와 ImageFX 사이트에서 사용할 수 있으며, API 를 통해 다양한 도구와 통합할 수 있습니다.Imagen 3란?Imagen 3의 아키텍처DeepMinde 란?Imagen 3의 사용방법Imagen 3의 프롬프트Imagen 3의 세부사항Imagen 3란?Imagen 3는 구글 DeepMind 연구자들이 개발한, 고급 디..

Flex.1 - 새로운 오픈소스 Flux

Flex.1 Alpha 개요개발 배경사용 방법Flux.1 dev GUFF 와 Flex.1-alpha 의 비교새로운 오픈소스 이미지 생성용 인공지능 모델 Flex.1이 HuggingFace 에 공유되었습니다.Flex.1-alpha 는 예전에 Flux 미세조정 솔루션을 공유했던 ostris가 개발했습니다. 이 모델은 매개변수가 80억개이며, "guidance embedder"와 통합하여, 이미지 생성시 무분류기 안내(CFG, Classifier-Free Guidance)가 필요 없는 특징이 있습니다.Flex.1은 FLUX.1 deve 아키텍처위에 개발되었는데, 듀얼 트랜스포머 블록(dual transformer block)의 수를 19개에서 8개로 줄였다고 합니다. 이렇게 최적화시킴으로써 이미지 품질을 유지..

BFL, FLUX Pro 미세조정 API 발표

이미지 생성형 인공지능 모델 FLUX를 개발한 Black Forest Labs(이하 BFL)에서 Flux Pro  미세조정 API를 발표했습니다. Flux Pro는 Replicate나 fal.ai 와 같은 파트너사에서만 사용할 수 있어서, 그 동안에는 기본 base 모델로만 이미지를 생성할 수 있는데, 이번 미세조정 API를 사용하면 사용자가 원하는 인물, 물체, 브랜드, 스타일 등을 추가할 수 있다는 것입니다.이 기능은 기본적으로 Flux Dev에서 LoRA를 학습하는 것과 비슷하다고 볼 수 있지만, Flux.1 pro 뿐만 아니라, Flux 1.1 pro Ulta 혹은 Raw 모델에도 사용할 수 있다는 점이 중요하다고 할 수 있습니다. 즉, FLUX Pro 미세조정 API를 사용하면 자신만의 이미지나..

Flux 1.1 [pro] Ultra & Raw 모드

2024년 11월 6일, 이미지 생성형 인공지능 모델인 FLUX의 개발사 Black Forest Labs(이하 BFL)에서 10월 2일 발표한 Flux 1.1 [pro] 모델을 업그레이드하여 새롭게 Ultra 모드와 Raw 모드를 추가시켰다고 발표하였습니다.이번 발표의 핵심은 FLUX1.1 [pro] Ultra 모드입니다. 이 모드는 기존의 FLUX1.1 [pro]에 비해 4배의 해상도로 출력이 가능해졌습니다. FLUX1.1 [pro]가 1024x1024 이상에 최적화 되어 있으니, 적어도 2048x2048 이상의 이미지를 생성하는데 아무런 문제가 없다는 것입니다. 특히, 이렇게 해상도가 높아지면서도 생성 속도는 10초 정도로, 경쟁 서비스에 비해 월등히 빠른 속도를 자랑합니다. 생성 비용은 이미지 한장..

Flux를 15분내에 설치하기

혹시 Flux를 자신의 PC에 설치하기가 아주 힘들다는 이야기를 들어보셨을지 모르겠습니다. 하지만 당황하실 필요 없습니다. 이 글을 따라가면 단 15분 만에 Flux를 설치를 끝내고 바로 사용할 수 있습니다.필수조건Flux를 자신의 PC에 설치해야 하는 이유Flux 설치 따라하기필수조건이 글에서는 모든 종류의 스테이블 디퓨전 관련 웹 인터페이스를 한꺼번에 설치하고 관리할 수 있는 Stability Matrix를 이용하여 Flux를 로컬에 설치하는 방법을 설명합니다. 이 프로그램을 사용하면 아주 간단하게 Flux를 설치하고 실행시킬 수 있습니다.하지만 이를 위해서는 자신의 PC의 GPU가 최소 8GB의 VRAM을 갖추고 있어야 하며, Linux 또는 윈도우 10 이상이 설치되어 있어야 합니다(참고로, Ma..

조명 효과 프롬프트의 모든 것

기본 조명 기법고급 조명 기법조명 관련 프롬프트를 최적화하기사진 촬영에서 빛을 잘 조절하면 평범한 장면을 매혹적인 장면으로 바꿔줄 수 있다는 것은 잘 알려져 있습니다. 마찬가지로 AI 프롬프트에서도 조명이 매우 중요한 역할을 합니다.사실적인 이미지를 생성하기 위한 프롬프트에서 조명 키워드는, 몇개만 알아두어도 이미지에 아주 강한 효과를 부여해주는 핵심적인 요소중 하나입니다. 이 글에서는 일반적으로 사진 촬영에서 사용되는 여러가지 종류의 조명 혹은 조명 분위기와 함께, 프롬프트에 넣을 수 있는 핵심 단어를 알아보겠습니다 각 키워드는 다음 세가지 모델을 사용하여 테스트하는데, 아래에 보이는 프롬프트에 각각의 조명 관련 키워드를 앞쪽에 넣어서 어떤 영향을 미치는지 확인하는 방식으로 효과를 검증해보겠습니다.프롬..

Recraft에서 SVG 이미지 생성하기

미드저니, DALL-E와 같은 독점적 이미지 생성사이트 혹은 Stable Diffusion, Flux 와 같은 오픈소스 이미지 생성 모델은 모두 보통의 PNG, JPG 등의 래스터(raster) 이미지를 생성합니다. 이러한 이미지를 확대해보면 하나하나의 점(픽셀)로 구성되는데, 확대/축소/변형하면 색이 뭉개지거나 픽셀이 드러나는 등 이미지 품질이 열화됩니다.반면 픽셀이 아니라, 선, 면과 같은 도형으로 구성되는 벡터(vector) 이미지의 경우에는 크기 변경에 관계없이 항상 일정한 품질을 유지하는 특성이 있죠. 그래서 사실적 사진이 아닌, 아이콘이나 로고, 일러스트 같은 경우에는 벡터 형식이 훨씬 효과적입니다. Recraft는 현재 Text2Image 생성 Leaderboard에서 1위를 차지하고 있는,..