AI 이미지/AI 서비스 17

구글 Whisk에서 고양이 비틀즈 생성하기

고양이 비틀즈가 Abbey Road를 건너가는 모습을 생성하려고, 여느 때처럼 구글 Image FX에 접속하자, 아래와 같이 새로운 실험 서비스인 Whisk를 사용해 보라는 알림이 떴습니다. 물론 바로 접속해서 생성을 시도했습니다.이 글에서는 이미지를 생성하고, 생성된 이미지를 다시 비디오로 생성하는 과정을 보여드립니다.이미지 생성비디오 생성짧은 감상이미지 생성맨 먼저 "의인화 고양이 Beatles가 Abbey road 횡단보도를 건너간다."라고 프롬프트를 주고 생성한 결과입니다. 두 장이 생성되는데, 그럴 듯한 것을 선택했습니다.이미지 좌측 위를 보면 애니메이션으로 바꾸는 기능과 세부 조정하는 기능이 있습니다. 일단 위의 이미지를 약간 수정하기로 하고 "세부 조정"을 눌렀습니다.그뒤, 고양이 품종을 다..

ChatGPT 를 사용하여 스타일 변경하기

요즘은 좀 시들해졌지만, 얼마전 ChatGPT-4o 가 등장했을 때 자신의 사진을 지브리 스타일로 변형하는 것이 유행했었습니다. 이 때문에 지브리 스튜디오와 OpenAI와 저작권 분쟁이 발생할 수 있다는 뉴스도 나왔었고요.이 글에서는 하나의 이미지를 사용해 여러가지 멋진 스타일을 생성하는 방법을 설명합니다. 아래는 예입니다.원리따라하기다른 스타일이미지가 생성되지 않을 경우원리ChatGPT는 GPT-4o와 같은 멀티모달 대형 언어모델(LLM, Large Language Model)을 사용하여, 여러가지 매체를 입력으로 받을 수 있습니다. GPT-4o는 텍스트 뿐만 아니라, 이미지, 오디오, 비디오 등을 입력으로 받아서, 텍스트, 이미지, 오디오를 생성합니다.따라하기이 내용을 따라하기 위해서는 ChatGPT..

Mogao: 새로운 미스터리 AI - Seedream 3.0

갱신: Mogao는 ByteDance 의 최신 모델인 Seedream 3.0 으로 밝혀졌습니다. 현재는 이미지 아레나에서 2등으로 내려앉았네요.====이미지 생성형 인공지능 세계에 또다른 게임체인저가 등장해서 시장을 흔들고 있습니다. 그의 이름은 모가오(Mogao) 입니다. 현제 웹사이트도, 주소도 없고, 심지어는 로고도 없습니다. 그냥 며칠전에 이미지 아레나에 등장해서 2025년 4월 14일 현재 1위를 차지했습니다. GPT-4o까지 밀어내고요!4월 초부터 ArtificialAnalysis.ai의 이미지 아레나의 변화상황을 주의 깊게 살펴본 사람들은, 공식 순위에는 없지만 블라인드 테스트에서 매우 활발하게 나타난 모가오라는 모델을 주목했습니다.하지만, 그 결과는 그다지 눈에 띄지 않았습니다. 저 개인적..

대표 이미지 생성형 AI 서비스 비교

2025년 4월 3일 현재, 현재 Text to Image Model Leaderboard에 나타난 순위는 아래와 같습니다. GPT-4o가 등장한지 겨우 1주일만에 1등을 차지했고, 그 바람에 Recraft AI는 2 등으로, Reve(Halfmoon)는 1등을 차지한지 한달도 못채우고 3등으로 밀려나고, 구글의 Imagen 3는 5등으로, BFL의 FLUX1.1은 6등이 되었네요. 그 사이로 새로 Ideogram 3.0이 끼어들었구요. 완전 엎치락 뒤치락하고 있네요.이 시점에서 이들 서비스의 이미지 생성 품질을 비교해보려고 합니다. 물론 위의 이미지 리더보드는 수많은 사람들이 평가한 결과이기 때문에 이 결과를 뛰어넘을 수는 없겠지만, 그래도 제 나름대로의 기준으로 한번 비교해 보려고요.테스트 방식은 ..

Ideogram V3 출시

2025년 3월 26일, Ideogram 에서 이미지 생성형 AI 모델 3.0 버전을 출시했습니다.이번 업데이트는 혁명적이라고는 할 수 없지만, 예전 버전에 비해 사실적 사진, 이미지내 텍스트 처리, 스타일 일관성 등 몇가지 중요한 측면에서 상당한 혁신을 이루었습니다.주목할 만한 개선사항스타일 참조 및 무작위 스타일새로운 기능중에서 "스타일 참조" 기능이 도입된 것이 특히 호평을 받고 있습니다. 사용자가 3개의 이미지를 올려서 자신의 창작물의 심미적 방향을 조정할 수 있습니다. "무작위 스타일(Random Style)" 옵션을 사용하면 43억개의 스타일 라이브러리에서 임의의 이미지를 가져와 예상할 수 없는, 영감이 넘치는 이미지가 생성됩니다.효율적인 텍스트 렌더링Ideogram V2에서도 강점중의 하나였..

새로운 GPT-4o 이미지 - ChatGPT

OpenAI에서 엊그제 GPT-4o 챗봇에 이미지 생성 기능을 추가하였습니다. (관련 공지 링크) 사실 그냥 "추가"라고 하기에는 너무 센세이션을 일으키고 있습니다. 제가 이제까지 여러가지 이미지 생성 모델이나 서비스를 다루어 왔지만, 이번 GPT-4o에 추가된 이미지 생성기능은 그야말로 혁명적이라고 할 수 있기 때문입니다.GPT 4o 이미지의 장점GPT 4o 이미지 생성방법언제 사용할 수 있나?결론4o 이미지의 장점고품질의 이미지제가 사용하는 ChatGPT에는 아직 새로운 이미지 생성기능이 반영이 되어 있지 않아 직접 시험해 보지는 못했지만, 여러 SNS에 올려진 사용기를 보면 이미지 품질은 정말 뛰어나다고 합니다. 또한 여러가지 스타일의 이미지도 자유자재로 생성이 된다고 하고요. 이 글을 읽어보면 그..

새로운 이미지 AI 강자 탄생 - Reve Image 1.0

얼마전부터 이미지 생성행 AI 에 새로운 폭풍이 몰아치고 있습니다. 캘리포니아에 소재한 Reve AI라는 회사에서 출시한 Reve Image 1.0 입니다. 며칠전 Halfmoon(반달)이라는 이름으로 처음 등장하더니, 이제는 얼마전까지만 해도 1위를 차지하고 있던 Recraft AI를 제치고 Text-to-Image Leader 보드에서 1위를 차지했습니다. 보시는 것처럼, Google Imagen 3, BFL의 FLUX1.1 pro, Midjourny 등을 모두 제쳤네요.Reve AI: 캘리포니아의 새로운 도전자그런데 아직까지도 이 모델에 대한 공식적인 공지 나 보도자료는 나오지 않고 있습니다. 이 모델을 제작한 Reve AI, Inc 에 대해서도 별로 알려진 게 없는 상태고요. 본사가 캘리포니아에 ..

Gemini에서 이미지 생성 방법

구글 DeepMind의 이미지 생성 AI 인 Imagen 3가 발표된지 몇주만에 이미지 생성을 위한 새로운 첨단 모델중 하나로 자리잡았습니다. 아직 시도해 보지 않으셨거나 무료로 그 효과를 느껴보고 싶다면, 구글의 챗봇인 Gemini를 통해서 무료로 사용할 수 있습니다(참고로 Image FX 사이트에서도 사용할 수 있습니다).Gemini의 Imagen3Gemini에서 프롬프트 잘쓰기Gemini로 생성한 이미지의 예Gemini의 Imagen3Gemini란? 영어로 Gemini란 쌍둥이라는 뜻입니다. 구글에서 개발한 다재다능한 대화형 비서에 왜 쌍둥이란 이름을 붙였는지는 잘 모르겠네요. 아마 구글과 Gemini는 한 몸이라는 뜻으로 붙이지 않았을까... 상상해 봅니다. 어쨌든 현재 대규모 언어 모델(LLM,..

구글 Imagen 3 개요

Imagen 3는 구글 Deepmine에서 개발한 최신 인공지능 이미지 생성 모델입니다. 이 모델은 1532x1532 해상도의 뛰어난 품질의 이미지를 생성합니다. 특히 놀라운 디테일, 생상하고 사실적인 색상 렌더링 능력이 돋보입니다. Imagen 3는 극 사실주의로부터 추상 미술, 애니메이션까지 다양한 예술 스타일을 표현하는데 뛰어난 강점을 가지고 있습니다.Imagen 3는 Gemini 와 ImageFX 사이트에서 사용할 수 있으며, API 를 통해 다양한 도구와 통합할 수 있습니다.Imagen 3란?Imagen 3의 아키텍처DeepMinde 란?Imagen 3의 사용방법Imagen 3의 프롬프트Imagen 3의 세부사항Imagen 3란?Imagen 3는 구글 DeepMind 연구자들이 개발한, 고급 디..

Recraft에서 SVG 이미지 생성하기

미드저니, DALL-E와 같은 독점적 이미지 생성사이트 혹은 Stable Diffusion, Flux 와 같은 오픈소스 이미지 생성 모델은 모두 보통의 PNG, JPG 등의 래스터(raster) 이미지를 생성합니다. 이러한 이미지를 확대해보면 하나하나의 점(픽셀)로 구성되는데, 확대/축소/변형하면 색이 뭉개지거나 픽셀이 드러나는 등 이미지 품질이 열화됩니다.반면 픽셀이 아니라, 선, 면과 같은 도형으로 구성되는 벡터(vector) 이미지의 경우에는 크기 변경에 관계없이 항상 일정한 품질을 유지하는 특성이 있죠. 그래서 사실적 사진이 아닌, 아이콘이나 로고, 일러스트 같은 경우에는 벡터 형식이 훨씬 효과적입니다. Recraft는 현재 Text2Image 생성 Leaderboard에서 1위를 차지하고 있는,..