fal.ai에서 Flux로 사실적인 사진 생성하기

AI 이미지/Flux AI

fal.ai에서 Flux로 사실적인 사진 생성하기

하늘이푸른오늘 2025. 2. 17. 23:48

소셜 네트워크에 관심이 많으신 분이라면, 지난 몇 달 동안 FLUX로 생성한 초현실적인 인물 사진들을 많이 만나셨을 것입니다. 놀랍도록 사실적인 사진을 생성하는 능력으로 인해 Black Forest Labs의 새로운 모델에 대한 관심이 매우 뜨거워지고 있습니다.

이 글에서는 FLUX와 포토리얼리즘에 특화된 LoRA 를 함께 사용하여, 놀랍도록 현실적인 이미지를 생성하는 방법에 대해 알아보겠습니다.

참고 : Flux는 미디저니, DALL-E, 스테이블 디퓨전등과 비슷한 이미지 생성형 AI 입니다. Flux는 텍스트 프롬프트에서 이지지를 생성하는 데 사용합니다. 자세한 내용은 Flux 모델의 이해와 사용을 위한 모든 것을 읽어보세요.

FLUX-RealismLoRA
FLUX를 LoRA와 함께 사용하기
Fal.at 서비스
따라하기
Flux-Realism 프롬프트

FLUX-RealismLoRA

물론, FLUX Dev 혹은 FLUX Pro버전만 사용해도 상당히 훌륭하고 사실적인 이미지를 생성할 수 있습니다. 하지만, Flux-RealismLoRA 와 같은 LoRA가 나오면서 상황이 더 극적으로 바뀌었습니다.

LoRA(Low-Rank Adaptation)란 특정한 스타일이나 주제로 AI 모델을 미세 조정하는 기법을 말합니다. LoRA는 이러한 기법을 적용하여 생성된 파일을 이르기도 하며, 일반적으로 모델과 함께 사용됩니다. LoRA를 사용하면, 모델을 처음부터 완전히 학습시킬 필요 없이, 특정한 시각적 측면을 전문으로 다룰 수 있습니다.

여기에서는 사진이미지의 질감, 조명 및 표현을 보다 충실하게 재현하도록 학습된 LoRA에 대해 설명합니다.

Flux를 LoRA와 함께 사용하기

로컬에서 FLUX를 LoRA와 함께 사용하는 방법은 여러가지가 있겠지만, 가장 좋은 것은 ComfyUI 웹UI를 사용하는 것입니다. 사용하는 방법은 이 글을 읽어보세요. 아래는 이 글에서 LoRA를 적용했을 때(오른쪽)와 그 전을 비교한 결과입니다.

여기에서는 fal.ai 서비스에서 클릭 몇번 만으로 RealismLoRA를 사용하는 방법을 보여드립니다.

Fal.ai 서비스

Fal.ai 는 개발자들을 위한, API를 통해 고급 API 모델을 쉽게 접근할 수 있는 AI 플랫폼입니다.

이 사이트에서는 복잡한 인프라를 설치할 필요 없이 이미지 생성, 텍스트 처리, 기타 여러가지 AI 관련 작업을 수행할 수 있습니다. 사용량에 따른 가격 책정 및 자동 확장을 통해, 보다 빠르게, 비용 효과적으로 AI를 응용에 통합하는 개발이 가능합니다.

이 플랫폼은 또한 AI 모델을 위한 데모 및 테스트 공간(playground)를 제공하여, 간단한 웹 인터페이스를 통해 인공지능 모델을 실행시켜볼 수 있습니다. 이것이 바로 여기에서 소개시켜드릴 내용입니다.

사용료는?

fal.ai는 사용량에 따라 요금을 지불합니다. 즉, 생성하는 이미지의 수만큼 비용을 지불하면 됩니다. 현재 사용료는 이미지 1장당 0.035 달러(약 50원)입니다. fal.ai에 가입하면 1 달러 상당의 무료 크레딧이 제공됩니다. 이는 약 20개 정도의 이미지를 생성할 수 있는 양입니다.

따라하기

0 단계: Github 가입

Fal 플랫폼을 사용하려면 먼저 Github 계정이 필요합니다. Github 가입 페이지에서 계정을 만드시면 됩니다.

1 단계: fal.ai 계정 생성

fal.ai 웹사이트에서 [Log in] 단추를 누른 뒤...

아래쪽에 있는 "Sign up" 링크를 클릭합니다. 그러면 Github authorization화면이 나오고 클릭하면 간단하게 가입됩니다.

2 단계: Flux-Realism 접속

Flux Realism LoRA 모델 페이지로 들어갑니다.

3 단계: 프롬프트 입력

아래 이미지와 같이 프롬프트를 입력합니다.

프롬프트: 석양이 물들어가는 요세미티 공원 tunnel view를 배경으로, 야외용 테이블에 앉아 커피를 마시고 있는 머리가 희끗희끗하고 우아하고 고귀한 60대 여인의 모습.

프롬프트: A serene scene set against the breathtaking backdrop of Yosemite National Park’s Tunnel View at sunset. The sky glows with warm hues, casting a golden light over the majestic cliffs and valleys. Seated at an outdoor table, a graceful and dignified woman in her 60s with silver-streaked hair enjoys a cup of coffee. Her elegant posture and serene expression reflect wisdom and tranquility as she gazes into the distance, savoring the peaceful moment amidst nature’s grandeur.

프롬프트는 ChatGPT에 위의 한글 프롬프트를 입력해 생성한 것입니다. (여기 참조)

4 단계: 이미지 생성

이제 "Run" 버튼을 누르면 이미지가 생성됩니다. 5초 이내에 완료되네요. 완료되는 즉시 우측에 결과가 나타납니다. 원하시면 아래쪽에 있는 "Download"버튼을 눌러 저장할 수 있습니다.

아래가 생성된 이미지입니다. 생각만큼 잘 나왔네요. 뒤쪽 배경으로 요세미티의 엘 캐피탄이 아주 잘 묘사되었습니다. 아쉽게도 하프돔은 머리에 가려졌네요.ㅎ

5 단계: More...

프롬프트 입력란 바로 아래 우측을 보면 [More]라고 표시된 작은 버튼이 있습니다. 이것을 누르면 좀더 자세하게 설정할 수 있습니다.

Image Size : 이미지의 크기 및 종횡비를 바꿀 수 있습니다.
Num Inference Steps : 샘필링 단계 수 입니다. 단계수를 늘리면 더 나은 결과가 나올 수 있습니다.
Seed : 임의의 시작값.
무분류 안내 척도(CFG) : 이미지가 프롬프트를 따르는 정도를 나타냅니다. FLUX의 경우 3.5가 기본 값입니다(Stable Diffusion은 7이 기본값입니다).

Flux-Realism 프롬프트

FLUX와 Realism 프롬프트를 잘 활용하려면, 프롬프트를 영어로, 명확하고 정확하게 구성할 필요가 있습니다. 효과적인 프롬프트는 다음과 같은 7가지 요소를 포함하는 것이 좋습니다.

1. 주요 피사체 : 사진의 주 피사체의 신체적 특징과 자세
예: 희끗희끗한 머리에 수염을 깔끔하게 다듬은 중년 남자

2. 동작 : 피사체의 활동, 동작 또는 자세
예: 햇살이 잘 드는 소박한 나무 탁자에 앉아

3. 맥락/위치 : 주 피사체의 주변 환경
예: 노출된 벽돌 벽, hanging plants, 분칠로 적은 칠판 메뉴판

4. 구체적인 세부 정보 : 독특한 요소를 추가하거나, 설명을 구체화
예: 깔끔한 흰색 셔츠, 네이비색 블레이저(스포티한 콤비)

5. 분위기 : 전반적인 분위기
예: 도시적 세련미와 고요한 명상 분위기

6. 주제: 맥락이나 주요 활동
예: 아침 루틴에 따라 조용하고 차분한 모습으로 커피를 마시며 신문을 보고 있음

7: 이미지 스타일 : 시각적, 예술적 참조 자료
예: 아마추어 사진 스타일

영어 프롬프트로 바꾸기

이미지 생성 AI 중에서 한글을 프롬프트로 받아주는 곳은 많지 않습니다(Copilot에서는 가능합니다). 대부분 영어로 입력해야 하지만, 적절한 영어단어를 찾기 힘든 경우가 많죠. 이럴 때 DeepL과 같은 사이트에서 영어로 번역하는 것도 한가지 방법이지만, 저는 ChatGPT에서 프롬프트로 작성합니다.

이상의 내용을 프롬프트로 작성하여 이미지를 생성해 보았습니다.

프롬프트 : 아마추어 사진 스타일. 희끗희끗한 머리에 수염을 깔끔하게 다듬은 중년 남자가 햇살이 잘 드는 소박한 나무 탁자에 앉아, 아침 루틴에 따라 조용하고 차분한 모습으로 커피를 마시며 신문을 보고 있다. 그는 깔끔한 흰색 셔츠에 네이비색 블레이저를 착용하고 있다. 배경으로 노출된 벽돌 벽과, hanging plants, 분칠로 적은 칠판 메뉴판이 보이며, 전반적으로 도시적 세련미와 고요한 명상 분위기가 느껴진다.

ChatGPT 변환 결과 : An amateur-style photograph capturing a middle-aged man with neatly trimmed salt-and-pepper hair and a well-groomed beard, sitting at a rustic wooden table bathed in warm morning sunlight. He follows his morning routine with a calm and composed demeanor, sipping coffee while reading a newspaper. Dressed in a crisp white shirt and a navy blazer, he exudes effortless sophistication. The background features an exposed brick wall adorned with hanging plants and a chalkboard menu with hand-written specials, blending urban elegance with a quiet, meditative ambiance.

아래는 다른 예입니다.

프롬프트 : A close-up shot of a passionate female chef in her 40s with curly black hair tucked under a white chef's hat, wearing a crisp white double-breasted jacket. She's intently focused on plating a colorful dish in a sleek, modern kitchen. Her skilled hands delicately position a vibrant red bell pepper slice on the plate. Stainless steel appliances and hanging copper pots gleam in the background. Steam rises from the freshly cooked food, creating a misty effect around her. Her expression shows a mix of concentration and pride. The scene captures the artistry and precision of haute cuisine, styled like a high-end culinary magazine spread with dramatic lighting emphasizing the textures and colors of the food.

DeepL 번역 : 깔끔한 흰색 더블브레스트 재킷을 입고 흰 요리사 모자 아래로 곱슬거리는 검은 머리카락을 집어넣은 열정적인 40대 여성 셰프의 클로즈업 샷입니다. 그녀는 세련되고 현대적인 주방에서 화려한 접시를 플레이팅하는 데 집중하고 있습니다. 숙련된 손놀림으로 선명한 붉은 피망 조각을 접시 위에 섬세하게 올려놓습니다. 스테인리스 스틸 가전제품과 매달린 구리 냄비가 배경에서 반짝입니다. 갓 조리된 음식에서 김이 피어오르며 주위에 안개가 자욱한 효과를 연출합니다. 그녀의 표정에는 집중과 자부심이 섞여 있습니다. 이 장면은 음식의 질감과 색감을 강조하는 극적인 조명으로 고급 요리 잡지를 펼친 듯한 스타일로 고급 요리의 예술성과 정교함을 포착합니다.

프롬프트: A wide-angle view of a young Asian male student in his early 20s, wearing a comfortable gray hoodie and jeans, sitting cross-legged on the floor of a vast university library. He's surrounded by open textbooks and papers, with a laptop balanced on his knees. Towering bookshelves filled with leather-bound volumes stretch into the background. Soft, warm lighting from antique desk lamps creates a cozy atmosphere. His brow is furrowed in concentration as he types, with a half-empty coffee cup beside him. Other students can be seen studying at tables in the distance. The image conveys the intensity of exam preparation and the timeless environment of academic pursuit, captured in the style of a thoughtful documentary photograph.

DeepL 번역 : 편안한 회색 후드티와 청바지를 입은 20대 초반의 젊은 아시아계 남학생이 넓은 대학 도서관 바닥에 다리를 꼬고 앉아 있는 광각 사진입니다. 그는 펼쳐진 교과서와 서류에 둘러싸여 있고 무릎 위에 노트북을 올려놓고 있습니다. 가죽으로 제본된 책으로 가득 찬 높은 책꽂이가 배경으로 펼쳐져 있습니다. 앤티크한 책상 램프의 부드럽고 따뜻한 조명이 아늑한 분위기를 연출합니다. 반쯤 비어 있는 커피잔을 옆에 두고 이마를 찡그리며 집중해서 타이핑을 하고 있습니다. 저 멀리 테이블에서 공부하는 다른 학생들의 모습도 보입니다. 이 이미지는 사려 깊은 다큐멘터리 사진 스타일로 촬영되어 시험 준비의 강렬함과 시대를 초월한 학구적 환경을 전달합니다.

프롬프트 : a vintage woman face cam,Shoulder Length Hair with Bangs,dressed in a tunic dress with a Nehru collar and knee-high boots is taking photos with an old Leica device In the Oasis Mirage hidden in the Mirage Sands, in the style of dslr photography

DeepL 번역 : 네루 칼라가 달린 튜닉 드레스에 무릎 높이 부츠를 신은 어깨 길이의 앞머리를 한 빈티지 여성 페이스 캠이 미라지 사막 속에 숨겨진 오아시스 미라지에서 오래된 라이카 카메라로 사진을 찍고 있습니다.

프롬프트: A charismatic speaker is captured mid-speech. She has long, slightly dark blonde hair tied back in a ponytail. Her expressive face is animated. She is holding a black microphone in her right hand, speaking passionately. The woman is wearing a blue, textured blouse with unique, slightly shimmering patterns, and a green lanyard with multiple badges and logos hanging around her neck. The lanyard features the “Replicate” and “Google” logos prominently. Behind her, there is a blurred background with a white banner with the text X logo. The overall scene is vibrant and dynamic, capturing the energy of a live presentation.

DeepL 번역 : 카리스마 넘치는 연사가 연설 도중에 포착됩니다. 그녀는 약간 짙은 금발의 긴 머리를 뒤로 묶어 포니테일로 묶었습니다. 그녀의 표정은 생동감이 넘칩니다. 그녀는 오른손에 검은색 마이크를 들고 열정적으로 말하고 있습니다. 이 여성은 약간 반짝이는 독특한 패턴의 파란색 블라우스와 여러 개의 배지와 로고가 달린 녹색 끈을 목에 걸고 있습니다. 이 끈에는 “Replicate”와 “Google” 로고가 눈에 띄게 새겨져 있습니다. 그녀의 뒤에는 흐릿한 배경에 X 로고가 있는 흰색 배너가 있습니다. 전체적인 장면은 생동감 있고 역동적이며 라이브 프레젠테이션의 에너지를 담고 있습니다.

위에서 보신 것처럼 FLUX를 이용하면 어렵지 않게 극히 사실적인 이미지를 생성할 수 있습니다. 특히 fal.ai 사이트를 이용하면 (다른 AI 서비스 포함) 직관적인 인터페이스를 활용해 쉽게 원하는 결과를 얻을 수 있습니다.

FLUX는 이제 AI 이미지 생성 분야에서 필수적인 옵션이 되고 있습니다. 현재 Civitai.com 에서 FLUX 용 LoRA를 찾아보면 수많은 결과물을 보실 수 있습니다. 앞으로도 이러한 도구는 더 많이 추가될 것입니다. 누구나 쉽게, 독점적이지 않은 이미지 생성 인공지능이라는 Black Forest Labs의 희망이 점점 더 가시화되는 듯 합니다.

이상입니다.