AI 이미지/워크플로 따라하기

이미지속 숨겨진 글자

하늘이푸른오늘 2025. 1. 30. 16:56

아래의 이미지에서 뭔가 숨겨진 게 보이시나요? 눈을 거의 감길 것처럼 찌그리고 쳐다보세요. 스테이블 디퓨전 AI 를 사용하면 이렇게 단어가 숨겨져 있는 이미지를 쉽게 생성할 수 있습니다.

이러한 이미지를 생성하는 가장 좋은 도구는 ControlNetADetailer 입니다. 이미지 자체는 텍스트 프롬프트로만 사용합니다. 따라서 얼마든지 다양하고 독특한 이미지를 생성할 수 있습니다.

이 글에서는 AUTOMATIC1111 에서 이러한 이미지를 생성하는 방법을 세밀하게 알려드립니다.

소프트웨어

이 글에 있는 워크플로는 가장 널리 사용되고 있는 스테이블 디퓨전용 웹 GUI인 AUTOMATIC1111을 사용합니다. AUTOMATIC1111의 설치 방법은 이 글을 보시고, 초보자 가이드도 참고하세요.

확장

이 글을 따라하시려면 ControlNet과 Adetailer 확장이 필요합니다.  설치방법은 아래를 보세요.

또한 QR Patern SDXL ControlNet 모델이 필요합니다. 다운로드 받아서 stable-diffusion-webui\models\ControlNet 폴더에 넣어줍니다.

따라하기

1단계: txt2img 설정

체크포인트 파일: juggernautXL v7

프롬프트: a group of air hostess ukrainian in dark blue and white uniform, scarf, skirt, high heel, walking down city street, far away view, happy
부정적 프롬프트: disfigured, deformed, ugly
Sampling method: DPM++ 2M Karras
Sampling Steps: 25
CFG scale: 7
Seed: -1
Size: 1344×768

2단계: ControlNet 설정

아래쪽 ControlNet 영역으로 내려가서 아래 그림을 다운로드 받아서 ControlNet Unit 0의 이미지 캔버스에 불러들입니다.

Enable: Yes
Control Type: None
Preprocessor: None
Model: control_v01u_sdxl_qrpattern
Control Weight: 1.6
Starting Control Step: 0
Ending Control Step: 0.75

3 단계: Adetailer 설정

Adetailer 영역에서 Enable 체크박스를 켜주고 나머지는 그냥 그대로 둡니다.

4 단계: 이미지 생성

이제 [Generate] 버튼을 누르면 아래와 같은 이미지가 생성됩니다.

참고

어떤 이미지를 생성할 것인가는 프롬프트와 씨드번호에 달려있습니다. 그런데 환경에 따라 이미지와 글자가 얼마나 잘 어울리는지는 아래의 매개변수가 큰 역할을 합니다. 글씨가 잘 안보인다면 아래의 매개변수를 조절해주시는 것이 좋습니다.

  • Control Weight: 높은 값을 줄 수록 글자가 많이 나타납니다.
  • Ending Control Step: 높은 값을 줄 수록 글자가 많이 나타납니다.

모든 이미지가 좋은 결과를 만들어주지 못하므로, 여러장을 생성해서 그중 하나를 뽑아서 사용해야 합니다.

이 워크플로에서 가장 많은 시간이 소요되는 것은 Adetailer입니다. 따라서 먼저 Adetailer를 끄고 이미지를 생성해 본 다음, 괜찮은 이미지를 찾으면 해당 이미지의 씨드번호를 찾아 고정하고, Adetailer를 켜서 다시 생성하는 것이 좋습니다.

또한 이미지중 일부가 조금 이상하다면 인페인트를 사용해서 수정할 수 있습니다.

다른 프롬프트

프롬프트: a group of hikers in blue and white jackets, scarf, on top of a snowy mountain, close up view
ControlWeight: 1.6
Ending Control Step: 0.9

 프롬프트: factory workers
ControlWeight: 1.5
Ending Control Step: 0.6

짧은 생각

사실 처음에는 AUTOMATIC1111이 아닌 ComfyUI를 사용해 생성할 생각이었습니다. A1111이 작년 7월 말에 업데이트 된 이후 거의 정지 상태이기 때문입니다.

그런데, ComfyUI에서 비슷한 설정을 사용해 여러번 시도를 해봤지만, 비슷한 결과가 거의 나오지 않았습니다. 설정을 바꿔가며 20여장 뽑아봤는데도 글씨가 너무 잘 보이고 사람은 안보이거나, 그 반대 결과만 잔뜩 나왔습니다.

그래서 혹시 SD_Forge를 사용하면 사용하면 어떨까 싶어 테스트해봤습니다만, 정말 이상하게도(SD_Forge는 A1111을 수정한 코드니까요) ComfyUI와 비슷하게 원하는 결과를 거의 얻을 수 없었습니다.

이게 뭘까... 한참을 고민해봤지만, 결국 답을 얻을 수 없었고... 뭐... 그래... 그냥 A1111을 사용하자... 라고 결론내렸네요.

이상입니다.

이 글은  stable-diffusion-art.com의 글을 번역하면서 제가 테스트한 결과로 대체하여 작성한 글입니다.