[✨ AI 시대, 마케팅/채용 분야 실전 가이드: Gemini Advanced 시스템 이해하기] 2편. Gemini Advanced AI 생성 이미지 특징과 한계. (ChatGPT 생성 이미지 비교 분석)

2025. 2. 2. 00:04AI 영감

반응형

 

AI 생성 이미지 활용 목적.

웹 페이지의 배너 및 로고, 카드 뉴스, 인스타그램용 활용 그리고 홍보 포스터 용으로 사용할 목적으로 [제미나이: Gemini Advanced와 ChatGPT]의 AI 이미지를 활용해보려도 합니다.

 

이 포스팅에 사용된 AI 이미지 생성 플랫폼 사용 조건은 아래와 같았습니다 .

  • 지나치게 AI가 생성한 기분이 드는 인위적 이미지보단 [실제 크레에이터에게 제공받는 이미지 제공 홈페이지 Unsplash 자료처럼] 마치 사람이 촬영한 사진같은 이미지나 영화, 광고 등 영상의 순간을 캡쳐한 느낌의 이미지 필요. 
  • 부득이하게 [Google의 Gemini Advaced 1.5 Pro2.0 Flash(유료모델 월 29,000원)] 와 [openIAI의 ChatGPT(일반 무료버전)] 이미지 사용.

이미지 생성에 사용된 제미나이: Gemini Advanced 최신버전 2가지 모델(유료 모델)

 

 

더하여 이 티스토리 포스팅은, 시각 장애인분들이나 인터넷 환경이 좋지 않은 사용자분들도 이미지를 제대로 이해하실 수 있도록, 부족하지만 티스토리에서 제공하는 이미지를 설명하는 텍스트를 대신 표시해 주는 역할을 하는 'alt 태그' 를 최대한 활용하도록 노력하였습니다. 


 

들어가기 전.  AI 이미지 생성 도구 시스템 활용 최적화를 위한 마음가짐.

반드시 기억해 두어야 할 것은. AI는 완벽하지 않으며 반드시 AI와의 추가 프롬프트(대화)를 통해 우리가 원하는 이미지를 얻기까지 계속해서 발전시켜 나아갸 한다는 점입니다. 이 부분은 'Google AI Essentials' 수업에서도 권장이 아닌 필수 요소로 가르치고 있었습니다. 

그럼에도 가장 중요한 것은 '첫 대화를 시작하는 프롬프트(대화)' 문장이라는 라는 점입니다. 마치 가장 맛있는 요리를 하기 위해선 무엇보다 가장 먼저 신선한 양질의 재료들을 확보하는 것처럼요. 넷플릭스 요리 프로그램인 흑백 요리사에서 최현석 셰프님이 국내 최고의 셰프들로 구성된 팀을 이끌며 한 첫 마디 역시 "주방에서 셰프보다 더 높은 게 있어요. 재료죠” 였습니다. 경합에서 승리하기 위한 가장 중요한 전략이었습니다.  

 

 

AI 생성 이미지 비교.  Gemini Advancded(최신 유료버전)  vs ChatGPT (일반 무료버전)

먼저. 웹 페이지의 배너와 로고, 카드 뉴스 그리고 홍보 포스터 용으로 사용할 목적으로 제미나이: Gemini Advanced와 챗gpt(무료버전)에게 다음과 같은 질문을 하고 이미지 생성을 요청합니다. 이후에도 추가 질문통해 지속적인 이미지를 요청했으며 저에게 적합한 이미지는 Gemini Advaced가 생성한 이미지 였었습니다.

이유는 Gemini Advanced 의 이미지가 더 사람이 촬영한 사진 컷이나 영상의 한 장면을 캡처한 느낌을 줄 수 있을것 같았고, 그에 비해 챗GPT가 생성해 준 이미지는 누가봐도 '이건, ChatGPT가 생성했구나'라는 이질감을 줄 것이라고 생각됐기 때문입니다. 

 

"우주인은 스페이스x 우주복 형태로 좀 더 실픔했으면 좋겠어
그리고 컴퓨터는 최신식 보다는 매킨토시 고전버전으로 다루고 있었으면 좋겠어.
추가 변경으소로는 단지, 좌우 반전을 해주고 이슈를 줄 핑크색 꽃잎을 추가해줘. 


왼쪽은 Gemini Advanced 2.0 Flash (최신 유료버전 : 월 이용료 29,000원).  오른쪽은 챗GPT(무료 일반버전 : 월 이용료 0원) 입니다.

물론 가격의 차이가 큰 두 모델로 비교하기에는 무리라고 판단될 수도 있지만 챗GPT PLUS(유로버전)을 사용했을 때에도 이미지 생성에선 느껴지는 ChatGPT 이미지 한계 크게 다르지 않았습니다. 

 

 

ChatGPT 이미지 특징. 그러나 분명한건. 다양한 이미지를 생성해 본 결과 Gemini Advanced보다 챗GPT가 생성한 이미지가 인간이 작성한 것과 더 유사한 스타일을 보여주며 더 직관적이라는 것입니다.  아래에 생성된 이미지 역시 ChatGPT가 생성한 이미지가 '텍사스로 이주하는 테슬라'의 모습을 상당히 직관적 임을 확인할 수 있으실 겁니다. 

미국의 빅테크 기업들이 샌프란시스코를 떠나 텍사스로 이동하는 이미지를 생성해줘.
추가적으로 대표적 미국 빅테크인 테슬라가 강조되게 나타내줬으면 좋겠어. 

 

챗GPT(무료 일반버전)이 생성한 이미지가 내가 어떤 의미를 더 담아내려고 하는지 더 잘 이해하고 있는것 같다.

 

 

Google Gemini Advanced AI 이미지 생성에서 느낀 한계.

생성된 이미지를 우리 기업의 웹 페이지, 유튜브 영상 등에 최종적으로 사용하기 위한 결과물을 생성 및 창작하기 까진 아직 어려워 보입니다. 추가 프롬프트(대화)를 하며 이미지를 확장시키고 발전시켜 나가보려 해도 한계가 느껴집니다. 아직까진 Adobe(포토샵 등)의 추가 활용을 통해 인간의 상상력이나 특유의 창의적 감각이 절대적이라고 여겨졌습니다.  

 

아래는 꽤 만족스러웠던 모습의 구글의 최신형 생성형AI 유료버전 [제미나이:Gemini Advanced 2.0 Flash] 가 생성한 첫번째 이미지 입니다. 그래서 바로 다음 대화에 "추가 요구 조건1. 사진 좌우반전"과 함께 기존에 디자인적으로 인상적이게 봤던 [애플TV+ 파치코의 포스트]를 머릿속에 떠올리며 "추가 요구조건 2. 포인트를 줄 수 있는 핑크 꽃잎을 추가"해달라고 했습니다.  

실내 수영장에서 하얀색 우주복을 입은 우주인이 왼쪽에서 오른쪽을 바라보며 테이블 위에 올려진 애플의 매킨토시를 다루고 있는 이미지(엉덩이 윗부분 상반신을 표현.) 수채화로 표현한듯한 물빠진 색감의 푸른색 배경과 분홍색의 철쭉 혹은 진달래가 크고 묘한 분위기를 풍기며 그려져 있는 파친코의 포스터 이미지
Gemini Advanced가 생성한 첫 번째 이미지와 접목하고 싶었던 파친코의 색감과 이미지.

 

 

그러나 추가 생성된 이미지는 전혀 다른 이미지였습니다. 제가 원한 이미지는 첫번째 이미지를 그대로 좌우반전 시켜 컴퓨터가 왼쪽에 있는 모습을 원햇고, 꽃잎이 크게 포인트를 주는 모습이었지만, 원하지 않았던 물속에 들어가있는 모습으로 표현 된 전체핏이 나왔습니다. 

단지이미지의 좌우반전과 핑크색 꽃잎 추가를 요구했지만, 수영장 물 속에서 완전히 잠겨있는 모습의 우주인의 모습으로 전혀 다른 느낌으로 재 생성한 Gemini Advanced의 이미지(분홍색 꽃잎은 수영장 바닥과 물 표면에 장미를 흩으뜨려놔서 표현했다.)
추가 프롬프트(대화) 입력 후 그 결과로 얻은 두번째 이미지.

 

때문에 사실상. 내가 정말로 상상하고 원하는 결과물을 얻기 위해선 생성형AI의 도움을 받아 1차 이미지를 확보한 후 포토샵 등 추가적 작업이 필요해 보입니다.  제가 아직 생성형 AI 활용 능력이 부족해서일지도 있지만, 1차적으로 얻은 이미지가 정말 만족스럽더라도 추가 디자인적 요소만 더해진 같은 이미지를 얻을 수는 없었습니다. Gemini가 생성한 이미지임에도 바로 다음 추가 생성한 이미지는 전혀 다름 느낌의 이미지 였습니다.

 

첫 프롬프트 내용(대화): 해변의 핑크색 벤치에서 여유롭게 쉬고 있는
우주복을 입은 우주인의 이미지를 생성해줘.

두번째 프롬프트(대화): 좋아. 그럼 벤치 색깔만 핫핑크에서 라임색으로 바꿔보자.

생성해준 아래의 이미지(왼쪽)이 구도와 우주인의 모습이 마음에 들어. 벤치 색상만 제가 좋아하는 라임색으로 변경을 Gemini Advanced에게 추가 요청했지만, 우주복의 색상, 벤치 형태, 배경의 모습까지 모두 바뀐 이미지를 생성해줍니다. 

해변에서 핫핑크 벤치에 여유롭게 기대어 있는 하얀색 우주복을 입은 우주인의 모습이 담긴 이미지벤치의 색상이 라임색으로 바뀐것뿐만 아니라 벤치 모양, 우주복의 색깔, 해변의 색감 등이 바뀌어 생성된 추가 이미지
심지어 제미나이: Gemini는 벤치 색상만 바꿔줄 것을 요구했음에도 첫번째 이미지에선 볼 수 없었던 우주복을 입은 우주인의 생상한 얼굴까지 보여줬다.

 

 

뿐만아니라. 이점을 한계나 단점으로 볼 수는 없지만 Gemini는 인물과 관련된 이미지에 매우 조심스럽게 접근합니다. 사람의 모습이 담긴 이미지를 학습시키려 하면 거부하는 장면을 자주 목격할 수 있습니다. 심지어 제미나이: Gemini Advanced 자신이 직접 생성한 이미지를 다운받은 후, 다시 학습시키는 경우도 사람의 모습이 담긴 이미지이기때문에 거부하기도 합니다. 이 점은 구글에서 직접 설계한 AI 수업 [Google AI Essentials]에서 굉장히 많은 시간들여 강조한 AI의 윤리적 사용 측면의 결을 같이 하는 것 같습니다 . 

인물 이미지 처리를 곤란해하는 Google 제미나이: Gemini Advanced
인물 이미지 처리를 곤란해하는 Google 제미나이: Gemini Advanced 1.5 Pro
특정 유형(인물 이미지) 생성을 '가이드라인' 위반 사항이라며 거부하는 Google 제미나이: Gemini Advanced

 

 

 

결론. Gemini 생성 이미지 실질적 활용에 관하여.

제가 지닌 상상력을 바탕으로 입력한 프롬프트(대화)를 통해 결과물을 얻어 마케팅, 채용도구로 활용하고 싶다면 [제미나이: Gemini Advanced를 사용할 것입니다. 물론 조금 더 유려한 특색있는 이미지를 원한다면 포토샵 같은 추가 이미지 편집 Tool이 절실하겠지만 1차적 소스를 얻고 샆다면 지금까진 Gemini의 생성 AI 이미지가 매력적으로 보입니다.  뿐만아니라. 애니메이션 캐릭터, 웹툰 등에 활용하기에도 미나이: Gemini Advanced가 유용해 보였습니다. 

커피를 들고 있는 물개(프릳츠 커피 브랜드 학습)에게 우주복을 입힌 애니메이션 느낌의 Gemini Advanced 이미지
웹페이지 배너 및 프로필에 사용하기 위해 1차 Gemini Advanced가 생성해준 이미지에 (therightit)Labs텍스트를 삽입한 모습(왼쪽)과 커피를 들고 있는 물개(프릳츠커피의 브랜드)를 학습시킨 후 추가 우주복을 입혀 생성한 이미지

 


 

마치며.

저는 디자인과 관련된 전공 등 전문지식이나 가진 소스들이 없습니다. 그렇기에 아주 제한적인 프롬프트(대화)들만을 입력해서 얻은 이미지입니다. 보다 구체적인 대화 내용을 입력할수록 더 좋은 이미지를 생성해 내는 생성형AI 특성상, 저와의 대화를 통해서는 매우 단순한 이미지 요소만을 표현할 수 밖에 없었을 것입니다.  

하지만 엄청나게 창의적 상상력과 감각 그리고 재료들을 가지신분들. 예를들면 영화 <인셉션>, <인터스텔라>를 만든 크리스퍼놀란Christopher Edward Nolan 감독님, 애니메이션 <인사이드 아웃>을 창조해낸 픽사Pixal 직원분들, 또 연예인의 연예인이 된 빅뱅의 G-DRAGON님, 그리고 틀에 얽매이지 않는 동심과 끝없는 동심을 가진 어린 아이들이라면 분명 제가 내놓은 결과물보다 더 나은 결과물을 만들어 내실 것입니다. 긴 글 읽어주셔서 감사합니다. 
반응형