속보기술2025년 3월 26일 오전 03:46
오픈AI, GPT 4o 이미지 생성 업그레이드 발표, 캐릭터 일관성 기능추가
인공지능 분야를 선도하는 오픈AI(OpenAI)가 최신 이미지 생성 모델 ‘이미젠(Imagen)’의 업그레이드를 발표했다. 이번 업데이트의 핵심은 “캐릭터 일관성(Character Consistency)”으로, 사용자들이 요청한 캐릭터를 서로 다른 스타일로 변형할 때에도 일관된 특성과 디테일을 유지할 수 있도록 개선한 것이 특징이다.
오픈AI 멀티모달팀 소속의 데이비드 메디나(David Medina)는 최근 공개한 유튜브 영상에서 “이미젠은 기존 이미지 생성 모델들과 다르게 단순히 텍스트만으로 이미지를 만드는 것이 아니라, 사용자의 의도를 정확히 파악하고 캐릭터의 맥락을 유지하면서 요청한 변형을 정확히 구현한다”고 설명했다.
메디나는 ‘매우 낮은 폴리곤(low poly)의 펭귄 마법사’라는 간단한 프롬프트를 통해 이 기능을 시연했다. 일반적인 이미지 생성 모델은 낮은 폴리곤 형태를 표현하는 데 어려움을 겪지만, 이미젠은 사용자의 의도를 정확히 이해하고 깔끔한 결과물을 만들어냈다.
이어 메디나는 이 펭귄 캐릭터를 실제 보드게임용 미니어처와 크리스탈 스타일의 사실적인 버전으로 바꾸는 등, 추가적인 스타일 변형도 손쉽게 진행했다. 그는 “사용자가 모든 세부사항을 지시하지 않아도 모델이 자동으로 적합한 스타일과 세부사항을 추론해준다”며, 이미젠의 뛰어난 이해력과 유연성을 강조했다.
이번 업그레이드를 통해 오픈AI는 사용자의 창의적 작업을 더욱 직관적이고 효율적으로 지원할 것으로 기대된다.