PM/직접 해보기

프롬프트 엔지니어닝으로 이미지 품질검수 (문제정의~가설까지 재정의)

원담 2025. 7. 3. 20:54
728x90
 

프롬프트 엔지니어링으로 메뉴 이미지 품질 검수하기: GPT 기반 업무 자동화 | 우아한형제들 기술

GPT의 등장으로 생성형 AI 기술은 대화, 검색, 추천 등 다양한 분야에서 활용되며 빠르게 보편화되고 있습니다. 2024년 10월 기준, 국내 ChatGPT 사용자는 520만 명을 넘어서며 10명 중 1명 이상이 생성

techblog.woowahan.com

배달의 민족은 작년 GPT를 통한 AI 이미지 검수 기능을 도입하였다. 그 과정에서 생겼던 문제들과 해결과정을 자사 블로그에서 설명해 놓았는데, 이번엔 이 글에서 글쓴이가 어떤 PM적인 사고방식으로 문제를 발견하고 해결했는지 차근히 정리해 보려고 한다.

문제발견

  • 배달의민족에 입점한 사장님들이 매일 1만 건 이상의 "메뉴 이미지 검수"를 운영자가 직접 처리하는데, 이로 인해 처리 지연과 리소스 부담이 크다

문제정의 (5 whys)

  • 문제: 운영자가 이미지 검수를 완료한는데 너무 시간이 오래걸린다. 왜? 
    • 운영자가 매일 1만건 이상의 이미지에 대해 반려 기준을 수동으로 확인하고 처리해서. 왜? 
    • 현재 검수 프로세스가 자동화되지 않아서, 왜? 
    • 이미지 적용되는 정책이 빈번하게 변경되고, 그 학습 데이터가 충분하지 않아 AI나 자동화 적용이 어려워서, 왜?
    • 아 그렇구나..
  • 즉 기존 방식은 시간이 오래 걸리고 정책이 자주 바뀌면서 "수동 기준 적용"이 비효율적이라는 문제가 있다

가설수립

해당 블로그에서는 가설을 직접적으로 명시하진 않았다. 하지만 글쓴이는 머신러닝 도입 검토 과정에서 검수 정책이 자주 바뀌고, 정량화된 데이터가 부족하다라는 문제를 발견하고 범용적인 생성형 AI(GPT)를 도입을 하였다. 따라서 나는 아래와 같은 가설을 역으로 세울 수 있었다.

  • "만약 GPT를 활용해 프롬프트를 정교하게 설계한다면, 메뉴 이미지의 품질 검수를 자동화하면서도 변화하는 정책에 유연하게 대응할 수 있을 것이다. 이를 통해 검수 처리 시간을 기존 대비 90% 이상 단축하고, 정책 반영 정확도를 높여 운영자 개입률을 40% 이하로 줄일 수 있을 것이며, 도입 후 한 달 이내에 사장님 대상 기능 사용률을 50% 이상 달성할 수 있을 것이다"

액션

  • 생성형 AI를 이미지 검수 시스템에 도입한다.

액션은 위의 한 문장으로 정리 할 수있지만 조금더 세분화된 작업으로 나눈다면 아래와같이 정리할 수있다.

  • GPT가 이해 할 수 있게 복잡한 이미지 반려 기준을 텍스트로 명확히 정리한다.
  • 프롬프트 엔지니어링을 통해 정책을 GPT가 이해할 수 있는 형태로 구성한다. 
    • "다음 이미지 설명을 기반으로, 아래 정책 기준에 따라 승인/반려를 판단하고 그 이유를 설명해"
  • 결과는 JSON 포맷으로 구조화해 서비스 측에서 바로 사용하도록 구성 
  • Generated Knowledge Prompting 기법(Chain of Thought 유사)을 적용해 응답 일관성 향상
  • 지연 시간(latency) 최적화를 위해 응답 양 축소 및 간결화

검증결과

  • 이미지 검수 시간이 99.98% 단축
  • 반려 사유도 더 구체적·명확하게 제공
  • 기대치 38% 사용률 → 실사용률 89% 달성

추가적으로 생성형 AI를 도입을 한 후에는 모니터링 과정에는 사장님과 운영자의 피드백을 수집해서 프롬프트를 수정하거나 오판 사례가 있으면 이것을 기반으로 프롬프티 튜닝이나 조건을 강화하는 반복작업이 있었을 것으로 예상한다.

아티클에서 얻은 인사이트

이번 사례를 통해 생성형 AI의 실무 적용 방식을 간접적으로 경험하면서, 기존에 학습했던 개념들이 실제 현장에서 어떻게 활용되는지 더 명확하게 이해할 수 있었다. 특히, GPT가 범용 모델인 만큼 완전 자동화보다는 아직까지는 사람과의 협업이 중요한 ‘하이브리드 접근’이 필요하다는 점에 공감했다. 비록 해당 글이 PM 프레임워크를 명시적으로 따르진 않았지만, 문제 발견부터 해결까지의 흐름을 PM적인 관점에서 재구성해보며 읽는 과정 자체가 인사이트 있었다.

728x90