라트비아 Sun Finance, AWS Bedrock·Textract로 ID 추출 정확도 79.7→90.8%·문서당 비용 91%↓·처리시간 20시간→5초… 6주 PoC 후 1월 22일 프로덕션 가동
<p>Sun Finance가 AWS Generative AI Innovation Center와 함께 신원 확인(IDV) 파이프라인을 재구축해 ID 추출 정확도를 79.7%에서 90.8%로 끌어올리고, 문서당 비용을 91% 절감했으며, 처리 시간을 최장 20시간에서 5초 미만으로 단축했다고 밝혔다. 솔루션은 2026년 1월 22일 프로덕션에 투입됐다.</p>
<p>Sun Finance는 2017년 창업한 라트비아 핀테크로 9개국에서 기술 우선 온라인 대출 마켓플레이스를 운영한다. 회사는 0.63초마다 신규 대출 요청을 처리하고 월 400만 건 이상의 평가를 수행한다. 가장 처리량이 많은 산업 중 한 곳에서는 마이크로론 신청이 월 8만 건에 달했고, 이 중 약 60%가 수동 운영자 검토를 거쳐야 했다.</p>
<p>수동 워크로드의 주범은 OCR 오류였다. 수동 검토 대상 60% 가운데 약 80%는 추출 정보와 고객 입력 데이터의 불일치에서 비롯됐고, 이 불일치 가운데 60%는 고객 실수가 아닌 OCR 오류였다. 나머지 20%의 수동 개입은 사기 탐지 플래그와 관련이 있었다. 일일 요청의 약 10%는 실제 사기 신청이었으며, 이 지역의 수동 검증에만 약 3 FTE가 투입됐다. 자동화 케이스는 10분 미만이지만 영업시간 외 수동 검토는 최장 20시간이 걸렸다.</p>
<p>AWS Generative AI Innovation Center는 2025년 9~10월 6주 PoC로 두 가지 AI 솔루션 — ID 추출 시스템과 사기 탐지 시스템 — 을 완전 서버리스 아키텍처로 구축했다. 핵심 서비스는 Amazon Bedrock(Anthropic Claude Sonnet 4와 Amazon Titan Multimodal Embeddings), Amazon Textract(주 OCR), Amazon Rekognition(폴백 OCR·얼굴 검출·마스킹), Amazon S3 Vectors(서버리스 벡터 유사도 검색), AWS Step Functions, AWS Lambda, Amazon API Gateway, Amazon S3다.</p>
<p>ID 추출은 /extract-id 라우트로 노출된다. Lambda가 ID 이미지를 받아 Amazon Textract에 1차 OCR을 요청하고, Textract가 낮은 신뢰도를 반환하면 Amazon Rekognition으로 폴백한다. 추출된 텍스트는 Amazon Bedrock의 Claude Sonnet 4로 전달돼 표준화된 JSON 필드로 구조화된다. 첫 시도로 Claude Sonnet 4 단독으로 ID 이미지를 보낸 접근법은 61.8% 정확도(ID 번호 추출은 43%)에 그쳤지만, 4주에 걸친 3차례 반복 끝에 다단계 설계가 90.8%에 도달했다.</p>
<p>사기 탐지는 /detect-fraud 라우트로 노출되며, AWS Step Functions 워크플로가 두 가지 검사를 병렬로 실행한다. 배경 유사도 검사는 Amazon Rekognition이 셀카 이미지에서 얼굴을 마스킹한 뒤 Amazon Bedrock Titan Multimodal Embeddings가 배경의 벡터 표현을 생성해 Amazon S3 Vectors에 저장된 알려진 사기 패턴과 매칭한다. 시각 패턴 탐지는 Amazon Bedrock의 Claude Sonnet 4가 화면 촬영 흔적과 디지털 조작을 분석한다. 두 결과는 Lambda 기반 위험 평가 함수로 모여 결합 사기 점수를 JSON으로 산출한다.</p>
<p>전체 일정은 107영업일이다. AWS Generative AI Innovation Center 협업은 2025년 8월 26일 킥오프부터 10월 9일 최종 발표까지 32일이 걸렸고, 11월 14일까지 26일에 걸쳐 기술 핸드오버가 진행됐다. 이후 Sun Finance가 35영업일 동안 프로덕션 전환을 진행했으며, 12월 18일부터 1월 7일까지 14일간의 연말 프로덕션 동결이 포함됐다. 시스템은 2026년 1월 22일 라이브에 들어갔다.</p>
<p>Sun Finance는 2019년 Amazon Rekognition·Amazon Textract로 첫 IDV 자동화를 구축한 이후 개발 지역 확장 과정에서 한계를 마주했다. 영어와 현지 언어가 혼재된 문서, 7가지 ID 타입의 다양한 레이아웃, 전통적 OCR 학습 데이터에서 과소대표된 현지 언어 텍스트가 잦은 추출 오류로 이어졌다. 회사는 이번 솔루션이 전용 OCR과 LLM 구조화의 결합이 단일 도구 사용을 능가했음을 보여준다고 설명했다.</p>
관련 기사
마이크로소프트 WorkLab '에이전트가 기업 소프트웨어 주 사용자'… 신제품 ‘Copilot Cowork’는 ‘소수 엔지니어가 몇 주 만에 거의 전부 에이전트로 작성’
OpenAI, ChatGPT '고급 계정 보안' 옵션 출시… 패스키·보안 키 강제·취약 로그인 차단, 복구 키 분실 시 계정 영구 손실 가능
더 버지 '스마트 안경 1년 리뷰: 역대 가장 멋지지만 할 일이 없다'… Meta Ray-Ban Display·Even Realities G2·Oakley Meta HSTN·Rokid·Lucyd 비교, 'Meta AI Ferrari 식별 6번 실패'