리본즈는 291개 파트너로부터 매일 6,000~10,000건의 상품 재고 데이터를 수신합니다. 동일 상품이 파트너마다 다른 명칭으로 들어오기 때문에, 이를 하나의 상품으로 묶을 고유 식별자(SKU)가 필요했습니다.
SKU로 상품을 묶어 네이버 쇼핑에 통합 노출하면 스토어 매출을 높일 수 있었지만, 기존에는 담당자 한 명이 수작업으로 하루 종일(약 8시간) 처리하고 있었습니다.
인턴이었던 저는 이 수작업을 반복하는 과정에서 자동화 가능성을 발견하고, 지시 없이 자발적으로 자동 추출 시스템을 기획하고 개발했습니다.
시스템은 5번의 기술 진화를 거쳤습니다.
기술적으로 가장 중요한 판단은 패턴과 코드의 분리였습니다. 정규표현식 패턴을 코드에 하드코딩하지 않고 별도 파일로 관리하여, 파이썬을 모르는 스토어팀도 패턴을 추가하고 수정할 수 있도록 설계했습니다.
최종 패턴 규모: