← Projects

SKU 데이터 클렌징 자동화

2021.07 — 2022.01 인턴 (자발적 프로젝트, 단독 개발)
8시간 → 40분 90% 시간 절감 패턴 390개

배경

리본즈는 291개 파트너로부터 매일 6,000~10,000건의 상품 재고 데이터를 수신합니다. 동일 상품이 파트너마다 다른 명칭으로 들어오기 때문에, 이를 하나의 상품으로 묶을 고유 식별자(SKU)가 필요했습니다.

SKU로 상품을 묶어 네이버 쇼핑에 통합 노출하면 스토어 매출을 높일 수 있었지만, 기존에는 담당자 한 명이 수작업으로 하루 종일(약 8시간) 처리하고 있었습니다.

접근 방식

인턴이었던 저는 이 수작업을 반복하는 과정에서 자동화 가능성을 발견하고, 지시 없이 자발적으로 자동 추출 시스템을 기획하고 개발했습니다.

기술 진화

시스템은 5번의 기술 진화를 거쳤습니다.

  • v1 — pandas + 반복문으로 초기 구현
  • v2 — pandas 내장함수 활용으로 성능 개선
  • v3 — SQL 전환으로 처리 로직 단순화
  • v4 — 전체 자동화 파이프라인 구축
  • v5 — Google Sheet → AWS Glue 테이블로 패턴 관리 이관

설계 판단

기술적으로 가장 중요한 판단은 패턴과 코드의 분리였습니다. 정규표현식 패턴을 코드에 하드코딩하지 않고 별도 파일로 관리하여, 파이썬을 모르는 스토어팀도 패턴을 추가하고 수정할 수 있도록 설계했습니다.

최종 패턴 규모:

  • SKU 정규표현식 220개
  • 브랜드 패턴 89개
  • 옵션값 통일 패턴 81개

성과

  • 처리 시간: 8시간 → 40분 (90% 절감)
  • 총 390개의 정규표현식 패턴으로 상품 식별 자동화
  • 비개발자도 패턴을 직접 관리할 수 있는 구조 확보
  • 이 프로젝트의 성과를 인정받아 정규직 전환