← Projects

데이터 파이프라인 설계·도입

2022.07 — 2023.03 BI팀 (3명 협업, 기획 및 개발)

0 → 1 파이프라인 Athena + S3 Redash 도입

배경

리본즈에는 데이터 파이프라인이 존재하지 않았습니다. 서비스 DB(MySQL) 레플리카에 직접 쿼리를 날려 데이터를 추출하는 방식이었고, 대시보드 수요는 계속 늘어나고 있었습니다.

BI팀 3명이 함께 여러 방안을 검토했습니다.

저는 S3 계층 구조를 raw / core / output 3단계로 기획했습니다.

최종 구조는 다음 4곳의 인프라로 구성되었습니다.

성과:

한계:

이 한계들은 이후 Airflow 워크플로우 플랫폼 구축 프로젝트에서 해결되었습니다.