본문 바로가기
데이터/데이터 관리

데이터 리니지란? (Data Lineage)

by Sunyoung95 2024. 5. 2.

데이터 리니지란?

  • Data Flow에 따라 데이터가 Transform 될 때 원천이 되는 Source 데이터가 어떤 것인지 알 수 있도록 하는 방법론
  • 데이터의 흐름을 시각화하는 것.

등장배경

  • 기업 업무의 복잡성, 시스템 간 연계 증가 → 데이터 계보 파악 니즈 증가
  • 예시 : DW기반 기업에서 BI 데이터 정합성 문제

목적 

  • 개인정보 보호
    →데이터의 출처와 이동경로를 추적함으로써, 데이터 유출이나 오용을 방지
  • 데이터의 신뢰성과 품질을 보장
    → 의사결정과정에서 중요하게 여겨지는 부분
  • 오류 원인 이해 및 수정
  • 데이터 중복 식별 및 방지를 통한 운영 간소화 및 비용절

예시1

  • 고객이 고객 서비스 센터에 전화를 걸어 주소변경을 요청할 경우
  • 데이터 리니지는 다른 시스템이 새 주소로 업데이트 되는 데이터 프로세스를 보여줌.

특징

데이터 생명주기 생성, 변경, 이동 등 전 생명주기 관리
적시 확인 데이터 최적화 형태 적시 확인
정확성, 안전성 데이터 계보 현행화 시스템 안정성 향상

 

절차 별 구성요소

절차 구성요소 설명
수집/분석 EDF AP, ETT, DA 모델
외부 솔루션 BI/DW, EAI, ETL, CDC, Log
적재/관리 맵핑정보 Data Flow, Data Mgmt
메타데이터 데이터모델, 맵핑/시스템정보
시각화 시각화 툴 데이터 맵, 테이블/컬럼 흐름
리포팅 연관레포팅, BI 리포팅

 

 

 

 

출처

'데이터 > 데이터 관리' 카테고리의 다른 글

OLAP vs. OLTP  (0) 2024.07.28
데이터 디스커버리 플랫폼  (0) 2024.05.26
메타데이터 관리  (0) 2024.05.19
데이터 거버넌스란? (Data Governance)  (0) 2024.05.07

댓글