4.3.4 데이터 요구사항 (DAR)
데이터 요구사항(DAR, Data Requirement)은 현행 시스템에서 신규 시스템으로의 데이터 이관, 변환, 정합성 검증, 보안 처리 등 데이터 전반에 대한 요구사항을 정의합니다. 현행 MSSQL Server 2008 기반 약 151개 테이블(CS 75개, 홈페이지 63개, CMS 13개)을 통합 이관하며, 무손실 마이그레이션과 정합성 100% 달성을 목표로 합니다.
제안사는 데이터 이관 계획, ETL 변환 규칙, 정합성 검증 프로세스, 비식별화 및 개인정보 처리 방안, 백업·복구 전략, 데이터 표준화 기준을 구체적으로 제시해야 하며, 각 항목별 산출물과 검증 방법을 명시해야 합니다.
DAR-001
섹션 제목: “DAR-001”| 항목 | 내용 |
|---|---|
| 요구사항 분류 | 데이터 |
| 요구사항 고유번호 | DAR-001 |
| 요구사항명 | 데이터 이관 계획 |
| 요구사항 상세설명 | 요구사항 개요 현행 시스템 데이터를 신규 시스템으로 무손실 이관하기 위한 전체 계획 수립 (1) 목표 • 현행 MSSQL Server 2008 기반 약 151개 테이블(CS 75개, 홈페이지 63개, CMS 13개) 통합 이관 • 데이터 무손실 마이그레이션 및 정합성 100% 달성 • Stored Procedure, Function, Trigger 49건은 애플리케이션 코드로 전환 • 이관 실패 시 롤백 트리거 기준: 정합성 90% 미만 (2) 세부 내용 • 이관 단계: 준비 및 매핑 정의 → 테스트 이관(1~5% 샘플) → 본 이관(야간/휴일) → 검증 → 안정화 • 이관 방식: 배치 기반 ETL을 우선 채택하며, 1회성 이관 특성상 실시간 동기화는 적용하지 않음 • 롤백 절차: 정합성 검증 실패 시 자동 롤백 및 원인 분석 프로세스 |
| 산출정보 | 데이터 이관 계획서, 테이블 매핑 정의서, 이관 스크립트, 롤백 절차서 |
DAR-002
섹션 제목: “DAR-002”| 항목 | 내용 |
|---|---|
| 요구사항 분류 | 데이터 |
| 요구사항 고유번호 | DAR-002 |
| 요구사항명 | ETL·변환 규칙 |
| 요구사항 상세설명 | 요구사항 개요 AS-IS 데이터를 TO-BE 데이터 구조로 변환하기 위한 ETL 규칙 및 스크립트 제공 (1) 목표 • 필드별 변환 규칙 정의 및 자동화 • 대량 데이터 배치 사이징 및 병렬 적재 최적화 • 첨부파일, 이미지 등 바이너리 데이터 외부 스토리지 이관 방식 제시 (2) 세부 내용 • 필드 변환 규칙 예시: - 13자리 숫자 ID → 코드형 식별자 변환 - 전화번호 정규화(하이픈 통일, 국가코드 처리) - 날짜 형식 통일(YYYY-MM-DD HH:mm:ss) • 배치 처리: 대량 데이터 분할 적재 및 병렬 처리 전략 • 바이너리 데이터: 첨부파일, 이미지 등 외부 스토리지(S3, NAS 등) 이관 방식 |
| 산출정보 | 필드 매핑 정의서, ETL 스크립트, 변환 테스트 결과 리포트 |
DAR-003
섹션 제목: “DAR-003”| 항목 | 내용 |
|---|---|
| 요구사항 분류 | 데이터 |
| 요구사항 고유번호 | DAR-003 |
| 요구사항명 | 정합성 검증 |
| 요구사항 상세설명 | 요구사항 개요 이관된 데이터의 정합성을 검증하기 위한 프로세스 및 기준 수립 (1) 목표 • 데이터 정합성 100% 달성 • 건수, 합계, 필드별 1:1 비교 검증 • 정합성 미달 시 롤백 및 재이관 프로세스 수립 (2) 세부 내용 • 건수 검증: AS-IS와 TO-BE 테이블별 COUNT 일치 확인 • 합계 검증: 금액, 구독 건수 등 집계 데이터 일치 확인 • 샘플 검증: 무작위 샘플 100건 이상 1:1 필드 비교 • 롤백 기준: 정합성 90% 미만 시 자동 롤백 및 원인 분석 |
| 산출정보 | 정합성 검증 리포트, 검증 스크립트, 샘플 비교 결과(CSV) |
DAR-004
섹션 제목: “DAR-004”| 항목 | 내용 |
|---|---|
| 요구사항 분류 | 데이터 |
| 요구사항 고유번호 | DAR-004 |
| 요구사항명 | 비식별화·개인정보 처리 |
| 요구사항 상세설명 | 요구사항 개요 개인정보 보호법 준수를 위한 데이터 비식별화 및 보존 정책 수립 (1) 목표 • 보유기간 초과 개인정보 자동 파기 • 분석용 데이터셋 식별자 토큰화 • 권한별 마스킹 정책 적용 (2) 세부 내용 • 자동 파기: 보유기간 초과 개인정보 매월 1일 자동 파기 • 토큰화: 분석용 데이터셋은 식별자를 토큰으로 변환하여 저장 • 권한별 마스킹: 외부 콜센터는 주소 뒷자리만 조회 가능, 내부 관리자는 전체 조회 가능 • 파기 대장: 파기 이력 관리 및 감사 로그 보관 |
| 산출정보 | 비식별화 정책서, 비식별화 스크립트, 파기 대장 샘플 |
DAR-005
섹션 제목: “DAR-005”| 항목 | 내용 |
|---|---|
| 요구사항 분류 | 데이터 |
| 요구사항 고유번호 | DAR-005 |
| 요구사항명 | 백업·복구 |
| 요구사항 상세설명 | 요구사항 개요 데이터 손실 방지를 위한 백업·복구 전략 및 검증 프로세스 수립 (1) 목표 • 일일 자동 스냅샷 백업(보관 30일 권장) • 정기 복구 테스트 수행 • RTO(Recovery Time Objective) 및 RPO(Recovery Point Objective) 목표 정의 (2) 세부 내용 • 백업 주기: 일일 자동 스냅샷, 주간 전체 백업, 월간 아카이브 백업 • 보관 정책: 일일 백업 30일, 주간 백업 3개월, 월간 백업 1년 보관 • 복구 테스트: 분기별 복구 테스트 수행 및 결과 보고 • RTO/RPO 목표: RTO 4시간 이내, RPO 1시간 이내 권장 |
| 산출정보 | 백업 정책 문서, 복구 테스트 리포트, 백업 실행 로그 |
DAR-006
섹션 제목: “DAR-006”| 항목 | 내용 |
|---|---|
| 요구사항 분류 | 데이터 |
| 요구사항 고유번호 | DAR-006 |
| 요구사항명 | 데이터 표준화 |
| 요구사항 상세설명 | 요구사항 개요 코드, 도메인, 데이터 정제 규칙 등 데이터 표준화 기준 수립 (1) 목표 • 도메인 코드 표준 마스터 정의 • 데이터 정제 규칙 수립 • 외부 시스템(ERP, PG) 코드 매핑 (2) 세부 내용 • 도메인 코드: 채널, 결제상태, 배송상태 등 표준 코드 마스터 정의 • 데이터 정제 규칙: 전화번호 정규화, 이메일 형식 검증, 주소 표준화 • 외부 시스템 매핑: ERP 코드, PG 결제 코드 등 외부 시스템 코드 매핑 테이블 제공 • 코드 관리: 코드 추가/변경 시 이력 관리 및 버전 관리 |
| 산출정보 | 코드 마스터 정의서, 데이터 정제 규칙 문서, 외부 시스템 매핑 테이블(ERP/PG) |
다음 분류는 테스트·운영 요구사항 (TER)을 참고하시기 바랍니다.