본문 바로가기
ITPE/데이터베이스

데이터 베이스 취약 토픽 정리

by Myungs 2023. 9. 26.

데이터 품질진단
- 정의 : 정보시스템의 데이터 품질을 측정하여 수준을 평가하고 품질 저하 요인을 분석하여 개선하는 활동
- 품질진단 종류 : 데이터 값, 데이터 구조, 데이터 관리 프로세스
- 품질진단 절차 : 품질진단 계획수립 > 품질기준 및 진단대상 정의 > 품질측정 > 품질측정 결과 분석 > 품질 개선
- 품질진단 기법 : 
 1) 정형 데이터 : 데이터 프로파일링, 업무규칙, 데이터 품질측정, 오류원인 분석
 2) 비 정형 데이터 : 체크리스트, 품질측정 및 품질 지수, 오류원인 분석, 데이터 프로파일링 및 업무규칙

DQC
- 개념 : 공공/민간에서 개발하여 활용 중인 정보시스템의 데이터 품질을 학보하기 위해 데이터 자체 품질과 데이터 관리체계, 데이터 보안요소를 심사/인증하는 제도
- 유형
 1) DQC-V(Database Quality Certification-Value)
  - 개념 : 데이터 품질 영향 요소 전반을 도메인, 업무규칙을 기준으로 심사/심의하는 인증
  - 심사영역 : 도메인, 업무규칙
  - 인증레벨 : 플래티넘, 골드, 실버 3단계
  --> DB내 값(Value)를 대상으로 정합성을 정량화하여 정합율 수치에 따라 인증 수준 결정
 2) DQC-M(Database Quality Certification-Management)
  - 개념 : 행정처리, 의사결정 등 여러 목적으로 운영되는 데이터의 관리 수준을 심사/심의하는 인증
  - 심사기준 : 정확성, 일관성, 유용성, 접근성, 적시성, 보안성
  - 인증레벨 : 1레벨(도입), 2레벨(정형화), 3레벨(통합화), 4레벨(정량화), 5레벨(최적화)
 3) DRC-S(Database Quality Certification-Security)
  - 개념 : 개인정보가 저장된 데이터베이스 대상으로 보안에 대한 기술요소 전반을 심사/심의하는 인증
  - 심사기준 : DB접근제어, DB암호화, DB작업결재, DB취약점 분석
  - 인증레벨 : 1~4레벨로 분류
 
DQM3(Data Qualty Management Maturity Model)
- 개념 : 우니라나가 세계최초로 개발하여 5단계 성숙 수준으로 심사할 수 있는 품질인증 시스템(ISO 8000채택)
- 구조 : 데이터 품질 속성 6개 측면 분류, 데이터 품질관리 프로세스 8개 분류, 데이터 품질관리 성숙수준 5개 분류
- 성숙모형 : 도입 - 정형화 - 통합화 - 정량화 - 최적화
- 성숙도 수준 기준 : DQC-M과 동일(정확성, 일관성, 유용성, 접근성, 적시성, 보안성)

데이터 품질 국제표준 ISO 8000
- 데이터 관리 프로세스 및 평가를 위한 표준을 제공하는 품질관리 국제 표준
- 절차 : PLAN(데이터 품질 계획) > DO(데이터 품질 통제) > CHECK(데이터 품질 보증) > ACT(데이터 품질 개선)

품질관리
- 개념 : 데이터의 품질을 확보하기 위해 데이터 관리체계, 품질관리 기준, 절차를 통해 품질 목표 설정, 진단, 개선 등 일련의 활동
- 품질관리 3요소 : 데이터 관리(Principle), 데이터 관리조직(책임,지원,담당), 데이터 관리 프로세스(품질, 연계, 정보보호)
- 품질관리 기준 : 품질 확보 지표(완전성, 유효성, 일관성, 정확성), 데이터 활용 지표(유용성, 접근성, 적시성), 품질 관리 지표(준비성, 보안성)
- 품질 진단 및 개선 절차 : 품질진단 대상 정의  > 품질진단 수행 > 진단결과 분석 > 개선 수행 > 품질 통제

공공데이터
- 개념 : 공공기관이 법령 등에서 정하는 목적을 위해 생성된 기계 판독이 가능한 형태의 자료
- 근거법류 : 공공데이터 활성화 관한 법률 2조4호
- 제공형태 : 반드시 기계판독이 가능한 형태
- 공공데이터 품질관리 단계 : 계획 > 구축 > 운영 > 활용
- 포맷별 유형
 1) 1단계 : 미충족 포맥 - 트정 소프트웨어서 읽기만 가능하며 수정 불가 (PDF)
 2) 2단계 : 최소충족포맷 - 특정소프트웨어서 읽기 및 수정 가능(HWP, XLS)
 3) 3단계 : 오픈 포맷 - 최소 한가지 이상 비독점적 SW 읽고 수정 가능(CSV, JSON, XML)
 4) 4단계 : 오픈 포맷 - URI 기반 속성 특성 관계 기술 (RDF)
 5) 5단계 : 오픈 포맷 - 웹상의 다른 데이터와 연결, 공유 (LOD)
- 공공데이터 혁신 전략(3대 중점분야 10대 추진과제)
 1) 국민의 데이터 이용권 강화(일반 국민)
 2) 데이터를 통한 디지털서비스 활성화
 3) 데이터 기반의 일하는 방식 혁신
 
공개(정보)
- 개념 : 공공기관이 법에 따라 정보를 열람하게 하거나 그 사본/복제물을 제공하는 것
- 근거법류 : 공공기관 정보공개 법률 2호2호
- 제공형태 : 특정 형태 없음

공공데이터 품질관리 수준평가
- 개념 : 공공데이터의 적정한 품질 수준 확보위해 기관/DB/데이터의 3개 영역, 9개 평가지표로 구성된 진단 체계
- 평가지표 : 기관 품질관리(30), DB 품질관리(45), 데이터 품질관리(25)
- 평가등급 : 도입전 > 도입 > 관리화 > 체계화 > 최적화

데이터 표준화
- 개념 : 시스템별로 산재해 있는 데이터 정보 요소에 대한 명칭, 정의, 형식, 규칙에 대한 원칙을 수립하여 전사적으로 적용하는 활동
- 구성요소 : 데이터 표준(단어, 코드, 용어, 도메인), 데이터 표준 관리 조직(전담조직), 데이터 표준화 절차(수집>정의>확정>관리)
- 데이터 품질관리 프로세스
 1) 품질관리 계획수립 : 데이터 품질 기준 수립 - DQI(Data Quality Index, 데이터 품질 지표), CTQ(Critical To Quality, 핵심 품질관리 대상 정보항목) 선정
 2) 품질관리 대상선정 : 프로파일링, business rule  선정
 3) 품질 진단 및 개선 : 데이터 품질 진단, 개선/정제
--> 산재되어 있는 데이터를 표준화시켜 이를 잘 유지ㅏ기 위해 품질관리 프로세스를 수행하고 이를 측정하기 위해 성숙도 모델을 이용하여 평가

데이터 가치평가 제도
- 개념 : 시장에서 유통, 거래되는 데이터의 경제적 가치를 가액, 등급 및 점수로 평가하는 제도
- 관계 법령 : 데이터 기본법 14조
- 주요 내용 :
 1) 평가 체계
  * 가치 평가 자문단 : 관리/운영 자문, 위원9명/간사1명 구성
  * 평가기법 및 평가 체계 : 시장접근법, 수입접근법, 원가접근법
 2) 평가 기관
  * 평가기관 지정요건 : 인력구성(전문인력 : 기술사, 변호사 6인 포함 10명이상), 평가모델(평가기법을 수행할 수 있는 시설/장비 보유)
  * 평가기관 지정절차 : 평가기관 신청공고(과기정통부) > 신청/서류제출(신청기관) > 지정ㅇ심의(자문단) > 평가기관 지정 공고 발급(과기정통부)
- 데이터 가치 평가 기법 : 시장접근법, 수익접근법, 원가접근법

데이터 산업법
- 개념 : 4차 산업혁명의 핵심인 데이터경제 전환에 적극 대응하고, 데이터의 생산/유통/활용을 촉진하기 위한 법
      (데이터 산업진흥 및 이용촉진에 관한 기본법, 약칭:데이터산업법, 2022.04.20시행됨)
- 주요내용 : 국가 전체의 데이터 지휘본부(컨트롤 타워) 확립, 데이터 전문기업 체계적 육성 및 데이터 거래사 양성, 시장 조성 등
- 개정 내용 : 데이터 활용에 중점(거래사 양성, 거래분석 제공 사업자, 컨트롤 타워) > 데이터 품질에 중점(품질관리 정부 지원, 품질인증기관 지정, 부적절 인증 제재)

공공기관 데이터베이스 표준화 지침의 테이블 정의서 항목(공공기관의 데이터베이스 표준화 지침 9조)
1) 테이블 정의 : 물리 DB명, 테이블 소유자
2) 테이블 명칭 : 테이블 영문명, 테이블 한글명
3) 테이블 유형 : 테이블 유형명, 관련 엔티티명
4) 테이블 관리 설명 : 테이블 설명, 업무분류 체계, 보존기관, 테이블 볼륨, 발생주기
5) 데이터 개방 여부 : 공개/비공개 여부

CRUD 매트릭스
- 개념 : 정보시스템 구축 시 업무분석 과정에서 데이터 모델링과 프로세스 모델링의 산출물을 상호 검증하기 위한 도구
- 필수 요소 식별 : 프로세스 모델링(업무기능 분해도), 데이터 모델링(Entity Type(ERD))

MDM
- 정의 : 동일 형태로 사용되는 마스터 데이터를 여러 개의 코드 또는 키와 업무적 기준을 가지면서 유지되는 기준 정보 관리 체계
- 특징 : 비즈니스 지속성, 데이터 정합성 보장, 표준화 수립
- 구성요소 : 운영표준(표준체계, 품질체계, 데이터 통합), IT인프라(EAI/ETL, Data Hub), 거버넌스(원칙 및 정책, 조직 체계, 프로세스, 변화 관리)

공간 데이터베이스
- 개념 : 지형, 지물의 위치, 거리 등 공간적인 정보를 저장하고 활용가능 하도록 고안된 데이터베이스
- 특징 : 2차원/3차원 구조, 시공간 차원, R-Tree이용
- 구성요소 : 공간 질의 처리기, 일반 질의 처리기, 공간정보, 공간 연산자, 공간 색인, 공간 데이터 파일 관리기
- 공간 분석의 기능 : 분류, 세분화 및 일반화, 중첩, 공간 추정, 연결성 분석, 인근 분석

MBR(Minimum Bounding region)
- 정의 : 모양이 불규칙한 공간 데이터 객체를 저장하기 위한 객체의 최소 경계 사각형

다차원 색인구조
- 개념 : 기존의 1차원 값이 아닌 선, 면, 위치 등의 데이터를 처리하기 위한 다중 키 색인 구조
- 유형 :
 1) PAM(Point Access Method) 
   * k-d 트리 : 기본키, 보조 키에 대한 검색
   * k-d-B 트리 : b트리와 K-D트리 결합
   * 격자 파일 : 전체 공간을 하나 이상의 격자(Grid)로 분할
   * 사분트리 : 공간을 반복적으로 분해하는 성질을 가진 계층적 자료구조 표현
 2) SAM(Spatial Access Method)
   * R-트리 : 데이터 객체를 여러 차원의 구간들에 의해 표현
   * R+-트리 : 겹침 관계를 제거한 R트리
   * R*-트리 : R트리의 변형, 삽입이나 삭제 시 부모노드의 사각형이 효율적으로 확장