본문 바로가기

SQL

SQLD 시험 대비 - 데이터 모델과 성능 (1)

성능 데이터 모델링 : 

DB 성능 향상을 목적으로 설계 단계의 데이터 모델링 때부터 정규화, 반 정규화 테이블 통합, 테이블 분할, 조인 구조 , PK, FK 등 여러 가지 성능과 관련된 사항이 데이터 모델링에 반영될 수 있도록 하는 것.

==> 문제 발생 시점에 튜닝성능을 튜닝하며 데이터 모델이 변경 가능. 

분석/ 설계 단계에서 데이터 모델에 성능을 고려한 데이터 모델링을 수행할 경우 성능 저하에 따른 재 업무 비용을

최소화할 수 있음.  

데이터의 증가가 빠를수록 성능 저하에 따른 성능 개선비용은 기하급수적으로 증가하게 된다.

 

성능 데이터 모델링 고려사항 순서

1. 데이터 모델링을 할 때 정규화를 정확하게 수행

2. DB 용량산정을 수행한다.

3. DB에 발생되는 트랜잭션의 유형을 파악한다.

4. 용량과 트랜잭션의 유형에 따라 반 정규화를 수행

5. 이력 모델의 조정, PK / FK조정, 슈퍼 / 서브타입 조정

6. 성능 관점에서 데이터 모델을 검증한다.

 

함수적 종속성: 데이터(종속자)들이 어떤 기준값에 의해 종속되는 현상.

(-) 정규화 : 반복적인(중복제거) 데이터를 분리하고 각 데이터가 종속된 테이블에 적절하게 배치되도록 하는 것.

1차 정규화 :  같은 성격, 내용, 칼럼이 연속될때 컬럼 제거, 테이블생성 ( 1:M로 분리, 중복 속성에 대한 분리)

2차 정규화 : PK 복합키 구성일 때 부분적 함수 종속성 제거, 종석 관계 테이블 분리 => 1:M으로 분리

3차 정규화 : PK가 아닌 일반 칼럼에 의존하는 컬럼 분리 => 이행 함수 종속 제거

 

(+) 반 정규화 : 정규화된 엔터티, 속성, 관계에 대해 시스템의 성능향상과  개발과 운영의 단순화를 위해 중복, 통합, 분리 등을 수행하는 데이터 모 델리의 기법 (데이터 중복을 통해 성능향상)

조회 시 디스크(I/O)가 많거나 경로가 멀어 조인에 의한 성능저하를 막기 위해 수행.

 

일반적으로 정규화 시 입력/수정/삭제 성능이 향상되며 반 정규화시 조인 성능이 향상된다. (입력 / 수정 / 삭제 성능은 다운)

 

반정규화 절차 

1. 반정규화 대상 조사 (범위 처리빈도수, 범위, 통계성).

1. 자주 사용되는 테이블에 접근하는 프로세스의 수가 많고 항상 일정한 범위만을 조회하는 경우

2. 테이블에 대량의 데이터가 있고 대량의 데이터 범위를 자주 처리하는 경우에 처리 범위를 일정하게 줄이지 않으면 성능을 보장할 수 없는 경우 

3. 통계성 프로세스에 의해 통계 정보를 필요로 할 때 별도의 통계 테이블을 생성한다. 

4. 테이블에 지나치게 많은 조인이 걸려 데이터를 조회하는 작업이 기술적으로 어려울 경우 : 테이블조인개수 많을 때

 

2. 다른 방법 유도 검토 ( 뷰, 클러스터링,. 인덱스 조정).

1. 뷰 사용 : 지나치게 많은 조인이 걸려 데이터를 조회하는 작업이 기술적으로 어려울 때 VIEW를 사용한다. 

2. 클러스터링 : 대량의 데이터처리나 부분처리에 의해 성능이 저하되는 경우 클러스터링을 적용하거나  인덱스를 조정

(조회가 대부분일 때 클러스터링 적용)

3. 파티셔닝 : 대량의 데이터는 PK의 성격에 따라 부분적인 테이블로 분리할 수 있다. 파티셔닝 키에 의해 물리적 저장공간 분리

( ● 파티셔닝: 데이터 액세스 성능을 향상하기 위해 테이블에 적용하는 기법  / 논리적으로는 1개 테이블, 물리적으로는 여러 테이블로 분리)

4. 캐시 : 응용 애플리케이션에서 로직을 구사하는 방법을 변경함으로써 성능을 향상할 수 있다. 

 

반응형