본문 바로가기

SQL

SQLD 시험 대비 - 데이터 모델과 성능 (3)

로우 체이닝 : 로우의 길이가 너무 길어서 데이터 블록 하나에 데이터가 모두 저장되지 않고 두 개 이상의 블록에 걸쳐 하나의 로우가 저장되어 있는 형태  -> 1:1로 테이블 분리해 조회 성능 향상

 

로우 마이그레이션: 데이터 블록에서 수정이 발생하면 수정된 데이터를 해당 데이터 블록에서 저장하지 못하고 다른 블록의 빈 공간을 찾아 저장하는 방식

 

로우 체이닝과 로우 마이그레이션이 발생하여 많은 블록에 데이터가 저장되면 DB 메모리에서 디스크 I/O가 발생할 때,

많은 디스크 I/O가 발생하여 성능 저하발생 트랜잭션을 분석하여 적절하게 1:1 관계로 분리함으로써 성능 향상이

가능하도록 해야 한다.

 

PK에 의해 테이블을 분할하는 방법(파티셔닝)

(파티셔닝: 1개 테이블에 많은 데이터가 저장될 때 논리적으로는 1개의 테이블이지만 물리적으로는 여러 테이블로 분리)

1. RANGE PARTITION: 대상 테이블이 날짜 또는 숫자값으로 분리가 가능하고  각 영역별로 트랜잭션이 분리되는 경우 ex_요금 _ 0401 ( 범위 지정 )

2. LIST PARTITION: 지점, 사업소 등 핵심적인 코드값으로 PK가 구성되어 있고 대량의 데이터가 있는 테이블의 경우 

ex_ 고객_서울 ( 특정값 지정 )

3. HASH PARTITION :  지정된 HASH 조건에 따라 해시 알고리즘이 적용되어 테이블이 분리 (해쉬 적용)

 

테이블에 대한 수평/ 수직분할의 절차

1. 데이터 모델링을 완성한다.

2. DB 용량산정을 한다.

3. 대량 데이터가 처리되는 테이블에 대해 트랜잭션 처리 패턴을 분석한다.

4. 칼럼 단위로 집중화된 처리가 발생하는지, 로우 단위로 집중화된 처리가 발생하는지 분석하여 집중화된 단위로 테이블을 분리하는 것을 검토한다.

-> 칼럼 많음 --> 1:1 분리 (테이블)

-> 데이터 많음  --> 파티셔닝(테이블)


슈퍼/ 서브 타입 모델

업무를 구성하는 데이터를 공통과 차이점의 특징을 고려하여 효과적 표현, 논리적 모델

슈퍼 타입: 공통부분

서브 타입: 공통으로부터 상속받아 다른 엔터티와 차이가 있는 속성

 

슈퍼/ 서브 타입 데이터 모델의 변환기술

1. 개별로 발생되는 트랜잭션에 대해서는 개별 테이블로 구성 ( OneToOne Type)

2. 슈퍼타입+ 서브타입에 대해 발생되는 트랜잭션에 대해서는 슈퍼+서브타입 테이블로 구성(Plus Type)

3. 전체를 하나로 묶어 트랜잭션이 발생할 때는 하나의 테이블로 구성( Single Type, All in One Type)

 

인덱스 특성을 고려한 PK/FK DB성능향상

인덱스의 특징은 여러 개의 속성이 하나의 인덱스로 구성되어 있을 때 앞쪽에 위치한 속성의 값이 비교자로 있어야 

좋은 효율을 나타낸다.

앞쪽에 위치한 속성의 값이 가급적 '=' 아니면 최소한 범위 'Between' '<>'가 들어와야 효율적이다.

 


분산 DB

1. 여러 곳으로 분산되어 있는 DB를 하나의 가상 시스템으로 사용할 수 있도록 한 DB

2. 논리적으로 동일한 시스템에 속하지만, 컴퓨터 네트워크를 통해 물리적으로 분산되어 있는 데이터 집합

 

분산 DB (< = > 통합 DB)를 만족하기 위한 6가지 투명성

1. 분할 투명성(단편화) : 하나의 논리적 Relation이 여러 단편으로 분할되어 각 사본이 여러  사이트에 저장

2. 위치 투명성 :  사용하려는 데이터의 저장장소 명시 불필요, 위치정보가 시스템 카탈로그에 유지

3. 지역사상 투명성: 지역 DBMS과 물리적 DB사이의 Mapping보장

4. 중복 투명성 :  DB객체가 여러 사이트에 중복되어 있는지 알 필요가 없는 성질

5. 장애 투명성: 구성요소의 장애에 무관한 트랜잭션의 원자성 유지

6. 병행 투명성 :  다수 트랜잭션 동시 수행 시 결과의 일관성 유지, TimeStamp, 분산 2단계 Locking 이용

 

분산 DB의 장단점

장점: 지역 자치성, 신뢰성 가용성, 효용성, 융통성, 빠른 응답속도, 비용절감, 각 지역 사용자 요구 수용

단점: 비용증가, 오류의 잠재성 증대, 설계관리의 복잡성, 불 규칙한 응답 속도, 통제의 어려움, 데이터 무결성의 위험

 

분산 DB적용 기법

1. 테이블 위치 분산: 설계된 테이블을 본사와 지사 단위로 분산, 위치별 DB 문서 필요

2. 테이블 분할 분산: 각각의 테이블을 쪼개어 분산 

수평 분할: 로우 단위로 분리, 지사 별로 다를 때 중복 x

수직 분할: 칼럼 단위로 분리, 각 테이블에 동일 PK가 있어야 함

3. 테이블 복제 분산: 동일한 테이블을 다른 지역이나 서버에서 동시에 생성하여 관리하는 유형

부분복제: 마스터 DB(본사)에서 테이블의 일부의 내용만 다른 지역이나 서버에 위치

광역복제: 마스터 DB테이블의 내용을 각 지역이나 서버에 존재 -> 본사/지사의 데이터량이 동일

4. 테이블 요약 분산: 지역 간에 또는 서버 간에 데이터가 비슷하지만 서로 다른 유형으로 존재하는 경우

분석요약: 동일한 테이블 구조를 갖고 있으면서  분산되어 있는 동일한 내용의 데이터를 이용하여 통합된 데이터를 산출하는 방식 ex_판매실적 지사 A, 지사 B

통합요약: 분산되어 있는 다른 내용의 데이터를 이용하여 통합된 데이터를 산출하는 방식 ex_판매실적 지사 A:C제품, 지사 B:D제품

 

분산  DB설계를 고려해야 하는 경우

1. 성능이 중요한 사이트 

2. 공통코드, 기준정보, 마스터데이터의 성능향상 -> 복제분산

3. 실시간 동기화가 요구되지 않는 경우, Near Real(거의 실시간) Time 특징을 갖고 있는 경우

4. 특정 서버에 부하가 집중되어 부하를 분산하는경우

5. 백업 사이트 구성하는 경우

반응형