데이터 모델링의 이해 - 스키마
데이터 모델링의 개념에 대해 요약한 페이지
Last updated
데이터 모델링의 개념에 대해 요약한 페이지
Last updated
데이터 모델링에 대해 이해하기 위해서는 현실세계의 건축물 모델링에 대해 떠올리면 이해하기 편합니다. 건축 현장에서는 실제 건축에 들어가기 전 건축물에 대한 모델링 작업을 먼저 수행하여 최적화된 설계구성과 디자인을 구축하고 나서 실제 건축에 들어가죠. 데이터 모델링도 똑같습니다. OOP와 같은 객체지향 프로그래밍을 통해 현실세계의 각종 사물,데이터를 가상세계로 구현시 발생하는 각종 객체를 효율적으로 저장하기위한 저장공간(데이터)을 설계하는 과정을 데이터 모델링이라고 부릅니다.
간략하게 설명하자면 데이터모델링이란 아래와 같습니다.
정보시스템을 구축하기 위한 데이터 관점의 업무분석 기법이다.
현실세계의 데이터를 약속된 표기법으로 표현하는 과정이다.
데이터베이스를 구축하기 위한 분석 및 설계의 과정이다
데이터 모델링을 통해 구축된 시스템의 업무의 흐름을 분석할 수 있다.
데이터 모델링을 비효율적으로 설계하면, 불필요한 데이터의 중복으로 메모리를 쓸데없이 많이 잡아먹는 다던가, 잘못된 설계로 데이터의 확장이 힘들어진다던가, 일관성 없는 데이터가 들어갈 수 있습니다. 정리하자면 아래와 같습니다.
잘못된 데이터모델 설계로 동일한 데이터가 여러 엔티티(테이블)에 추가될 수 있는데 이를 조심하여 설계하여야 합니다.
데이터 모델이 특정 업무 프로세스를 그대로 모방하는 경우 프로세스가 변경될 때마다 데이터도 함께 수정해야 하므로 유지보수의 어려움이 가중될 수 있습니다. 이를 방지하기 위해 애초에 프로세스와 관리하는 데이터를 분리하여 모델링하는게 효율적입니다.
복잡한 데이터 모델링을 설계할때는 각 데이터가 상호간에 연관 관계를 맺게 될 수 있는데, 이 관계를 제대로 정의하지 못한다면 일관되지 않는 데이터가 저장 될수 있습니다. 이를 방지하기 위해 각 데이터의 상호 연관관계를 명확하게 정의하여 일관된 데이터를 가지도록 설계하여야 합니다.
외부 스키마란 데이터베이스를 사용하는 사용자의 유형에 따라 여러개의 스키마자 존재할 수 있습니다. 하나의 데이터베이스를 사용자의 유형별로 맞추어 접근할 수 있는 데이터를 다르게 정의한 것을 외부스키마라고 부릅니다.
EX) 학원정보가 저장된 데이터베이스에서 관리자가 봐야할 화면(VIEW)과 일반 직원이 봐야할 화면(VIEW)등 여러개의 VIEW가 존재할 수 있는데 이 VIEW를 외부 스키마라고 부름. 쉽게 생각하면 하나의 데이터베이스에 여러개 의 권한을 가진 계정이 존재하는 것.
개념스키마는 데이터베이스의 전체 구조를 정의하는 스키마입니다. 예를들어 학원 데이터베이스가 존재하는 경우 학원데이터베이스에 존재해야할 개체들에 대해 정의하고, 그 개체들간의 관계를 정의한 스키마입니다.
EX) 학원 데이터베이스에는 학생, 교수, 커리큘럼, 시험, 점수 ... 등의 개체가 필요하며 이 1명의 교수는 N개의 커리큘럼을 가질수 있고, 1명의 학생은 N개의 점수를 가질수 있다.
내부 스키마는 데이터베이스의 물리적 저장구조를 표현한 스키마입니다. 데이터 베이스에 어떤 데이터가 관리되는지, 어떤 자료구조와 어떤 자료형으로 관리되는지를 표현합니다. 내부스키마의 정보를 통해 데이터가 어떤 방식으로 관리되는지 파악하여 저장된 데이터의 성능을 최적화 할 수 있습니다.
EX) 학원 데이터베이스의 학생 데이터는 id, name, age, grade정보를 가지고 있으며 id는 정수값에 기본키로 사용되며, name 문자열에 가변길이타입, age는 정수값, grade는 정수값으로 저장한다.
데이터 독립성이란 데이터베이스에서의 변화가 이를 사용하는 다른 어플리케이션에 영향을 주지 않는 특성으로 데이터베이스를 효율적으로 사용하기 위해 알아야 하는 중요한 개념입니다. 데이터 독립성은 크게 2가지 개념이 존재합니다.
물리적 독립성은 데이터가 물리적으로 저장되는 방식이 바뀌더라도 논리적 구조에 영향을 미치지 않는 것을 의미합니다.
만약 데이터베이스에서 회원의 이름을 저장하는 방식을 변경하더라도 이 이름을 사용하는 응용프로그램에서는 영향을 끼치지 않음을 의미합니다.
논리적 독립성은 데이터베이스의 논리적 구조가 변경되더라도 응용프로그램에 영향을 끼치지 않음을 의미합니다.
만약 회원 엔티티에 새로운 속성이 추가, 삭제 되어 엔티티의 논리적구조가 바뀌더라도 이 데이터를 사용하는 응용프로그램의 입장에서는 영향을 끼치지 않을 것입니다.