티스토리 뷰

데이터베이스

[Database] 정규화(Normalization) 쉽게 이해하기

망나니개발자 2021. 1. 20. 16:02
반응형

지난 포스팅에서 데이터베이스 정규화와 관련된 내용을 정리했었다. 하지만 해당 내용이 쉽게 이해되지 않는 것 같아서 정규화 관련 글을 풀어서 다시 한번 정리해보고자 한다.

 

1. 정규화(Normalization)


[ 정규화(Normalization)이란? ]

정규화(Normalization)의 기본 목표는 테이블 간에 중복된 데이타를 허용하지 않는다는 것이다. 중복된 데이터를 허용하지 않음으로써 무결성(Integrity)를 유지할 수 있으며, DB의 저장 용량 역시 줄일 수 있다.

이러한 테이블을 분해하는 정규화 단계가 정의되어 있는데, 여기서 테이블을 어떻게 분해되는지에 따라 정규화 단계가 달라지는데, 각각의 정규화 단계에 대해 자세히 알아보도록 하자. 

 

 

[ 제1 정규화 ]

제1 정규화란 테이블의 컬럼이 원자값(Atomic Value, 하나의 값)을 갖도록 테이블을 분해하는 것이다. 예를 들어 아래와 같은 고객 취미 테이블이 존재한다고 하자. 

위의 테이블에서 추신수와 박세리는 여러 개의 취미를 가지고 있기 때문에 제1 정규형을 만족하지 못하고 있다. 그렇기 때문에 이를 제1 정규화하여 분해할 수 있다. 제1 정규화를 진행한 테이블은 아래와 같다.

 

[ 제2 정규화 ]

제2 정규화란 제1 정규화를 진행한 테이블에 대해 완전 함수 종속을 만족하도록 테이블을 분해하는 것이다. 여기서 완전 함수 종속이라는 것은 기본키의 부분집합이 결정자가 되어선 안된다는 것을 의미한다.
예를 들어 아래와 같은 수강 강좌 테이블을 살펴보자. 

 

이 테이블에서 기본키는 (학생번호, 강좌이름)으로 복합키이다. 그리고 (학생번호, 강좌이름)인 기본키는 성적을 결정하고 있다. (학생번호, 강좌이름) --> (성적)
그런데 여기서 강의실이라는 컬럼은 기본키의 부분집합인 강좌이름에 의해 결정될 수 있다. (강좌이름) --> (강의실)
즉, 기본키(학생번호, 강좌이름)의 부분키인 강좌이름이 결정자이기 때문에 위의 테이블의 경우 다음과 같이 기존의 테이블에서 강의실을 분해하여 별도의 테이블로 관리하여 제2 정규형을 만족시킬 수 있다.

 

 

[ 제3 정규화 ]

제3 정규화란 제2 정규화를 진행한 테이블에 대해 이행적 종속을 없애도록 테이블을 분해하는 것이다. 여기서 이행적 종속이라는 것은 A -> B, B -> C가 성립할 때 A -> C가 성립되는 것을 의미한다.
예를 들어 아래와 같은 계절 학기 테이블을 살펴보자. 

 

 

기존의 테이블에서 학생 번호는 강좌 이름을 결정하고 있고, 강좌 이름은 수강료를 결정하고 있다. 그렇기 때문에 이를 (학생 번호, 강좌 이름) 테이블과 (강좌 이름, 수강료) 테이블로 분해해야 한다. 

이행적 종속을 제거하는 이유는 비교적 간단하다. 예를 들어 501번 학생이 수강하는 강좌가 스포츠경영학으로 변경되었다고 하자. 이행적 종속이 존재한다면 501번의 학생은 스포츠경영학이라는 수업을 20000원이라는 수강료로 듣게 된다. 물론 강좌 이름에 맞게 수강료를 다시 변경할 수 있지만, 이러한 번거로움을 해결하기 위해 제3 정규화를 하는 것이다.
즉, 학생 번호를 통해 강좌 이름을 참조하고, 강좌 이름으로 수강료를 참조하도록 테이블을 분해해야 하며 그 결과는 다음의 그림과 같다.

 

 

[ BCNF 정규화 ]

BCNF 정규화란 제3 정규화를 진행한 테이블에 대해 모든 결정자가 후보키가 되도록 테이블을 분해하는 것이다. 예를 들어 다음과 같은 특강수강 테이블이 존재한다고 하자.

 

 

특강수강 테이블에서 기본키는 (학생번호, 특강이름)이다. 그리고 기본키 (학생번호, 특강이름)는 교수를 결정하고 있다. 또한 여기서 교수는 특강이름을 결정하고 있다.
그런데 문제는 교수가 특강이름을 결정하는 결정자이지만, 후보키가 아니라는 점이다. 그렇기 때문에 BCNF 정규화를 만족시키기 위해서 위의 테이블을 분해해야 하는데, 다음과 같이 특강신청 테이블과 특강교수 테이블로 분해할 수 있다.

 

반응형
댓글
댓글쓰기 폼
  • 이전 댓글 더보기
  • 코린이 안녕하세요 궁금한점이 있어 댓글 남깁니다. BCNF 정규화에서 모든 결정자가 후보키가 되어야 한다고 이해했습니다. 근데 분해된 테이블에서 교수가 특강이름을 결정짓는 결정자인 것 같은데 교수는 후보키가 아니지 않나요? 특강신청 테이블을 (학생번호, 교수), 특강교수 테이블을 (특강이름, 교수)로 분해해야 할 것 같은데 제가 잘못 이해한건지 궁금합니다! 2021.04.25 13:10
  • 망나니개발자 교수가 왜 후보키가 아닌가요!?? 교수가 특강 이름을 식별할 수 있으니 후보키이자 결정자가 맞는 것 같습니다! 2021.04.25 13:23 신고
  • 코린이 답변감사합니다! 제가 댓글을 잘못 단것 같아요 죄송합니다 ㅠ 교수는 특강이름을 결정짓는 결정자이면서 후보키가 맞는데 테이블이 분해된 그림이 이해가 안가서 댓글 달았습니다!
    그림에는 특강신청 테이블은 (학생번호, 특강이름), 특강교수 테이블은 (특강이름, 교수)로 되어 있어서요! 후보키를 교수가 아니라 특강이름으로 해서 테이블을 나누어진것 같아서요 ㅠ
    2021.04.25 15:26
  • 코린이 지난 포스팅의 BCNF 정규화 그림을 보면 특강신청 테이블은 (학생번호, 교수), 특강교수 테이블은 (특강이름, 교수) 로 분해되어 있더라구요
    내용은 똑같은데... 그림은 달라서 어느쪽이 맞는지 혼동이와서 여쭤보려고 댓글 남겼습니다!
    2021.04.25 15:32
  • 망나니개발자 앗 어느 부분에서 혼동이 오셨는지 이해했습니다! 제가 지금 포스팅의 그림을 잘못 추가하였군요ㅜㅜ 죄송합니다...!!
    특강 신청 테이블이 (학생번호, 교수 이름) 으로 분해되는 것이 맞습니다!
    혼동을 드려서 죄송하고 꼼꼼하게 봐주셔서 감사합니다:)
    이미지는 바로 수정하였습니다!
    2021.04.25 15:51 신고
  • 코린이 처음에 이해한게 맞군요!
    공부할 때 많이 참고하고 있습니다 좋은 글 올려주셔서 감사합니다 ㅎㅎ
    2021.04.25 15:55
  • 망나니개발자 아이고 헷갈리셨을텐데 좋은 말씀 해주셔서 감사합니다:) 또 문제있는 부분이나 궁금한 부분 있으면 말씀해주세요ㅎㅎ 2021.04.25 15:56 신고
  • ㅁㄴㅇ 제3정규화에서 예를들어 학생번호 501이라는 학생이 계절특강을 2과목 이상 수강한다고 했을 경우에는 학생번호가 특강이름을 결정 못하는게 아닌가요? 2021.06.17 13:52
  • 공부 그러게요 저도 동의
    한 학생은 계절학기 에 한 과목밖에 못듣는다는 제약조건을 명시해야 가능할듯
    2021.07.14 10:35
  • 망나니개발자 제가 댓글 내용을 이제 확인했네요! 그 위에 적힌 내용들은 그 해당 표의 내용만을 기준으로 작성하였습니다! 2021.07.14 11:50 신고
  • KY 성적이 학생번호로 결정될수있다고 되있는데
    성적은 학생번호,강좌이름 조합해야되는데 저거잘못쓰신건가용?
    2021.07.13 14:51
  • 망나니개발자 앗 내용 잘못적은 것 맞습니다! 관련 내용수정했어용ㅎㅎ 감사합니다:) 2021.07.13 17:38 신고
  • 망나니개발자 팬 [정규화 2]
    저는 오히려 성적이 학생번호로만 결정이 되는 것으로 이해가 됩니다.

    501, 데이터버이스 -> 3.5
    501, 자료구조 -> 3.5

    따라서 결정자가 기본키의 부분집합이므로 테이블을 나눠줘야 할 것 같은데...

    혹시 제가 잘못생각한 부분이 있다면 말씀주시면 감사드리겠습니다! ㅎㅎ
    2021.09.24 16:51
  • 망나니개발자 내용을 보면 성적은 (학생 번호, 강좌 이름)으로 결정이 됩니다! 그런데 강의실 같은 경우에는 강좌 이름에 의해 결정이 가능합니다. 그런데 강좌 이름의 경우에는 (학생번호, 강좌 이름) 기본키의 부분집합이므로, 강의실 테이블을 분해하는게 맞을 것 같습니다:)
    혹시 이해안가는 부분 있으면 답글 남겨주세용ㅎㅎ
    2021.09.26 18:08 신고
  • 도랏맨 와웅 지금껏 이해 안된것들이 여기서 한번에 되네요!! 감사합니다 ㅎ 가르치는데에 소질있으시네용 2021.09.25 17:02
  • 망나니개발자 잘 이해가 되셨다니 뿌듯하네요ㅎㅎ 좋은 얘기까지 해주셔서 감사합니당:) 2021.09.26 18:02 신고
  • vividswan 인터넷에 모든 자료들을 찾아본거 같은데 정말 깔끔하시고 와닿게 설명하신거같아요. 감사합니다! 2021.10.11 18:18 신고
  • 망나니개발자 에고 항상 이런 좋은 얘기들 해주셔서 힘이 되네요ㅎㅎ 감사합니다:) 2021.10.11 20:18 신고
  • 삼성가고싶어요 우왕 시험공부하는데 큰 도움이 됐어요 감사합니다 :) 2021.10.22 10:07
  • 망나니개발자 도움이 되었다니 뿌듯하네요ㅎㅎ 시험 잘 보시고 삼성 꼭 입사하시길 바라겠습니닷:) 2021.10.22 11:44 신고
  • xxx 제2 정규화에서
    이 테이블에서 기본키는 (학생번호, 강좌이름)으로 복합키이다. 그리고 (학생번호, 강좌이름)인 기본키는 강의실을 결정하고 있다. (학생번호, 강좌이름) --> (강의실) 라 되어있는데
    (학생번호, 강좌이름) --> (강의실)이 아니라 (학생번호, 강좌이름) --> (성적) 아닌가요?

    2021.11.04 11:45
  • 망나니개발자 헉 제가 최근에 정신없이 내용을 수정했는데 실수로 이 부분을 잘못 수정한 것 같네요;;
    기본키는 (학생번호, 강좌이름)으로 복합키이고, (학생번호, 강좌이름)이 성적을 결정하는 것이 맞습니다! 그리고 강좌 이름(기본키의 부분집합)에 의해 강의실이 결정되므로 테이블 정규화가 필요한 상황이고요!
    위의 내용대로 본문 내용수정했습니다:) 꼼꼼히 읽고 확인해주셔서 감사합니다!
    2021.11.04 12:49 신고
  • xxx 좋은 자료ㅠㅠ제가 더 너무 감사해요 :) 2021.11.04 16:41
  • 망나니개발자 아닙니닷ㅎㅎ 앞으로도 좋은 글 많이 포스팅할테니 자주 방문해주세요:) 감사합니다! 2021.11.04 19:59 신고
  • 띵지니어 감사합니다 잘보고 가요 ㅎㅎ 2021.11.18 23:23 신고
  • 망나니개발자 안녕하세요, 도움이 되었다니 뿌듯하네요! 방문해주셔서 감사합니다! 2021.11.19 10:04 신고
  • 미니개발자 너무 설명이 잘되어있어서 혹시 퍼가도 될까요~?
    출처는 남기겠습니다
    2021.11.19 16:07
  • 망나니개발자 안녕하세요~ 넵 괜찮습니다ㅎㅎ 출처만 꼭 남겨주세요! 감사합니다:) 2021.11.19 16:56 신고
  • 진짜 이해 잘됐습니다 감사합니다 매일 저녁 고기드세요 2021.11.23 20:49
  • 망나니개발자 찬님 덕분에 일하다가 웃었네요ㅋㅋㅋㅋㅋㅋㅋㅋ 기분좋은 칭찬 감사합니다:) 앞으로도 자주 방문해주세요! 2021.11.23 22:44 신고
  • vanilaLatteJS 3NF 예시가 약간 이해가 안되는데.. 학번 하나만으로 수강료를 결정(A->C)할수 없고 오히려 강좌이름만으로 수강료가 결정(B->C) 되기 때문에 2NF 에 가깝지 않은건지 질문을 드립니다 2021.12.21 11:09 신고
  • 망나니개발자 안녕하세요, 바닐라라떼님! 말씀해주신대로 해당 내용을 2NF의 단계로 바라볼 수도 있습니다! 최대한 간단한 예시를 통해 설명을 하고자하는 만큼 예시가 딱 드러맞지는 못하는 것 같네요ㅜㅜ
    해당 과정이 2NF인지 3NF인지 보다는 3NF는 이러한 과정 또는 흐름으로 판단됨을 이해해주시면 될 것 같습니다:)
    2021.12.21 11:40 신고
  • logTrigger 좋은 자료 감사합니다! 2022.02.11 21:21 신고
  • 망나니개발자 방문해주셔서 감사합니다ㅎㅎ 다른 글들도 많이 봐주세요! 2022.02.11 23:45 신고
  • ㄱㅈㅎ 와... 설명 엄청깔끔해요 산기 공부하다가 답없어서 검색하고 들어왔는데 단번에 이해되네요 감사합니다! 2022.03.07 17:48
  • 망나니개발자 도움이 된 것 같아서 뿌듯하네요ㅎㅎ 감사합니다! 2022.03.07 21:36 신고
  • Gon 와~ 설명이 너무 잘 되어있네여!!!
    이해 하기 쉽게 설명 되어 있어서 너무 좋은거 같아요~!~!~!
    혹시 퍼가두 될까요??
    출처 남기겠습니다~!~!~!
    2022.03.09 17:13
  • 망나니개발자 안녕하세요~ 이해가 되었다니 뿌듯하네요ㅎㅎ 넵 대신 출처만 꼭 남겨주세요! 2022.03.09 18:11 신고
  • 익명 비밀댓글입니다 2022.03.19 01:25
  • 망나니개발자 넵 괜찮습니다!ㅎㅎ 편하게 올려주세용:) 2022.03.19 11:36 신고
  • 개굳 설명 잘 되어있어서 이해가 잘됩니다. 출처를 남길테니 퍼가도되죠? 2022.04.10 14:26
  • 망나니개발자 안녕하세요! 당연히 괜찮고 출처만 꼭 남겨주세요:) 감사합니다! 2022.04.10 21:36 신고
  • mangnani 항상 기술면접 이메일이와서 꼬박꼬박 봐서 구글링하면 답도 여기게 있당!! 역시 대단해!! ㅠ 이메일로 물어봐도 친절하게 답변두 해주시고 항상감합니다!!!!!!!!!!!!!!!!!!!!!!!사랑해요~`~~ 2022.04.11 16:41
  • 망나니개발자 헉 이메일로 문제도 신청해서 받고 계시군요! 크 꾸준히 찾아주셔서 감사합니다:) 앞으로도 자주 방문해주세요!! 2022.04.11 18:27 신고
  • 기염이 과제를 하면서 복잡해서 안되고 있었는데 이 글은 깔끔하게 잘 요약되있어서 바로 이해가 됐어요^^ 잘 봤어용:) 2022.05.11 08:47
  • 망나니개발자 오.... 이해가 잘 되셧다니 뿌듯하네요ㅎㅎ 감사합니다:) 2022.05.11 21:22 신고
  • san 좋은글 감사합니다 2022.06.09 14:11
  • 망나니개발자 앞으로도 자주 방문해주세요! 감사합니다:) 2022.06.10 10:54 신고
  • limkyu 정규화 정보 감사합니다! 2022.08.18 15:40 신고
  • 망나니개발자 부족한 글인데 감사합니다ㅎㅎ 앞으로도 자주 방문해주세요! 2022.08.19 01:09 신고
반응형
공지사항
Total
3,025,948
Today
0
Yesterday
2,930
TAG
more
«   2022/10   »
            1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31          
글 보관함