Hope Everyone Is Happy

3. 트랜잭션과 무결성 본문

※ CS 스터디/데이터베이스

3. 트랜잭션과 무결성

J 크 2023. 8. 23. 20:34
728x90
반응형

본 게시글은  : 면접을 위한 CS 전공지식 노트 (출판사 : 길벗, 주홍철 지음) 을 참조하여 작성하였습니다. + 구글링


◆  트랜잭션 (Transaction)

- 트랜젝션은 데이터베이스에서 하나의 논리적 기능을 수행하기 위한 작업의 단위

여러 개의 쿼리들을 하나로 묶는 단위

- 원자성, 일관성, 독립성, 지속성의 특징을 가지며 이를 ACID 특징으로 정의

- 원자성(atomicity) : 트랜젝션과 관련된 일이 모두 수행되었거나 되지 않았거나를 보장하는 특징

    ex) 트랜잭션을 커밋했는데, 문제가 발생하여 롤백하는 경우 그 이후에 모두 수행되지 않음을 보장

       1. Choi잔고를 조회 - 1000만원 확인

       2. Choi에게서 500만원 뺀다

       3. 심박에게 500만원을 넣는다

     · 데이터 베이스 사용자는 위의 과정을 볼 수 없으며 이후 결과가 심박 500만원, Choi 500만원 확인 가능

     · 여기서 작업을 취소했을 때, 과정 전체가 취소된 Choi 1000만원, 심박 0원으로 확인

     · 즉,  일부 과정만 취소되지 않기에 "All or Nothing"

    : 커밋과 롤백

       · 커밋(commit)은 여러 쿼리가 성공적으로 처리 되었다고 확정하는 명령어

       · 트랜잭션 단위로 수행되며 변경된 내용이 모두 영구적으로 저장되는 것

       · 커밋이 수행 되었다 == 하나의 트랜젝션이 성공적으로 수행되었다 로 표현 가능

       · 위의 그림 처럼 update, insert, delete의 쿼리가 하나의 트랜젝션 단위로 수행, 이후에 데이터베이스에 영구 저장

       · 트랜젝션 전의 상태로 돌리는 작업을 롤백으로 정의

       · 트랜젝션 전의 상태로 돌리는 작업을 롤백으로 정의

  : 트랜젝션 전파

       · 트랜젝션을 수행할 때 커넥션 단위로 수행하기 때문에 커넥션 객체를 넘겨서 수행해야 할 상황 발생

       · 커넥션 객체를 넘겨서 수행하지 않고 여러 트랜젝션 관련 메서드의 호출을 하나의 트랜젝션에 묶이도록 하는 것

- 일관성 (consistency) : 허용된 방식으로만 데이터를 변경해야 하는 것

    : 데이터베이스에 기록된 모든 데이터는 여러 가지 조건, 규칙에 따라 유효함을 가져야함


- 격리성(isolation) : 트랜잭션 수행 시 서로 끼어들지 못하는 것

   : 복수의 병렬 트랜잭션은 서로 격리되어 마치 순차적으로 실행되는 것 처럼 작동해야 함

   : 데이터베이스는 여러 사용자가 같은 데이터에 접근할 수 있어야 함

   : 격리 수준은 SERIALIZABLE, REPEATABLE, READ_COMMITTED, READ_UNCOMMITTED로 구분

   : 아래 그림과 같이 위로 갈수록 동시성이 강해지지만 격리성은 약해지며, 각 단계마다 나타나는 현상 존재

- 격리 수준에 따라 발생하는 현상으로 팬텀 리드, 반복 가능하지 않은 조회, 더티 리드 존재

- 팬텀 리드 (phantom read) : 한 트랜잭션 내에서 동일한 쿼리를 보냈을 때 해당 조회 결과가 다른 경우

    ex) User A가 회원 테이블에서 age가 12 이상인 회원들을 조회하는 쿼리를 전송하면,

           3개의 테이블이 조회한다고 가정 했을 때, User B가 age가 15인 회원 레코드를 삽입 하면 4개의 테이블이 조회

- 반복 가능하지 않은 조회 (non -repeatable read) : 한 트랜잭션 내의 같은 행에 2회 이상 조회 후 그 값이 다른 경우

    ex) 사용자 A가 큰 돌 100개 라는 값을 가진 데이터를 저장, 후에 사용자 B가 그 값을 1로 변경해서 커밋하면 

          사용자 A는 100이 아닌 1을 조회

    : 팬텀리드와 다르게 행 값이 달라질 가능성이 있으며  팬텀 리드는 다른 행이 선택 될 가능성 존재

- 더티 리드 (dirty read) : 한 트랜잭션이 실행 중일 때, 다른 트랜잭션에 의해 수정되어도 아직 커밋되지 않은 행의 데이터                                          를 읽을 수 있을 때 발생 

     ex) 사용자 A가 큰돌의 갯수 100을 1로 변경한 내용이 커밋되지 않았더라도, 사용자 B가 조회한 결과가 1로 나올 경우


◆  격리 수준

- SERIALIZABLE : 트랜젝션을 순차적으로 진행시키는 것

    : 여러 트랜잭션이 동시에 같은 행에 접근 금지

    : 매우 엄격한 수준에 해당 되며, 해당 행에 대해 격리 시키고, 이후 트랜잭션이 일어나도 대기 후 진행

    : 이로인해 교착 상태가 일어날 확률이 높으며 가장 성능이 떨어지는 격리 수준

- REPEATABLE_READ

    : 하나의 트랜잭션이 수정한 행을 다른 트랜잭션이 수정할 수 없도록 막아주지만 새로운 행 추가는 허용

- READ_COMMITTED

    : 다른 트랜잭션이  커밋하지 않은 정보는 읽을 수 없으며 커밋 완료된 데이터에 대해서만 조회 가능

    : 가장 많이 활용되는 격리 수준

    : 어떤 트랜잭션이 접근한 행을 다른 트랜잭션이 수정 가능

    : 사용자 A가 수정한 행을 사용자 B가 수정하여 사용자 A가 같은 행을 다시 읽을 때 다른 내용 발견 가능

    : MySQL 8.0, 오라클 등에서 기본값으로 설정

- READ_UNCOMMITTED

    : 하나의 트랜잭션이 커밋되기 전에 다른 트랜잭션에 노출되는 문제가 있지만 가장 빠르다

    : 데이터 무결성을 위해 사용하지 않는 것이 이상적

    : 대용량 데이터를 대략적으로 조회할 경우 집계하는데 사용


- 트랜잭션의 지속성 (durability) : 성공적으로 수행된 트랜잭션은 영원히 반영

    : 데이터베이스에 시스템 장애가 발생해도 원래 상태로 복구하는 회복 기능 존재 필수

    : 데이터베이스는 이를 위해 체크섬, 저널링, 롤백 등의 기능을 제공

    *체크섬 : 중복 검사의 한 형태로, 오류 정정을 통해 송신된 자료의 무결성을 보호하는 단순 방법

    *저널링 : 파일 시스템 또는 데이터베이스 시스템에 변경 사항을 반영(commit)하기 전에 로깅하는 것

◆  무결성 

- 무결성이란 데이터의 정확성, 일관성, 유효성을 유지하는 것

- 무결성이 유지되어야 데이터베이스에 저장된 데이터 값과 그 값에 해당하는 현실 세계의 값이 일치하는 신뢰가 발생

- 무결성의 종류는 개체 무결성, 참조 무결성, 고유 무결성, NULL 무결성 존채

- 개체 무결성 : 기본키로 선택된 필드는 빈 값 허용 X

- 참조 무결성 : 서로 참조 관계에 있는 두 테이블의 데이터는 항상 일관된 값을 유지

- 고유 무결성 : 특정 속성에 대해 고유한 값을 가지도록 조건이 주어진 경우, 그 속성 값은 모두 고유한 값을 가짐

- NULL 무결성 : 특정 속성 값에 NULL이 올 수 없다는 조건이 주어진 경우, 그 속성 값은 NULL 금지


SVN 활용했던 걸 생각하면서 정리하니 이해하는데 조금 도움이 되었네요~ 

 

위의 글과 관련하여 추가적인 내용이나 피드백은 언제나 환영입니다 :)

 

'※ CS 스터디 > 데이터베이스' 카테고리의 다른 글

7. 조인의 원리  (0) 2023.08.29
6. 조인(Join)의 종류  (0) 2023.08.29
4. 데이터베이스의 종류  (0) 2023.08.29
2. ERD와 정규화 과정  (0) 2023.08.23
1. 데이터 베이스의 기본  (0) 2023.08.23