[강의메모] 스프링 DB 1편 - 데이터 접근 핵심 원리 - ch3. 트랜잭션 이해

인프런 김영한님 스프링 DB 1편 - 데이터 접근 핵심 원리

강의 중 2장을 보고 핵심 내용을 정리했습니다.

 

트랜잭션 - 개념 이해

데이터를 저장할 때 단순히 파일에 저장해도 되는데, 데이터베이스에 저장하는 이유는 무엇일까?
여러가지 이유가 있지만, 가장 대표적인 이유는 바로 데이터베이스는 트랜잭션이라는 개념을 지원하기 때문이다. 


트랜잭션을 이름 그대로 번역하면 거래라는 뜻이다. 

데이터베이스에서 트랜잭션은 하나의 거래를 안전하게 처리하도록 보장해주는 것을 뜻한다. 

 

일반적인 예시 계좌이체 (모든 것이 제대로 수행되어야 거래 완료)

5000원 계좌이체
1.   A의 잔고를 5000원 감소
2.   B의 잔고를 5000원 증가

 

데이터베이스가 제공하는 트랜잭션 기능을 사용하면 1,2 둘다 함께 성공해야 저장하고, 중간에 하나라도 실패하면 거래 
전의 상태로 돌아갈 수 있다. 만약 1번은 성공했는데 2번에서 시스템에 문제가 발생하면 계좌이체는 실패하고, 거래 전 
의 상태로 완전히 돌아갈 수 있다. 결과적으로 A의 잔고가 감소하지 않는다.

 

모든 작업이 성공해서 데이터베이스에 정상 반영하는 것을 커밋 (Commit)이라 하고,

작업 중 하나라도 실패해서 거래 이전으로 되돌리는 것을 롤백 (Rollback)이라 한다

 

 

트랜잭션 ACID - (관련 글 포스팅 후 링크 걸기) - 2024.04.22 (수정 예정))

트랜잭션은 ACID라는 원자성(Atomicity), 일관성(Consistency), 격리 성(Isolation), 지속성(Durability)을 보장해야 한다.

 

원자성: 트랜잭션 내에서 실행한 작업들은 마치 하나의 작업인 것처럼 모두 성공(Commit) 하거나 모두 실패(Rollback)해야 한다. 
일관성: 모든 트랜잭션은 일관성 있는 데이터베이스 상태를 유지해야 한다. 예를 들어 데이터베이스에서 정한 무 
결성 제약 조건을 항상 만족해야 한다.
격리성: 동시에 실행되는 트랜잭션들이 서로에게 영향을 미치지 않도록 격리한다. 예를 들어 동시에 같은 데이터 
를 수정하지 못하도록 해야 한다. 격리성은 동시성과 관련된 성능 이슈로 인해 트랜잭션 격리 수준(Isolation 
level)을 선택할 수 있다. (매우 중요!!)
지속성: 트랜잭션을 성공적으로 끝내면 그 결과가 항상 기록되어야 한다. 중간에 시스템에 문제가 발생해도 데이 
터베이스 로그 등을 사용해서 성공한 트랜잭션 내용을 복구해야 한다. 

 

트랜잭션 격리 수준 - isolation level

  • READ UNCOMMITED(커밋되지 않은 읽기) 
  • READ COMMITTED(커밋된 읽기) 
  • REPEATABLE READ(반복 가능한 읽기) 
  • SERIALIZABLE(직렬화 가능)

 

해당 블로그에선 일반적으로 사용하는 READ COMMITTED(커밋된 읽기) 트랜잭션 격리 수준을 기준으 
로 설명한다.

 

 

데이터베이스 연결 구조와 DB 세션

데이터베이스 서버 연결 구조와 DB 세션에 대해 정리한 부분

 

  • 사용자는 웹 애플리케이션 서버(WAS)나 DB 접근 툴 같은 클라이언트를 사용해서 데이터베이스 서버에 연결을 요청하고 커넥션을 맺게 된다. 이때 데이터베이스 서버는 내부에 세션이라는 것을 만든다. 그리고 앞으로 해당 커넥션을 통한 모든 요청은 이 세션을 통해서 실행하게 된다. 
  • 개발자가 클라이언트를 통해 SQL을 전달하면 현재 커넥션에 연결된 세션이 SQL을 실행한다. 
  • 세션은 트랜잭션을 시작하고, 커밋 또는 롤백을 통해 트랜잭션을 종료한다. 그리고 이후에 새로운 트랜잭션을 다 
    시 시작할 수 있다.
  • 사용자가 커넥션을 닫거나, 또는 DBA(DB 관리자)가 세션을 강제로 종료하면 세션은 종료된다.
  • 커넥션 풀이 10개의 커넥션을 생성하면, 세션도 10개가 만들어진다.

 

트랜잭션- (관련 글 포스팅 후 링크 걸기) - 2024.04.22 (수정 예정))

트랜잭션 사용법

  • 데이터 변경 쿼리를 실행하고 데이터베이스에 그 결과를 반영하려면 커밋 명령어인 commit 을 호출하고, 결과를 
    반영하고 싶지 않으면 롤백 명령어인 rollback 을 호출하면 된다. (수동 커밋 설정에서)
  • 커밋을 호출하기 전까지는 임시로 데이터를 저장하는 것이다. 
  • 따라서 해당 트랜잭션을 시작한 세션(사용자)에게만 변경 데이터가 보이고 다른 세션(사용자)에게는 변경 데이터가 보이지 않는다. 커밋 전까진 (임시) 상태라고 생각하자

 

커밋하지 않은 데이터(READ UNCOMMITTED )를 다른 곳에서 조회할 수 있으면 어떤 문제가 발생할까?

  • DIRTY READ 현상 발생
    • 트랜잭션이 작업이 완료되지 않았는데도 다른 트랜잭션에서 볼 수 있게 되는 현상

데이터 정합성에 큰 문제가 발생한다

 

트랜잭션 - 자동 커밋, 수동 커밋

자동 커밋

트랜잭션을 사용하려면 먼저 자동 커밋과 수동 커밋을 이해해야 한다.
자동 커밋으로 설정하면 각각의 쿼리 실행 직후에 자동으로 커밋을 호출한다. (default)

따라서 커밋이나 롤백을 직접 호출하지 않아도 되는 편리함이 있다. 

 

하지만 쿼리를 하나하나 실행할 때 마다 자동으로 커밋이 되어버리기 때문에 우리가 원하는 트랜잭션 기능을 제대로 사용할 수 없다. 

 

자동 커밋 설정

set autocommit true; //자동 커밋 모드 설정
insert into member(member_id, money) values ('data1',10000); //자동 커밋 
insert into member(member_id, money) values ('data2',10000); //자동 커밋

 

따라서 commit , rollback 을 직접 호출하면서 트랜잭션 기능을 제대로 수행하려면 자동 커밋을 끄고 수동 커밋을 사용해야 한다.

 

수동 커밋 설정

set autocommit false; //수동 커밋 모드 설정
insert into member(member_id, money) values ('data3',10000); 
insert into member(member_id, money) values ('data4',10000); 
commit; //수동 커밋

 

수동 커밋 모드로 설정하는 것을 트랜잭션을 시작한다고 표현할 수 있으며,

수동 커밋 설정을 하면 이후에 꼭 commit , rollback 을 호출해야 한다. (당연히 자동으로 안하게끔 했으니까)

 

트랜잭션 정리 

원자성

트랜잭션 내에서 실행한 작업들은 마치 하나의 작업인 것처럼 모두 성공 하거나 모두 실패해야 한다. 
트랜잭션의 원자성 덕분에 여러 SQL 명령어를 마치 하나의 작업인 것 처럼 처리할 수 있다.

성공하면 한번에 반영하 고, 중간에 실패해도 마치 하나의 작업을 되돌리는 것 처럼 간단히 되돌릴 수 있다.


오토 커밋 (default)

만약 오토 커밋 모드로 동작하는데, 중간에 실패하면 어떻게 될까? 쿼리를 하나 실행할 때 마다 바로바로 커밋 
이 되어버리기 때문에 실패한 결과가 commit되는 심각한 문제가 발생한다.


트랜잭션 시작 = 수동 커밋 설정 (set autocommit false;)

트랜잭션을 적용하기 위해선 수동 커밋 모드를 사용해서 수동으로 커밋, 롤백 할 수 있도록 해야 한다.

보통 이렇게 자동 커밋 모드에서 수동 커밋 모드로 전환 하는 것을 트랜잭션을 시작한다고 표현한다.

 

DB 락 - (관련 글 포스팅 후 링크 걸기) - 2024.04.22 (수정 예정))

세션1이 트랜잭션을 시작하고 데이터를 수정하는 동안 아직 커밋을 수행하지 않았는데,

세션2에서 동시에 같은 데이터를 수정하게 되면 여러가지 문제가 발생한다. 

바로 트랜잭션의 원자성이 깨지는 것이다. 여기에 더해서 세션1이 중간에 롤백을 하게 되면 세션2는 잘못된 데이터를 수정하는 문제가 발생한다.


이런 문제를 방지하려면, 세션이 트랜잭션을 시작하고 데이터를 수정하는 동안에는 커밋이나 롤백 전까지 다른 세션에 
서 해당 데이터를 수정할 수 없게 막아야 한다. (Lock(락)이 필요한 이유)

 

DB 락 - 변경

락 타임아웃

SET LOCK_TIMEOUT 60000; // 락 타임아웃 시간을 설정한다.
set autocommit false;
update member set money=1000 where member_id = 'memberA';


예) SET LOCK_TIMEOUT 10000  10초, 세션2에 설정하면 세션2가 10초 동안 대기해도 락을 얻지 못하면 락 
타임아웃 오류가 발생한다.

//락 타임아웃 예시
Timeout trying to lock table {0}; SQL statement:
update member set money=10000 - 2000 where member_id = 'memberA' [50200-200] 
HYT00/50200

 

DB 락 - 조회

일반적인 조회는 락을 사용하지 않는다

데이터베이스마다 다르지만, 보통 데이터를 조회할 때는 락을 획득하지 않고 바로 데이터를 조회할 수 있다.

조회가 아니라 락이 걸려있는 데이터를 변경하려면 락이 필요하기 때문에 락이 돌아올 때 까지 대기해야 한다.

 

조회와 락

데이터를 조회할 때도 락을 획득하고 싶을 때가 있다.

이럴 때는 select for update 구문을 사용하면 된다. 
이렇게 하면 조회 시점에 락을 가져가버리기 때문에 다른 세션에서 해당 데이터를 변경할 수 없다. 
물론 이 경우도 트랜잭션을 커밋하면 락을 반납한다.

set autocommit false;
select * from member where member_id='memberA' for update;
commit;

조회 시점에 락이 필요한 경우는 언제일까?

트랜잭션 종료 시점까지 해당 데이터를 다른 곳에서 변경하지 못하도록 강제로 막아야 할 때 사용한다.


트랜잭션 - 적용

(Tip) 테스트 데이터 제거 관련 - 트랜잭션을 활용

@AfterEach
void after() throws SQLException {
    memberRepository.delete(MEMBER_A);
    memberRepository.delete(MEMBER_B);
    memberRepository.delete(MEMBER_EX); 
}

 

테스트가 끝나면 다음 테스트에 영향을 주지 않기 위해 @AfterEach 에서 테스트에 사용한 데이터를 모두 삭제한다.

더 나은 방법은 트랜잭션을 활용하면 된다.

테스트 전에 트랜잭션을 시작하고, 테스트 이후에 트랜잭션을 롤백해버리면 데이터가 처음 상태로 돌아온다.

 

 

트랜잭션을 어떤 계층에 걸어야 할까? (문제의 시작)

 

트랜잭션은 비즈니스 로직이 있는 서비스 계층에서 시작해야 한다. 

비즈니스 로직이 잘못되면 해당 비즈니스 로직으로 인해 문제가 되는 부분을 함께 롤백해야 하기 때문이다.

 

그런데 트랜잭션을 시작하려면 커넥션이 필요하다. 

결국 서비스 계층에서 커넥션을 만들고, 트랜잭션 커밋 이후에 커넥션을 종료해야 한다.


애플리케이션에서 DB 트랜잭션을 사용하려면 트랜잭션을 사용하는 동안 같은 커넥션을 유지해야한다. 그래야 같은 세션을 사용할 수 있다.

 

커넥션과 세션 - 같은 커넥션을 유지하려면 어떻게 할까? (가장 간단한 방법 - 커넥션을 파라미터로 전달해서 같은 커넥션이 사용되도록 유지하기)

트랜잭션을 위해 같은 커넥션을 유지하기 위해서 Connection을 파라미터로 넘기는 가장 단순한 방식을 일단 사용한다.

public Member findById(Connection con, String memberId) throws SQLException {
	...
}

 

 

 

주의할 점은

  • 커넥션을 유지하기 위해서 파라미터로 넘어온 커넥션을 사용해야 한다. 따라서 con = getConnection() 코드가 있으면 안된다.
  • 커넥션 유지가 필요한 메서드는 리포지토리에서 커넥션을 닫으면 안된다. 커넥션을 전달 받은 리포지토리 뿐만 아니라 이후에도 커넥션을 계속 이어서 사용하기 때문이다. 이후 서비스 로직이 끝날 때 트랜잭션을 종료하고 닫아야 한다.

트랜잭션 이해 - 코드 

트랜잭션 시작 관련 코드

    public void accountTransfer(String fromId, String toId, int money) throws SQLException {
        Connection con = dataSource.getConnection();
        try {
            con.setAutoCommit(false); //트랜잭션 시작
        //비즈니스 로직
            bizLogic(con, fromId, toId, money);
            con.commit(); //성공시 커밋
        } catch (Exception e) {
            con.rollback(); //실패시 롤백
            throw new IllegalStateException(e);
        } finally {
            release(con);
        }
    }

 

 

(1) dataSource에서 커넥션 가져오기

  • Connection con = dataSource.getConnection();
  • 트랜잭션을 시작하려면 커넥션이 필요하다. 

(2) 트랜잭션을 시작하기 위해 수동 커밋 모드로 변경

  • con.setAutoCommit(false); //트랜잭션 시작
  • 이렇게 하면 커넥션을 통해 세션에 set autocommit false 가 전달되고,
  • 이후부터는 수동 커밋 모드로 동작한다.

(3) - 1정상 수행 시 트랜잭션 커밋

  • 비즈니스 로직이 정상 수행되면 트랜잭션을 커밋한다.
  • con.commit(); //성공시 커밋

(3) - 2 예외가 발생하면 트랜잭션을 롤백한다. 

  • con.rollback(); //실패시 롤백

 

비즈니스 로직

    private void bizLogic(Connection con, String fromId, String toId, int money) throws SQLException {
        ...
        memberRepository.update(con, fromId, fromMember.getMoney() - money);
        memberRepository.update(con, toId, toMember.getMoney() + money);
    }

 

  • 트랜잭션이 시작된 커넥션을 전달하면서 비즈니스 로직을 수행한다.
  • 이렇게 분리한 이유는 트랜잭션을 관리하는 로직과 실제 비즈니스 로직을 구분하기 위함이다.
  • memberRepository.update(con..) : 비즈니스 로직을 보면 리포지토리를 호출할 때 커넥션을 전달 
    하는 것을 확인할 수 있다.

트랜잭션 종료 후 관련 코드

	private void release(Connection con) {
        if (con != null) {
            try {
                con.setAutoCommit(true); //커넥션 풀 고려
                con.close();
            } catch (Exception e) {
                log.info("error", e);
            }
        }
    }

(4) 트랜잭션 종료 후 커넥션 반납 

  • finally {..} 를 사용해서 커넥션을 모두 사용하고 나면 안전하게 종료한다.
  • 그런데 커넥션 풀을 사용하면 con.close() 를 호출 했을 때 커넥션이 종료되는 것이 아니라 풀에 반납된다. 
  • 현재 수동 커밋 모드로 동작하기 때문에 풀에 돌려주기 전에 기본 값인 자동 커밋 모드로 변경하는 것이 안전하다.

 

남은 문제

애플리케이션에서 DB 트랜잭션을 적용하려면 서비스 계층이 매우 지저분해지고, 생각보다 매우 복잡한 코드를 요구한 
다. 

추가로 커넥션을 유지하도록 코드를 변경하는 것도 쉬운 일은 아니다. 

다음 장부턴 스프링을 사용해서 이런 문제 들을 하나씩 해결해보자.

 


참고자료 및 출처 

https://www.inflearn.com/course/%EC%8A%A4%ED%94%84%EB%A7%81-db-1/dashboard