Mysql 아키텍처

2023. 11. 26. 13:01스터디/real MySql 스터디

728x90

Mysql은 크게 Mysql 엔진과 스토리지 엔진으로 구분한다.

사람으로 따지자면, Mysql 엔진은 머리 역할,

스토리지 엔진은 손발 역할을 담당한다.

 

 

 

MYSQL 엔진

크게 커넥션 헨들러, 파서, 전처리기, 옵티마이저 등으로 구성되어 있다.

커넥션 헨틀러는 클라이언트로부터의 접속 및 쿼리 요청을 처리하고,

옵티마이저는 쿼리의 최적화된 실행을 진행한다.

 

스토리지 엔진

디스크 스토리지에 저장하거나, 데이터를 읽어오는 역할을 한다. 

MYSQL 엔진을 하나 두고, 스토리지 엔진을 여러 개 둘 수도 있다.

스토리지 엔진은 성능 향상을 위해 키 캐시나 버퍼 풀 같은 기능을 내장하고 있다.

 

 

Mysql 스래딩 구조

 Mysql 서버는 프로세스 기반이 아닌, 스레드 기반으로 동작한다.

크게 포그라운드 스레드와 백그라운드 스레드로 구분한다.

 

포그라운드 스레드 (클라이언트 스레드)

포그라운드 스레드는 각 클라이언트 사용자가 요청하는 쿼리 문장을 처리한다.

즉, 클라이언트가 Mysql 서버에 접속하면 스레드를 생성해서 그 클라이언트에게 할당한다.

작업을 마치고 커넥션을 종료하면 해당 커넥션을 담당하던 스레드는 다시 스레드 캐시로 돌아간다.

포그라운드 스레드는 버퍼나 캐시에서 데이터를 가지고 온다. 만약 없으면 백그라운드 스레드가 처리한다(InnoDB 기준)

 

백그라운드 스레드

InnoDB 기준으로 다음 작업을 백그라운드로 처리한다.

- insert buffer 병합

- 로그를 디스크로 기록

- 버퍼 풀의 데이터를 디스크에 기록

- 데이터를 버퍼로 읽어옴

- 잠금이나 데드락을 모니터링

 

MSQL 메모리 구조

Mysql에서 메모리는 크게 글로벌 메모리 영역과 로컬 메모리 영역으로 구분한다.

해당 영역은 MYSQL 서버 내에서 많은 스레드가 공유해서 사용하는 공간이지 여부에 따라 구분한다.

 

글로벌 메모리 영역

글로벌 메모리 영역은 Mysql 서버가 시작되면서 운영체제로부터 할당한다.

일반적으로 클라이언트 스레드 수와 무관하게 하나의 메모리 공간만 할당된다.

모든 스레드에 의해 공유되고, 다음과 같은 영역이 있다.

- 테이블 캐시

- 버퍼 풀

- 어댑티브 해시 인덱스

- redo log buffer

 

로컬 메모리 영역

mysl 서버 상에 존재하는 클라이언트 스레드가 쿼리를 처리하는 데 사용하는 메모리 영역이다.

클라이언트가 연결을 요청하면 스레드가 하나씩 할당되는데, 이 때 해당 스레드가 사용하는 메모리 영역이다.

즉, 한 클라이언트 스레드 당 하나의 영역을 할당한다.

세션 메모리 영역이라고도 한다.

 

로컬 메모리는 각 스레드별로 독립적으로 할당되며, 스레드 간 공유가 되지 않는다.

다음과 같은 영역이 있다.

- 정렬 버퍼

- 조인 버퍼

- 바이너리 로그 캐시

- 네트워크 버퍼

 

컴포넌트

MYSQL 8.0 부터 지원한다. 기존에 플러그인 아키텍처를 대체한다.

플러그인은 오직 mysql 서버와 인터페이스 할 수 있고, 플러그인 간 통신할 수 없었으며,

mysql 서버 변수와 함수를 직접 호출하기 때문에 캡슐화가 안됐으며

상호 의존 관계를 설정할 수 없어 초기화가 어려웠는데,

 

컴포넌트는 이 모든 것을 대체했다.

컴포넌트를 통해 msql을 유연하게 확장할 수 있다.

 

쿼리 실행 구조

쿼리 실행 과정은 위 그림과 같다.

쿼리 파서 

사용자 요청으로 들어온 쿼리를 토큰(mysql이 인식하는 최소 단위)로 분리해 트리 구조로 만든다.

기본 문법 오류는 여기서 거른다.

전처리기

파서 과정에서 만들어진 문장에 구조적인 문제점을 확인한다. 테이블-컬럼 이름, 내장함수, 접근 권한 등을 확인한다.

옵티마이저

사용자 요청으로 들어온 쿼리 문장을 저렴한 비용으로 가장 빠르게 처리하는 방안을 결정한다.

 

실행엔진

위에서 만들어진 실행 계획을 기반으로 각 헨들러에 요청해서 결과를 받아오는 역할을 수행한다.

 

핸들러 

실행 엔진에 요청에 따라 데이터를 디스크로 저장하고 디스크로 읽어오는 역할을 담당한다.

 

InnoDB 스토리지 엔진 아키텍처

innodb 엔진은 mysql 스토리지 엔진 가운데 가장 많이쓴다.

스토리지 엔진 중 거의 유일하게 레코드 기반 잠금을 제공하여 동시성 처리가 가능하고 안정적이기 때문이다.

innodb 엔진은 아래와 같은 특징이 있다.

 

PK에 의한 클러스터링

innoDB 엔진은 기본적으로 PK를 기준으로 클러스터링하여 저장한다.

 

즉, PK값의 순서대로 디스크에 저장한다.

따라서 PK를 이용한 range scan은 상당히 빨리 처리할 수 있다.

 

외래키 지원

물론 외래키는 DB 서버 운영의 불편함 때문에 생성하지 않는 경우가 자주 있다.

허나, 개발 환경에서는 좋은 가이드 역할을 할  수 있다.

다만, 외래키는 부모테이블과 자식 테이블에 인덱스 생성이 필요하고,

변경 시에 부모 테이블이나 자식 테이블에서 데이터 체크 작업이 필요하여 여러 테이블로 락이 전파되어 데드락이 발생할 수도 있다.

 

MVCC(Multi Vrsion Concurrency Control)

하나의 레코드에 대해 여러 버전이 동시에 관리한다.

잠금을 사용하지 않은 일관된 읽기를 제공한다.

즉, 잠금을 걸지 않고 읽기 작업을 수행한다. 다른 트랙젝션의 잠금을 기다리지도 않는다.

innoDB는 undo log를 이용하여 이 기능을 구현한다.

 

 

자동 데드락 감지

데드락 감지 스레드가 주기적으로 잠금 대기 그래프를 검사해 데드락에 걸린 트랙젝션을 강제종료한다.

 

 

 

버퍼 풀

버퍼풀은 디스크의 데이터 파일이나 인덱스 정보를 메모리에 캐시해두는 공간이다.

쓰기 작업을 지연하여 일괄 처리를 하게 해준다.

버퍼풀의 구조는 다음과 같다

 

LRU(Least Recently Used) 리스트

 

 

LRU 리스트는 MRU(Most Recently Used)랑 결합되어있는데, 최근 사용한 데이터와, 가장 많이 사용한 데이터 리스트와 연관되어 있다.

과정은 다음과 같다

Flush 리스트

디스크로 동기화되지 않은 데이터를 가진 데이터 페이지(더티 페이지)의 변경 시점 기준 페이지 목록을 관리한다.

한 번 데이터 변경이 가해진 데이터 페이지는 플러시 리스트에 관리된다.

그러고 나서 특정 시점이 되면 디스크로 기록한다.

데이터가 변경되면 innoDB는 변경 내용일 REDO 로그에 기록하고 버퍼 풀의 데이터 페이지에도 변경 내용을 반영한다. 

 

Free 리스트

버퍼 풀에서 비어있는 페이지 목록, 사용자가 새롭게 읽어와야 하는 경우 사용

 

 

 

 

 

728x90

'스터디 > real MySql 스터디' 카테고리의 다른 글

Index 인덱스  (1) 2023.11.26
DB Lock  (2) 2023.11.25
DB isolation level (격리수준)  (1) 2023.11.25