Page History
원문 : https://jonasboner.com/resources/Reactive_Microsystems.pdf
...
요약버전 By GPT
Table of Contents |
---|
마이크로서비스의 필수 특성
모든 것을 격리하라 (Isolate All the Things)
...
이 내용은 "마이크로서비스의 필수 특성" 챕터의 요약 번역입니다. 추가적으로 더 깊이 있는 번역이나 설명이 필요하면 알려주세요!
나의 말:
이벤트 중심의 도메인 설계
ChatGPT의 말:
ChatGPT
다음은 이벤트 중심의 도메인 설계(Events-First Domain-Driven Design)에 대한 번역입니다:
...
이벤트 중심의 도메인 설계
이벤트 중심의 도메인 설계는 도메인의 구조(명사)에 집중하는 기존 접근법에서 벗어나, 도메인에서 발생하는 이벤트(동사)에 초점을 맞추는 설계 원칙입니다. 이 접근법은 시스템의 데이터 흐름 및 통신 관점에서 도메인의 본질을 이해하고, 확장 가능한 이벤트 기반 설계를 구현할 수 있도록 돕습니다.
...
상태 변경은 필수적일 수 있지만, 외부에서 관찰할 수 없는 서비스 내부에서만 수행되어야 합니다. 외부에 알릴 때는 변경 내용을 불변성 데이터인 이벤트로 변환하여 게시합니다.
반응형 마이크로시스템으로의 전환
반응형 시스템은 현대의 분산 시스템 설계에서 중요한 원칙입니다. 이 원칙은 시스템이 실패(Resilience)와 부하(Elasticity) 상황에서도 응답성을 유지할 수 있도록 돕습니다. 이 장에서는 반응형 프로그래밍과 반응형 시스템의 개념을 활용하여 마이크로서비스를 더 효율적이고 안정적으로 만드는 방법을 살펴봅니다.
...
반응형 프로그래밍을 받아들여라 (Embrace Reactive Programming)
반응형 프로그래밍은 비동기적 실행과 백프레셔(backpressure)를 활용하여 개별 서비스가 높은 성능과 안정성을 유지하도록 돕는 기법입니다.
1. 비동기 실행 (Asynchronous Execution)
비동기적이고 논블로킹(non-blocking) I/O는 다음과 같은 이점을 제공합니다:
- 스레드 자원 최적화: 스레드를 점유하지 않고 유휴 상태를 줄입니다.
- 확장성 향상: 공유 자원에 대한 경쟁(contention)을 최소화하여 확장성과 처리량을 높입니다.
예제:
10개의 외부 서비스에 요청을 보내야 한다고 가정합니다. 각 요청이 100ms를 소요한다고 하면:
- 동기식 방식: 10 × 100ms = 1초
- 비동기식 방식: 병렬 처리로 전체 소요 시간 = 100ms
2. 동기 HTTP 사용 재고 (Reconsider the Use of Synchronous HTTP)
REST 기반의 동기 HTTP는 서비스 간 강한 결합을 초래할 수 있습니다. 기본 통신 프로토콜로는 비동기 메시징을 사용하는 것이 좋습니다.
3. 백프레셔 적용 (Always Apply Backpressure)
백프레셔는 빠른 프로듀서가 느린 컨슈머를 압도하지 않도록 흐름 제어를 제공합니다. 이를 통해 데이터 파이프라인의 안정성과 신뢰성을 향상시킬 수 있습니다.
4. 서킷 브레이커(Circuit Breaker) 활용
서킷 브레이커는 시스템이 실패하거나 과부하 상태에 빠질 경우 이를 우아하게 관리합니다. 서킷 브레이커는 다음과 같은 상태를 가집니다:
- Closed: 모든 요청을 허용합니다.
- Open: 실패 횟수가 임계값을 초과하면 요청을 차단하고 빠르게 실패를 반환합니다.
- Half-Open: 일정 시간 후 테스트 요청을 통해 시스템 복구 여부를 확인합니다.
...
반응형 시스템을 받아들여라 (Embrace Reactive Systems)
반응형 시스템은 비동기 메시지 전달을 기반으로 다음과 같은 특성을 제공합니다:
- 응답성 (Responsiveness): 사용자 요청에 빠르게 응답.
- 탄력성 (Resilience): 오류 상황에서도 시스템이 복구 가능.
- 확장성 (Elasticity): 부하에 따라 동적으로 확장 또는 축소.
- 메시지 중심성 (Message-Driven): 서비스 간 통신을 비동기 메시지로 처리.
1. 시간 및 공간에서의 결합 해제 (Decoupling in Time and Space)
비동기 메시지 전달은 서비스 간의 통신을 시간(동시성)과 공간(분산성)에서 해제하여, 시스템의 유연성을 높입니다.
2. 위치 투명성(Location Transparency)을 통한 확장성
위치 투명성은 다음을 의미합니다:
- 서비스는 물리적 위치에 상관없이 동일한 주소를 통해 참조됩니다.
- 이는 서비스 이동성(mobility)을 가능하게 하여 동적 확장과 부하 분산을 지원합니다.
3. 동적 구성 가능성 (Dynamic Composition)
위치 투명성을 통해 서비스는 런타임 중에 동적으로 구성할 수 있습니다. 이를 위해 **서비스 디스커버리(Service Discovery)**를 활용하며, 이는 클라이언트-사이드 또는 서버-사이드 방식으로 구현할 수 있습니다.
...
자가 복구(Self-Healing)를 위한 설계
**벌크헤드(Bulkheading)**와 감독(Supervision) 원칙을 통해 시스템의 자가 복구를 강화할 수 있습니다:
- 벌크헤드는 서비스 간 격리를 제공하여 장애 전파를 방지합니다.
- 감독은 장애 발생 시 자동으로 복구를 시도하며, 장애가 치명적이지 않도록 관리합니다.
예제:
타이타닉 사고는 벌크헤드 설계의 실패 사례로, 격리 실패가 시스템 전체의 붕괴로 이어질 수 있음을 보여줍니다. 이는 소프트웨어 설계에서도 동일하게 적용됩니다.
메시징 (Messaging)
비동기 메시지 전달은 반응형 시스템에서 핵심적인 통신 방식으로, 다음과 같은 이점을 제공합니다:
- 시간적 결합 해제: 요청-응답 사이에 동시성을 허용하여 서비스 간 독립성을 높임.
- 공간적 결합 해제: 서비스의 물리적 위치와 상관없이 통신 가능.
- 탄력성 제공: 메시지 큐, 브로커(예: Apache Kafka, RabbitMQ)를 사용해 메시지가 안전하게 전달되도록 함.
활용 예시:
- Pub/Sub 모델: 이벤트 기반 아키텍처에서 메시지를 게시하고, 이를 구독한 서비스가 처리.
...
서킷 브레이커 (Circuit Breaker)
서킷 브레이커는 시스템의 안정성을 유지하기 위한 보호 장치입니다. 외부 서비스 실패나 과부하로 인해 시스템 전체가 중단되지 않도록 방지합니다.
작동 원리:
- Closed 상태: 모든 요청이 정상적으로 전달.
- Open 상태: 일정 수 이상의 실패 발생 시 요청을 차단하고 빠르게 실패 반환.
- Half-Open 상태: 일정 시간이 지나 서비스 복구를 테스트. 성공 시 Closed로 복귀.
이점:
- 장애 발생 시 빠르게 실패를 반환하여 서비스가 비정상적인 상태로 멈추는 것을 방지.
- 서비스 복구 여부를 테스트하여 시스템의 자가 복구 가능성 제공.
구현 도구:
- Hystrix(Netflix): Java 기반 서킷 브레이커 라이브러리.
- Resilience4j: 가벼운 서킷 브레이커 라이브러리.
- Akka, Lagom: 내장 서킷 브레이커 기능.
...
서비스 디스커버리 (Service Discovery)
서비스 디스커버리는 서비스가 동적으로 위치를 찾고, 통신할 수 있도록 돕는 메커니즘입니다.
주요 개념:
서비스 등록(Service Registration):
- 서비스는 실행 시 자신의 위치 및 정보를 중앙 레지스트리에 등록.
- 레지스트리는 클라이언트가 서비스를 찾을 수 있도록 데이터 제공.
클라이언트-사이드 디스커버리(Client-Side Discovery):
- 클라이언트가 직접 레지스트리에 요청해 서비스 위치를 조회.
- 예: Netflix Eureka.
서버-사이드 디스커버리(Server-Side Discovery):
- 로드 밸런서나 메시징 플랫폼이 서비스를 자동으로 탐지 및 라우팅.
- 예: AWS Elastic Load Balancer, Akka Actors.
이점:
- 동적 확장 및 축소 가능.
- 서비스 이동성과 주소 안정성을 보장.
...
통합적인 이점
이러한 구성 요소들은 결합되어 반응형 시스템의 주요 특성(응답성, 탄력성, 확장성)을 강화합니다:
- 메시징은 서비스 간 통신을 비동기적으로 처리하여 성능과 확장성을 높임.
- 서킷 브레이커는 장애로부터 시스템을 보호하고, 복구 가능성을 제공.
- 서비스 디스커버리는 동적 환경에서도 안정적인 서비스 연결을 보장.
확장 가능한 영구성의 개념
확장 가능한 영구성은 데이터 저장 및 관리를 대규모 분산 환경에서 효율적이고 신뢰성 있게 수행하는 것을 목표로 합니다. 이는 전통적인 CRUD 접근 방식을 넘어 이벤트 기반의 설계를 도입하여 데이터 일관성과 가용성을 균형 있게 유지하는 것을 중점으로 합니다.
...
주요 개념
1. CRUD를 넘어 (Moving Beyond CRUD)
전통적인 Create, Read, Update, Delete(CRUD) 접근 방식은 단일 데이터베이스에 의존하며, 다음과 같은 한계를 가집니다:
- 확장성의 제한: 트랜잭션 잠금과 강한 일관성 요구로 인해 분산 시스템에서 병목 현상이 발생.
- 데이터 병합 어려움: 분산 환경에서 동기화를 유지하기 어려움.
대안: 이벤트 소싱(Event Sourcing)과 CQRS(Command Query Responsibility Segregation)와 같은 이벤트 기반 설계를 활용하여 상태 변경을 기록하고 관리.
...
2. 이벤트 로깅(Event Logging)
이벤트 로깅은 모든 상태 변경을 이벤트로 기록하는 방식입니다.
- 장점:
- 상태 변경의 완전한 이력을 유지.
- 특정 시점으로의 상태 복원이 가능.
- 분산 환경에서의 데이터 일관성 확보(최종적 일관성).
적용 사례: Kafka 또는 Apache Pulsar와 같은 분산 로그 시스템을 사용하여 이벤트를 저장하고 전달.
...
3. 트랜잭션의 대안 (Transactions—The Anti-Availability Protocol)
전통적인 ACID 트랜잭션은 강한 일관성을 보장하지만 확장성을 저하시킵니다. 분산 시스템에서는 CAP 이론(Consistency, Availability, Partition Tolerance)에서 하나를 희생해야 하기 때문에, 강한 트랜잭션 대신 다음을 고려해야 합니다:
- 최종적 일관성(Eventual Consistency): 시스템이 일정 시간이 지나면 일관성을 유지하는 것을 보장.
- 분산 트랜잭션 최소화: 데이터 일관성 요구를 가능한 작은 단위로 제한.
...
이벤트 기반 접근 방식
1. 이벤트 소싱 (Event Sourcing)
- 원칙: 모든 상태 변경을 이벤트로 저장.
- 장점:
- 데이터의 불변성 유지.
- 모든 상태의 이력 추적 가능.
- 특정 시점으로의 복원이 간편.
2. CQRS(Command Query Responsibility Segregation)
- 원칙: 읽기와 쓰기 모델을 분리.
- 장점:
- 읽기와 쓰기 최적화 가능.
- 비동기 프로세싱과 이벤트 전파가 용이.
...
스트리밍 데이터 활용 (Streaming Data)
데이터가 생성될 때 실시간으로 처리할 수 있도록 스트리밍 아키텍처를 활용합니다:
- 세 가지 흐름:
- 데이터를 스트리밍으로 수집.
- 데이터를 실시간으로 처리 및 저장.
- 스트림을 통해 서비스 간 데이터를 전달.
도구: Apache Kafka, AWS Kinesis, Flink 등.
...
통합 이점
- 확장성: 데이터 볼륨과 처리량 증가에도 효율 유지.
- 탄력성: 이벤트 기반으로 시스템 장애 복구 가능.
- 분석 가능성: 전체 이벤트 이력을 분석하여 시스템 개선.
스트리밍 기반 데이터 처리의 개념
스트리밍 데이터 처리는 데이터가 생성되는 순간 실시간으로 처리하는 방식으로, 데이터가 정적이고 오프라인 상태였던 전통적인 방식에서 벗어나 동적인 데이터 흐름을 기반으로 동작합니다. 이는 현대 분산 시스템 및 마이크로서비스 아키텍처에서 필수적인 요소로 자리 잡고 있습니다.
...
주요 특성 및 장점
1. 데이터 흐름의 연속성
- 데이터를 실시간으로 처리하여 지연(latency)을 최소화.
- 데이터 생성과 동시에 이벤트를 분석하고 반응.
2. 빠른 데이터(Fast Data)의 중요성
- 빠른 데이터는 데이터를 저장 후 나중에 처리하는 방식(배치 처리)이 아니라, 실시간으로 데이터를 처리하고 이를 시스템 동작에 반영합니다.
- 주요 응용 사례:
- 실시간 거래 감지
- IoT 장치의 상태 모니터링
- 사용자 행동 분석 및 즉각적인 추천 시스템
3. 데이터 전송의 효율성
- 스트리밍 방식은 데이터가 수집되고 처리되는 동안 지속적으로 전송되어 시스템 리소스를 효율적으로 사용.
...
스트리밍 데이터 처리의 3단계
데이터 수집:
- 데이터는 센서, 로그 파일, 사용자 활동 등에서 실시간으로 수집됩니다.
- Apache Kafka, Amazon Kinesis와 같은 스트리밍 플랫폼을 활용.
데이터 처리:
- 데이터를 실시간으로 분석, 필터링, 변환합니다.
- Apache Flink, Spark Streaming, Google Dataflow 등의 도구를 사용.
데이터 전달:
- 처리된 데이터는 다른 서비스나 데이터 저장소로 스트리밍됩니다.
- 결과를 기반으로 시스템의 다른 부분이 즉각적으로 동작.
...
스트리밍을 활용한 마이크로서비스 설계
1. 이벤트 기반 아키텍처
- 스트리밍 데이터는 이벤트 중심 설계와 밀접한 관계가 있습니다.
- 이벤트 소싱과 CQRS(Command Query Responsibility Segregation)를 활용하여 이벤트의 흐름을 최적화.
2. 데이터 파이프라인 구성
- 서비스 간 스트림 기반의 데이터 파이프라인을 설계.
- Pub/Sub 모델을 활용하여 서비스를 느슨하게 결합.
3. 지속적인 데이터 업데이트
- 시스템은 데이터가 도착하는 즉시 업데이트되어 최신 상태를 반영.
- 실시간 대시보드, 경고 시스템, 예측 모델에 활용 가능.
...
기술 스택
다음은 스트리밍 기반 데이터 처리에 널리 사용되는 도구와 플랫폼입니다:
- Apache Kafka: 분산 로그 및 메시징 시스템.
- Apache Flink: 실시간 데이터 스트리밍 처리.
- Apache Spark Streaming: 배치 및 스트리밍 데이터 통합 처리.
- Amazon Kinesis: AWS의 스트리밍 데이터 플랫폼.
- Google Dataflow: Google의 스트리밍 데이터 처리 서비스.
...
장점 및 활용 사례
장점:
- 실시간 반응성 제공.
- 지연 시간 최소화.
- 확장성과 탄력성을 갖춘 데이터 처리 가능.
활용 사례:
- IoT 애플리케이션:
- 센서에서 생성된 데이터를 실시간으로 처리.
- 금융 서비스:
- 실시간 사기 탐지 및 거래 승인.
- 소셜 미디어:
- 실시간 사용자 활동 분석 및 피드 업데이트.
- e-커머스:
- 사용자 행동에 기반한 실시간 추천 시스템.
1. 보안 및 인증 (Security and Authentication)
- 마이크로서비스 기반 시스템에서 각 서비스의 독립성을 유지하면서도 안전한 통신을 보장.
- JWT(JSON Web Token), OAuth, OpenID Connect 등을 활용한 인증/인가 메커니즘.
- 서비스 간 인증을 위한 API Gateway 또는 서비스 메시와 같은 보안 계층.
...
2. 모니터링 및 로깅 (Monitoring and Logging)
- 분산 시스템의 상태를 실시간으로 추적하고 오류를 진단하기 위한 로깅 및 모니터링 도구.
- 분산 추적(Distributed Tracing): Zipkin, Jaeger와 같은 도구로 서비스 호출 흐름 시각화.
- 지표 기반 모니터링: Prometheus, Grafana를 사용하여 성능 지표 추적 및 경고 설정.
...
3. 서비스 메시(Service Mesh)
- 서비스 간 통신, 라우팅, 트래픽 관리, 로드 밸런싱 등을 처리하는 계층.
- Istio, Linkerd, Consul Connect 등의 도구를 활용하여 서비스 관리 자동화.
...
4. 데이터 일관성과 분산 데이터 관리
- 분산 시스템에서 데이터 동기화 및 일관성을 유지하기 위한 전략.
- CRDT(Conflict-Free Replicated Data Types): 충돌 없이 데이터 복제 및 동기화.
- 멀티 리전 데이터 복제: 지리적으로 분산된 데이터센터 간 데이터 동기화.
...
5. 고가용성 및 장애 복구 (High Availability and Fault Tolerance)
- 시스템 장애에도 지속적으로 작동할 수 있는 아키텍처 설계.
- 데이터 복제, 캐시, 이중화(failover) 및 복구 전략.
...
6. 컨테이너화 및 오케스트레이션
- Docker와 Kubernetes를 사용한 마이크로서비스 배포 및 관리.
- 자동 스케일링, 상태 점검(health checks), 롤링 업데이트 등의 오케스트레이션 기능.
...
7. CI/CD(Continuous Integration and Continuous Deployment)
- 서비스 업데이트 및 배포를 자동화하여 지속적인 전달을 가능하게 하는 파이프라인 설계.
- Jenkins, GitHub Actions, GitLab CI/CD와 같은 도구를 사용한 통합 프로세스.
...
8. 마이크로서비스 설계 원칙 및 패턴
- Saga 패턴: 분산 트랜잭션 관리.
- Anti-Corruption Layer: 외부 시스템과의 통합에서 일관성 유지.
- Database per Service: 서비스마다 별도의 데이터베이스를 사용하는 전략.
...
9. 메시징 플랫폼과 이벤트 브로커
- Apache Kafka, RabbitMQ, NATS 등 메시징 플랫폼의 비교 및 선택.
- 이벤트 브로커를 활용한 이벤트 기반 아키텍처 구축.
...
10. 테스트 전략
- 계약 테스트(Contract Testing): 서비스 간 인터페이스 테스트.
- 카나리 배포(Canary Deployment): 배포 위험을 줄이기 위한 점진적 릴리스.
- 회귀 테스트(Regression Testing): 업데이트 후 시스템 안정성 확인.