Spring BOOT에서 AkkaCluster를 이용 , Spring Boot Application을 클러스터화하는것을 시도해보겠습니다.

최초 클러스터화 하는것은 어렵게 보일수 있지만, 한번 클러스터 구성이 된이후에는 분산처리 필요한 복잡한 도메인 처리를 

메일박스를 가진 액터모델을 이용해 간단하게 할수있습니다.  AKKACluster(이하 클러스터)의 개념을 먼저 살펴보고

Spring Boot에 탑재하여 클러스터로 작동시키는 구현 코드까지 알아보겠습니다.


클러스터화 앱의 특징

주제클러스터클러스터가 아님
고성능 이벤트 분산처리
  • Rest대비 수십또는 수백배가 빠른 고성능 TCP(netty)를 이용합니다.
  • Rest레벨의 분산 처리할수 있습니다.
TPS 분배
  • Throttle 스트림장치를 활용 클러스터/노드
    단위 TPS제어가 가능합니다.
  • Kafka와 같은 외부큐를 도입할수 있지만 정밀한
    TPS제어는 어려울수 있으며 별도 구현해야합니다.
Role기반 처리
  • 분산 배치되지만 단일코드에서 단일앱인것처럼 유기적으로작동됨으로
    이벤트의 플로우를 파악하는 구현 응집도에서 유리합니다.
  • 다른 역할에 대한 구성및 형상관리를 각각 해야할수 있으며
    외부장치를 이용해 구독과 수신관리를 해야합니다.
라우터기반 분산
  • 제공되는 분배 전략에따라 라우터를 채택하고
    분산배치된 노드에 분배처리됩니다.
  • 라우드로빈과같은 단순한 분산처리 전략만 채택할수 있습니다.
  • Role간 발생하는 이벤트의 생산과 소비의 속도차이를 제어할수 있습니다.
  • 외부장치를 이용해 해야합니다.

분산처리를위해 이미 클러스터화된 카프카와같은 외부 큐시스템만 할용할수도 있겠지만

우리가 설계한 클러스터는 외부시스템과도 연동할수 있으며 주로 내부앱에서 발생하는 분산처리 문제를 다룰 있으며

단독 어플리케이션이 어떻게 상호 연결되는 클러스터화가 되는지 AkkaCluster Flow를 살펴보겠습니다.

Cluster gossip

클러스터에 작동하는 앱은 모두 Role기반으로 작동이되며~ 설계자에 의해 필요한 Role과 구성을 어플리케이션 레벨에서 

개발자가 직접 할수 있으며  여기서 구현및 설계된 구성과 Role을 살펴보겠습니다.

Cluster Role

클러스터내에 액세스하려는 실제 위치를 알필요없이 접근 가능한것을 위치 투명성(Location Transparency)이라고 불리며 클러스터 앱의 특징중 하나입니다.

WorkNode의 위치및 개수를 알필요없이~ 분산배치된 노드에 이벤트를 보내려면 액터참조자만 알고 있으면 충분합니다.

        for(int i=0;i<testCount;i++){
            clusterActor.tell(testMessage + i , ActorRef.noSender());

Nginnx와 같이 LB를 일반적으로 이용하는경우 라운드로빈과 같은 비교적 간단한 방식만 채택할수 있지만.

클러스터(AKKA)가 구성되고 나면 다음 제공되는 다양한 라우터를 사용할수 있으며

메시지 우선순위 역전과같이 필요한경우 라우터로직만 교체할수도 있습니다.

클러스터에서 이용할수 있는 라우터의 종류




Round Robin Router

단순하게 들어온 메시지 순서대로, 순차적으로 대상 노드를 바꿔가며 전송시 사용


Broadcast Router

어떠한 정보의 변경을 모든 노드가 알아야할시, 주로 전체 동기화및 전체 푸시용도


랜덤 메시지 전송


ConsistentHash Router

특정 처리에 대해 해시값기반 베이스로 노드의 변경의 가능성을 최소화할때

웹소켓의 경우 hanshake를 위해 LB-l7 레이에서도 이용하는 전력으로

AKKA에서는 특정 해시이벤트가 특정노드에 작동처리 보장됨으로

네트워크로 이용해야하는 Redis보다 수십배 빠른 인 메모리 캐시를 이용할수 있습니다.


기본적으로 랜덤이나, 느린놈을 제외하고 특정시간이 지나야 다시 합류시킴(일반적으로 빠른 응답속도 보장용)


within = 10s
tail-chopping-router.interval = 20ms

ScatterGatherFirstCompleted Router

성능을 위해 다중노드로 구성하였으며, 가장 빠르게 처리한 녀석의 결과를 사용할시


SmallestMailbox Router

덜바쁜 노드우선으로 메시지를 보내고자 할때, 대용량 메시지 전송 보증이 필요할때


ScatterGatherFirstCompleted Router

성능을 위해 다중노드로 구성하였으며, 가장 빠르게 처리한 녀석의 결과를 사용할시


within = 10s

클러스터 앱에서 AKKA에서 제공하는 Router/Stream장치를 함께 이용함으로 복잡성이 높은 분산처리 문제를 간단하게 해결할수 있습니다.

Akka Stream은 다음과 같은 특징을 가지고 있습니다.

  1. 백프레셔(Back Pressure) 자동 관리: 데이터 생산자와 소비자 간의 처리 속도 차이를 자동으로 조정하여 시스템의 안정성을 유지하고 데이터 손실을 방지합니다.

  2. 모듈식 구성: 소스(Source), 플로우(Flow), 싱크(Sink) 등의 재사용 가능한 구성 요소를 통해 복잡한 데이터 처리 파이프라인을 쉽게 구축할 수 있습니다.

  3. 비동기 및 논블로킹 처리: Akka 액터 모델을 기반으로 하여 리소스를 효율적으로 활용하며, 대규모 데이터 스트림의 비동기 처리를 지원합니다.

  4. 확장성: 분산 시스템 설계를 고려하여 클러스터 환경에서의 확장성이 용이합니다.

  5. 유연한 에러 핸들링: 스트림 내 예외 상황을 세밀하게 처리할 수 있는 메커니즘을 제공합니다.

  6. 리액티브 스트림스 통합: 다른 리액티브 스트림스 구현체와의 호환성을 보장하여 상호 운용성을 제공합니다.

  7. Throttle 메커니즘: 특정 시간 단위로 데이터 처리 속도를 조절할 수 있는 기능을 제공하여, 리소스 사용량을 제어하고 네트워크 트래픽이나 서버 부하 등을 관리할 수 있습니다. 이를 통해 시스템의 과부하를 방지하고, 스트림의 처리 속도를 세밀하게 제어할 수 있습니다.

Akka Stream은 이러한 기능들을 통해 개발자들이 복잡한 데이터 스트림 처리 문제를 더 쉽고 효율적으로 해결할 수 있도록 지원합니다. Throttle 기능은 특히, 리소스 사용을 최적화하고 시스템의 성능을 향상시키는 데 중요한 역할을 합니다.

이제 실제 작동하는 실습모드로 클러스터를 전체 구동하는것은 아파치의 주키퍼와 같은 클러스터를 띄우는 방식이 크게 다르지 않으며

Spring Boot Cluster를 다음 DockerCompose를 이용하여 여기서 소개되는 클러스터 앱을 로컬에서 모두 구동하여 테스트 해볼수 있습니다.

DockerCompose로 클러스터 전체를 구동하기

version: '3.5'
    image: registry.webnori.com/javalabs-lighthouse:dev        
      - "8081:8080"    
      TZ: Asia/Seoul
      akka.role: seed
      akka.seed: akka://ClusterSystem@light-house:12000
      akka.hostname: light-house
      akka.hostport: 12000
      akka.cluster-config: cluster.conf
      - mynet      
    image: registry.webnori.com/javalabs-api:dev        
      - "8082:8080"
      - light-house     
      TZ: Asia/Seoul
      akka.role: work
      akka.seed: akka://ClusterSystem@light-house:12000
      akka.hostname: work-node1
      akka.hostport: 12000
      akka.cluster-config: cluster.conf
      - mynet
    image: registry.webnori.com/javalabs-api:dev        
      - "8083:8080"
      - light-house     
      TZ: Asia/Seoul
      akka.role: work
      akka.seed: akka://ClusterSystem@light-house:12000
      akka.hostname: work-node2
      akka.hostport: 12000
      akka.cluster-config: cluster.conf
      - mynet
    image: registry.webnori.com/javalabs-api:dev        
      - "8084:8080"
      - light-house     
      TZ: Asia/Seoul
      akka.role: manager
      akka.seed: akka://ClusterSystem@light-house:12000
      akka.hostname: manager-node
      akka.hostport: 12000
      akka.cluster-config: cluster.conf
      - mynet                     
    driver: bridge

cluster의 고급설정을 cluster.conf에서 할수 있으며 이 파일을 base로 추가 클러스터별 필요한 설정주입을 구동단계에서 각각 조절할수 있습니다.

Cluster 설정 - cluster.conf

  actor {
    provider = cluster

  remote.artery {
    canonical {
      hostname = ""
      port = 12551

  cluster {
    seed-nodes = [

    # auto downing is NOT safe for production deployments.
    # you may want to use it during development, read more about it in the docs.
    auto-down-unreachable-after = 10s
    downing-provider-class = "akka.cluster.sbr.SplitBrainResolverProvider"


클러스터 내에서 일반 노드에 장애가 발생했을때 해당 노드만 빠르게 제거하고 클러스터를 문제없이 가동시키는 것은 중요합니다.

클러스터내 장애감내(허용) 를 위한 컨셉은 꼭 AKKA가 아니여도  클러스터를 단지 이용하게 되는경우도 도움될수 있습니다.

Cluster 내 Split Brain 해결전략

SplitBrain은 좌뇌/우뇌가 따로작동되어 장애가 발생하는 의학적 용어이며, 클러스터내에서 이러한 현상이 발생하게되면 심각한 문제가 발생할수 있으며 방지전략을 채택할수 있습니다.

Akka Cluster는 분산 시스템을 구축할 때 발생할 수 있는 여러 문제 중 하나인 "split brain" 현상을 해결하기 위한 다양한 전략을 제공합니다.

Split brain은 네트워크 파티셔닝(network partitioning) 때문에 클러스터가 서로 다른 분리된 하위 클러스터(sub-clusters)로 나뉘어져 서로가 나머지 부분과 통신할 수 없는 상태를 말합니다. 이러한 상황은 데이터 불일치, 중복 처리 등 여러 문제를 일으킬 수 있습니다.

아래와 같은 전략이 포함됩니다.

  1. Static Quorum

  2. Keep Majority

  3. Keep Oldest

  4. Down All

  5. Lease Majority

클러시스템을 설계하고 개발하는경우 개발 테스트를 위해 로컬에 클러스터를 유사하게 구성하는것은 중요하며 

Docker + Swagger  조합으로 여기서 소개한 클러스터를 TEST할수 있습니다.

클러스터 TEST by Docker

주요코드 구현코드 살펴보기

Spring Boot내 AkkaSystem 탑재

public class ApplicationStartup implements ApplicationListener<ApplicationReadyEvent> {

     * This event is executed as late as conceivably possible to indicate that
     * the application is ready to service requests.
    public void onApplicationEvent(final ApplicationReadyEvent event) {

Actor시스템 생성및 사용자정의 액터모델 초기 생성

// 클래스 목적 :
// Actor시스템을 생성하고, 액터관리 Spring 디펜던시 없이 로우코드로 구현
// Spring Bean 활용시 참조 : https://www.baeldung.com/akka-with-spring
public final class AkkaManager {
    private static AkkaManager INSTANCE;
    private final ActorSystem actorSystem;
    private String akkaConfig;
    private String role;

    private String hostname;

    private String hostport;

    private String seed;

    private ActorRef greetActor;

    private ActorRef routerActor;

    private ActorRef clusterActor;

    private ActorRef clusterManagerActor;

    private AkkaManager() {

        akkaConfig = System.getenv("akka.cluster-config");
        role = System.getenv("akka.role");
        hostname = System.getenv("akka.hostname");
        hostport = System.getenv("akka.hostport");
        seed = System.getenv("akka.seed");

        actorSystem = serverStart("ClusterSystem", akkaConfig, role);


    public static AkkaManager getInstance() {
        if (INSTANCE == null) {
            INSTANCE = new AkkaManager();
        return INSTANCE;

    boolean isEmptyString(String string) {
        return string == null || string.isEmpty();

    private ActorSystem serverStart(String sysName, String clusterConfig, String role) {

        Config regularConfig = ConfigFactory.load();

        Config combined;

        Boolean isCluster = !isEmptyString(clusterConfig) || !isEmptyString(role) || !isEmptyString(hostname)
                || !isEmptyString(hostport) || !isEmptyString(seed);

        if (isCluster) {
            Config newConfig = ConfigFactory.parseString(
                    String.format("akka.cluster.roles = [%s]", role)).withFallback(

            newConfig = ConfigFactory.parseString(
                    String.format("akka.cluster.seed-nodes  = [\"%s\"] ", seed)).withFallback(

            newConfig = ConfigFactory.parseString(
                    String.format("akka.remote.artery.canonical.hostname = \"%s\" ", hostname)).withFallback(

            newConfig = ConfigFactory.parseString(
                    String.format("akka.remote.artery.canonical.port = %s ", hostport)).withFallback(

            combined = newConfig
        } else {
            final Config newConfig = ConfigFactory.parseString(
                    String.format("akka.cluster.roles = [%s]", "seed")).withFallback(
            combined = newConfig

        ActorSystem serverSystem = ActorSystem.create(sysName, combined);
        serverSystem.actorOf(Props.create(ClusterListener.class), "clusterListener");
        return serverSystem;

    private void InitActor() {
        // Create Some Actor
        greetActor = actorSystem.actorOf(HelloWorld.Props()
                .withDispatcher("my-dispatcher"), "HelloWorld");

        // Create Router Actor
        routerActor = actorSystem.actorOf(new RoundRobinPool(5)
                .props(HelloWorld.Props()), "roundRobinPool");

                .withDispatcher("my-blocking-dispatcher"), "TimerActor");

        // Cluster Actor
        int totalInstances = 100;
        int maxInstancesPerNode = 3;
        boolean allowLocalRoutees = true;

        Set<String> useRoles = new HashSet<>(Arrays.asList("work"));
        clusterActor =
                                new ClusterRouterPool(
                                        new RoundRobinPool(0),
                                        new ClusterRouterPoolSettings(
                                                totalInstances, maxInstancesPerNode, allowLocalRoutees, useRoles))

        Set<String> useManagerRoles = new HashSet<>(Arrays.asList("manager"));
        clusterManagerActor =
                                new ClusterRouterPool(
                                        new RoundRobinPool(0),
                                        new ClusterRouterPoolSettings(
                                                totalInstances, maxInstancesPerNode, allowLocalRoutees, useManagerRoles))


클러스터 기능을 가진 사용자 정의 액터모델구현

public class ClusterHelloWorld extends AbstractActor {
    private final LoggingAdapter log = Logging.getLogger(getContext().getSystem(), this);

    Cluster cluster = Cluster.get(getContext().system());

    public static Props Props() {
        return Props.create(ClusterHelloWorld.class);

    //subscribe to cluster changes
    public void preStart() {
        cluster.subscribe(self(), (ClusterEvent.SubscriptionInitialStateMode) ClusterEvent.initialStateAsEvents(),
                ClusterEvent.MemberEvent.class, ClusterEvent.UnreachableMember.class);

    public void postStop() {

    public Receive createReceive() {
        return receiveBuilder().match(ClusterEvent.MemberUp.class, mUp -> {
            log.info("Member is Up: {}", mUp.member());
        }).match(ClusterEvent.UnreachableMember.class, mUnreachable -> {
            log.info("Member detected as unreachable: {}", mUnreachable.member());
        }).match(ClusterEvent.MemberRemoved.class, mRemoved -> {
            log.info("Member is Removed: {}", mRemoved.member());
        }).match(ClusterEvent.MemberEvent.class, message -> {
        // 구현가능 분산처리 메시지 사용자 정의부분
        }).match(String.class, s -> {
            log.info("Received String message: {} {}", s, context().self().path());
        .match(TestClusterMessages.Ping.class, s -> {
            log.info("Received Ping message: {}",  context().self().path());

클러스터를 통해 분산처리 TPS제어 복잡성을 단순화하기

지금까지 클러스터툴을 통해 다음과 같은 툴이 제공됨을 알게되었습니다.

이러한 장치를 조합해다음과같이 분산처리 시스템에서의 문제를 단순화할수 있습니다.

클러스터로 확장되어 단일장비가 아닌 클러스터에 가입한 전체 노드내에서 TPS 제어가가능해집니다. 

다음은 클러스터가 없는 분산처리 컨셉으로 아래의 개념이 위와같은 형태로 확장이될수 있습니다.

클러스터 유닛테스트

public class FactorialTest {

    private static Logger logger = LoggerFactory.getLogger(FactorialTest.class);
    private static ActorSystem clusterSystem1;
    private static ActorSystem clusterSystem2;
    private static ActorSystem clusterSystem3;

    private int maxServerUptime = 20;

    private static ActorSystem serverStart(String sysName, String config, String role) {
        final Config newConfig = ConfigFactory.parseString(
                String.format("akka.cluster.roles = [%s]", role)).withFallback(

        ActorSystem serverSystem = ActorSystem.create(sysName, newConfig);
        serverSystem.actorOf(Props.create(ClusterListener.class), "clusterListener");
        return serverSystem;

    public static void setup() {
        // Seed
        clusterSystem1 = serverStart("ClusterSystem", "server", "seed");

        // Works Nodes
        clusterSystem2 = serverStart("ClusterSystem", "factorial", "backend");
        clusterSystem2.actorOf(Props.create(FactorialBackend.class), "factorialBackend");

        clusterSystem3 = serverStart("ClusterSystem", "factorial", "backend");
        clusterSystem3.actorOf(Props.create(FactorialBackend.class), "factorialBackend");

        logger.info("========= sever loaded =========");

    public static void gracefulDown() {
        logger.info("========= sever down =========");

    public void clusterTest() {
        logger.info("========= client start =========");
        final int upToN = 200;

        final Config config = ConfigFactory.parseString(
                "akka.cluster.roles = [client]").withFallback(

        final ActorSystem system = ActorSystem.create("ClusterSystem", config);
        system.log().info("Factorials will start when 2 backend members in the cluster.");

        new TestKit(system) {
                ActorRef probe = getRef();
                Cluster.get(system).registerOnMemberUp(new Runnable() {
                    public void run() {
                        ActorRef frontActor = system.actorOf(Props.create(FactorialClient.class, upToN, false),
                        frontActor.tell(new FactorialRequest(upToN), probe);
                expectMsgClass(Duration.ofSeconds(maxServerUptime), FactorialResult.class);

N개의 시스템을 구성하고 구현된 클러스터 시스템 자체를 유닛테스트할수 있게만드는것은 클러스터 개발속도를 가속화 할수 있습니다.

이러한것이 준비되지 않으면 복잡한 클러스터 시스템을 항상 띄우고 개발중 기능확인을 매번해야하기 때문입니다.

Spring Boot 클러스터 셋업및 실행 요약

추가 연관 컨텐츠

다음 컨텐츠는 클러스터 모드가 아니여도 Akka가 제공하는 유용한 실제 이용사례를 조금더 살펴볼수 있습니다.

클러스터화 함께 이용하는 경우 복잡성이 높은 분산처리 문제를 조금더 쉽게 풀어갈수가 있습니다.


로컬및 개발환경에서는 비교적 구성이 쉬운 docker-compose를 이용할수 있으나 운영환경에서는 이제 사실상 배포운영에 표준이된 쿠버 인프라환경을 이용하게 됩니다.

Spring 환경에서 AkkaCluster를 직접 설계하고 구성한것을 RKE-쿠버를 이용해 쿠버 클러스터내에서 작동을 준비예정에 있습니다.

일반적으로 RestAPI와 같이 StateLess한 서비스를 POD로 작동하고 LB를 Ingress화 하는 쿠버의 기본요소를 이용하는것보다

Discovery기능을 이용해야하는 클러스터화된 스택을 쿠버에 구성하는것은 일반적으로 조금더 난이도가 있을수 있으며

쿠버는 클러스터화된 스택자체를 구성하고 안정적으로 운영하는 기능자체도 제공하게 됩니다.