Page History

Versions Compared

Old Version 1

changes.mady.by.user PSMON

Saved on 2025년 Apr 12일

compared with

New Version 2

changes.mady.by.user PSMON

Saved on 2025년 Apr 12일

Key

This line was added.
This line was removed.
Formatting was changed.

...

둘 다 공통적으로
- 하위 인프라 계층은 동일하게 구성됨:
  Network → Storage → Hypervisor → OS → Managed Runtime
- 이는 클라우드 기반 컨테이너 또는 가상머신 위에서 실행된다는 점을 의미함

...

📌 요약 정리 (한 문장 비교)

항목	SOA	MSA
아키텍처	통합된 서비스 구조	완전 분산된 마이크로 서비스
애플리케이션 서버	필수	없음 (경량 서버 포함)
배포 단위	전체 혹은 큰 단위	개별 서비스 단위
확장성	제한적	유연한 수평 확장
결합도	낮음 (그러나 존재)	매우 낮음 (완전 독립)

AI의 활용되는 MCP(Model Context Protocol) 에대해 설명하고~ 이것을 시스템 아키텍처 적용할때 고려사항?

...

간단히 말해, **AI가 상황에 맞는 적절한 응답/행동을 하게 하기 위한 "문맥 주입 기술"**입니다.

...

✅ 2. MCP의 핵심 구성요소

구성요소	설명
Context Injection	모델에 필요한 배경 정보, 사용자 상태, 시스템 상태 등을 입력
Model Memory / Cache	이전 대화나 상태를 저장하여 일관성 유지
Session Identifier	사용자 또는 요청 세션을 식별하여 개별 문맥 유지
Prompt Engineering	명시적 프롬프트 구성 또는 암묵적 추론 강화
Context Retrieval	외부 지식이나 저장된 문맥을 모델에 동적으로 전달

...

✅ 3. MCP가 활용되는 AI 시스템 사례

AI 챗봇 / 비서: 사용자 세션 기반 대화 히스토리와 상태 저장
AI CRM 시스템: 고객 이력, 행동 로그 등을 문맥으로 활용
자동화된 상담봇: 업무 정책, 상담 이력, 감정 분석 정보 포함
멀티모달 시스템: 이미지 + 텍스트 + 위치 정보 등을 종합 문맥으로 전달

...

🧩 아키텍처 레벨에서 MCP 적용 시 고려해야 할 요소들:

고려 요소	설명
문맥 저장소 설계	Redis, MongoDB, Vector DB (예: FAISS, Weaviate) 등 문맥을 저장하고 검색 가능한 구조 필요
세션/토픽 기반 흐름 관리	Kafka, NATS 등으로 대화/요청 흐름을 분리하고 관리
프롬프트/문맥 생성을 위한 API 계층	프론트/백엔드에서 상황에 맞는 prompt builder 구현 필요
보안 및 개인 정보 보호	사용자 문맥에는 민감 정보가 포함될 수 있으므로 암호화 및 접근 제어 필요
Context Timeout / Expiration	세션 만료 및 문맥 무효화 전략 필요
Latency 최적화	Context Fetch → Prompt Injection → Inference 흐름의 지연 최소화

✅ 5. 시스템 구성 예시 (AI 기반 고객지원 플랫폼)

...

SOA → MSA → Contextual, Autonomous, AI-Native Architecture

✅ 1. Next 아키텍처의 키워드

핵심 키워드	설명
AI-Native	AI가 모든 서비스 흐름에 기본 내장됨 (예: 추천, 예측, 분류)
Context-Aware	사용자, 시스템 상태에 따라 유동적으로 동작 (MCP 적용)
Event-Driven	모든 변화가 이벤트로 감지/처리됨 (Kafka, NATS)
Composable	기능을 블록처럼 재조립 (Low-code, Function as a Service)
Autonomous Ops	스스로 모니터링, 복구, 확장하는 인프라
Multi-Agent Collaboration	여러 AI Agent가 분산되어 협력 작업 수행

✅ 2. MSA 이후 고려해야 할 인프라 스트럭처 구성

...

Context 기반 AI 엔진 연동 (예: RAG, LLM, Embedding)
AI Orchestrator (multi-agent flow 조정)
| Service Layer |
Async-first 구조 (Kafka, NATS, gRPC, WebSocket)
Function 단위의 배포 (FaaS: AWS Lambda, OpenFaaS 등)
| Runtime Layer |
Container+Function 조합 (Knative, Dapr, WASM)
서비스 메시 (Istio, Linkerd) 통한 트래픽 및 보안 제어
| Data Layer |
Vector DB (FAISS, Weaviate) + OLTP/OLAP 조합
Streaming DB (Apache Flink, RisingWave 등)
| Infra Layer |
Multi-Cloud / Edge 분산 배포 고려
GitOps 기반 CI/CD (ArgoCD, Flux)
| Observability & Ops |
AI APM (분산 트레이싱 + 모델 추론 로그)
Self-healing 플랫폼 (Kubernetes + AI Ops)

✅ 3. 인프라 전환 시 고려 사항

고려 항목	설명
서비스 쪼개기 한계 극복	마이크로서비스가 너무 많아지면 오히려 복잡도 증가 → 기능 컴포저블 구조 전환 필요
AI 추론 속도와 비용 최적화	GPU 자원 배분, On-device 추론 등 인프라 레벨의 조정 필요
문맥 기반 라우팅	사용자의 상태/맥락 기반으로 서비스 분기 → Istio+Envoy+Context-aware Gateway
멀티에이전트/멀티모달 처리	다양한 입력 (텍스트, 이미지, 음성 등) 및 복합 Agent 협업 처리 구조
Platform Engineering	개발자 경험(DX)을 위한 추상화 플랫폼 필요 (Backstage, Internal Dev Portals 등)

✅ 예시: Next-Gen AI CRM 아키텍처 (MSA 이후)

Code Block
[User Input] ↓ [Context Gateway] ← MCP & Metadata ↓ [Intent Router] → [AI Service A] → [AI Service B] → [LLM + RAG Layer] ↓ [Event Bus (Kafka/NATS)] ↓ [Function Service (FaaS)] ↓ [DB + Vector DB + Cache] ↓ [Monitoring + AI Ops]

Code Block

[User Input]
   ↓
[Context Gateway] ← MCP & Metadata
   ↓
[Intent Router] → [AI Service A]
                 → [AI Service B]
                 → [LLM + RAG Layer]
   ↓
[Event Bus (Kafka/NATS)]
   ↓
[Function Service (FaaS)]
   ↓
[DB + Vector DB + Cache]
   ↓
[Monitoring + AI Ops]

✅ 요약 정리

단계	설명
SOA	공유된 서비스 레이어, 중앙 집중적 관리
MSA	독립 서비스, 자동화 배포/확장
Next (AI-Native Infra)	지능형, 문맥 인식, 멀티에이전트 기반의 완전 분산 서비스 인프라

Info
지능형 AI 서비스 아키텍처 다이어그램을 그려

...

Content

Space Tools