본문 바로가기
반응형

분산시스템4

장애허용성과 TMR, 프로세스 그룹의 개념 설명 (Fault Tolerance, Process Group) Issue of Fault ToleranceFault Tolerance는 distributed system(분산 시스템)의 핵심 특성 중 하나로, single-machine system(단일 시스템)과의 중요한 차별점을 이룬다.특히, 분산 시스템에서는 partial failure(부분 실패)의 개념이 존재하며, 이는 시스템의 일부만 고장나는 상황을 의미한다.따라서 분산 시스템 설계의 중요한 목표 중 하나는, 시스템이 이러한 부분 실패로부터 자동으로 회복할 수 있도록 구성하는 것이다.이러한 회복 과정은 전체 성능에 심각한 영향을 주지 않아야 한다.Stability Quality of Software SystemsAvailabilityAvailability는 시스템이 즉시 사용 가능한 상태에 있는 특성을 의.. 2025. 4. 12.
[Hadoop] 하둡 MapReduce 동작 원리 MapReduce 프로그래밍 모델 상세 설명하둡의 MapReduce 프로그래밍 모델은 대용량 데이터를 병렬 처리하기 위한 함수 기반 처리 구조를 따르며, 두 가지 핵심 함수로 구성된다.1. Map FunctionInput: (Key, Value) 형태로 입력을 받음예: (Line Number, 문장 내용)Output: List of (Key, Value) 형태로 출력예: "the quick brown fox" → ("the", 1), ("quick", 1), ("brown", 1), ("fox", 1) Map 함수는 주어진 데이터를 원하는 형태로 전처리하는 역할을 한다.2. Reduce FunctionInput: (Key, List) 형태로 입력을 받음예: ("the", [1,1,1,1])Output: .. 2025. 4. 9.
HDFS(하둡 분산 파일 시스템) 구조 및 작동 방식 HDFS: Hadoop Distributed File SystemHDFS는 대용량 파일 저장 및 분산 처리에 최적화된 분산 파일 시스템이다. 다음과 같은 설계 철학을 기반으로 한다:설계 목적매우 큰 파일 저장: 수백 MB ~ 수 TB에 이르는 대규모 파일스트리밍 데이터 접근 패턴: Write-once, Read-many-times 방식일반 하드웨어(Commodity Hardware)에서 구동 가능HDFS의 제한 사항HDFS는 모든 유형의 워크로드에 적합하지 않다. 대표적인 제한 사항은 다음과 같다:낮은 지연시간 요구에 부적합: HDFS는 고처리량(Throughput)에 최적화되어 있으며, 실시간 처리에는 부적절하다.예: 실시간 쿼리 → HBase 추천작은 파일이 많은 경우 비효율:메타데이터를 NameNo.. 2025. 4. 3.
분산시스템과 컴퓨팅의 소개 위글은 분산시스템의 예시, 분산시스템의 핵심 특성, 분산시스템의 종류에 대해서 소개한다. Distributed System Examples1. 모바일 클라우드 컴퓨팅모바일 클라우드 컴퓨팅(MCC)은 모바일 기기와 클라우드 컴퓨팅을 결합한 기술로, 모바일 기기의 성능, 저장 용량, 배터리 소모 등의 한계를 극복하기 위해 클라우드 서버에서 연산 및 데이터를 처리하는 개념이다.요즘은 한 서버내에 여러 가상 머신을 쓰고 있는데, 머신들이 여러개 모여있는 분산 시스템으로 구성한다. 모바일 fog 컴퓨팅모바일 Fog 컴퓨팅(MFC)은 클라우드 컴퓨팅과 모바일 엣지 컴퓨팅(MEC) 사이에 위치하는 컴퓨팅 모델이다. 클라우드에서 모든 처리를 수행하는 기존 방식과 달리, 네트워크 엣지에서 분산된 노드(Fog 노드)를 활.. 2025. 3. 10.