본문 바로가기
IT/읽어보기

Kafka란?

by ccclog 2023. 12. 20.
반응형

Apache Kafka(아파치 카프카)는 분산 데이터 스트리밍 플랫폼으로, 대규모 실시간 데이터 피드를 효율적으로 처리하는 데 사용됩니다. 카프카는 오픈 소스 프로젝트이며, 대용량의 이벤트 스트림을 안정적으로 처리하고 분산 환경에서 확장 가능한 플랫폼을 제공합니다.

카프카는 다양한 용도로 사용될 수 있으며, 주요 특징은 다음과 같습니다:

1. 분산 아키텍처: 카프카는 여러 브로커로 이루어진 분산 아키텍처를 사용하여 고가용성과 확장성을 제공합니다.
    
2. 고성능: 대량의 이벤트 스트림을 효율적으로 처리하며, 초당 수백만 이벤트에 대한 처리가 가능합니다.
    
3. 내결함성: 일부 브로커의 장애에도 데이터의 안전성과 가용성을 유지하도록 설계되었습니다.
    
4. 확장성: 새로운 브로커를 추가함으로써 시스템을 쉽게 확장할 수 있습니다.
    
5. 유연한 퍼블리싱/사브스크라이빙: 이벤트를 발행하고, 이를 구독하는 여러 소비자들이 동시에 데이터에 접근할 수 있습니다.
    
6. 지속성: 메시지는 디스크에 저장되므로, 데이터 손실 없이 영구적으로 보존됩니다.
    

주로 대규모 데이터 스트리밍 및 이벤트 기반 애플리케이션을 구축하고자 할 때 Kafka가 사용됩니다. 예를 들면, 로그 데이터 수집, 모니터링, 실시간 분석, 이벤트 소싱(event sourcing)과 같은 분야에서 활용됩니다.

 

 

반응형

'IT > 읽어보기' 카테고리의 다른 글

랜포트에서 LED가 들어오는데, 네트워크가 동작하지 않습니다.  (0) 2023.12.29
FPGA란?  (0) 2023.12.24
SAN이란?  (0) 2023.12.19
RDMA란? +RDMA의 역사  (0) 2023.12.12
바이너리 파일.  (0) 2023.11.16