티스토리챌린지1 Apache Flink로 하는 스트림 프로세싱 - 2장 정리 2장. 스트리밍 처리 기초2장에서는 데이터 플로우 프로그래밍 관련 용어 소개와 배경지식을 설명하고 있다. 데이터 플로우 프로그래밍 소개데이터 플로우 그래프 데이터가 어떻게 흐르는지 표현하는 그래프. 노드(node) - 연산자(operator)라 부르고 계산을 표현엣지(edge) - 의존 관계를 표현데이터 소스 - 입력이 없는 연산자싱크(sink) - 출력이 없는 연산자 데이터 병렬화와 태스크 병렬화데이터 병렬화 - 동일한 연산을 수행하는 태스크에 데이터를 분할하여 병렬 처리태스크 병렬화 - 어플리케이션의 개별 태스크를 워커 또는 쓰레드를 분할 할당 하여 병렬로 처리 데이터 교환 전략 (data exchange strategy) 물리적 데이터플로우 그래프에서 어떤 태스크로 레코드를 할당할지 정의한다.. 2024. 11. 24. 이전 1 다음