TIL

Local Partitioning

멀티스레드 스텝의 성능 한계

멀티스레드 스텝은 여러 스레드가 하나의 ItemReader/ItemWriter 인스턴스를 공유한다
스레드가 늘어날수록 내부 동기화 lock 경쟁이 심화되어, 일정 임계점 이후 스레드를 추가해도 성능 향상이 정체된다
공유 구조를 유지하는 한 이 병목은 피할 수 없다

파티셔닝이란

전체 데이터를 여러 파티션으로 분할하고, 각 파티션을 별도의 스레드에 할당하여 동시에 처리하는 전략
각 파티션은 독립된 StepExecution으로 실행되므로, @StepScope 컴포넌트는 스레드마다 별도 인스턴스로 생성된다
- ItemReader/ItemWriter의 공유 자체가 발생하지 않아 lock 경쟁이 사라짐
본질적으로 서로 다른 데이터 범위를 처리하는 여러 개의 독립적인 스텝 실행을 동시에 수행하는 것

[ 멀티스레드 스텝 ]

                  ┌─── 워커 스레드 #1 ──▶ [청크1: Read→Process→Write] ───┐
                  │                                                     │
[공유 Reader] ◀───┼─── 워커 스레드 #2 ──▶ [청크2: Read→Process→Write] ───┼──▶ [공유 Writer]
  (lock 경쟁)     │                                                     │     (lock 경쟁)
                  └─── 워커 스레드 #3 ──▶ [청크3: Read→Process→Write] ───┘

→ 하나의 StepExecution, 컴포넌트 공유 → lock 병목


[ 파티셔닝 ]

스레드 #1: [전용 Reader] ──▶ 파티션1 (ID 1~100)   ──▶ [전용 Writer]   ← StepExecution #1
스레드 #2: [전용 Reader] ──▶ 파티션2 (ID 101~200) ──▶ [전용 Writer]   ← StepExecution #2
스레드 #3: [전용 Reader] ──▶ 파티션3 (ID 201~300) ──▶ [전용 Writer]   ← StepExecution #3

→ 각각 독립된 StepExecution, 컴포넌트 비공유 → lock 경쟁 없음

파티셔닝 아키텍처: ManagerStep과 WorkerStep

파티셔닝은 ManagerStep(지휘)과 WorkerStep(실행)이라는 두 역할로 구성된다.

ManagerStep

직접 데이터를 처리하지 않고, 분할과 실행 지휘만 담당
내부에 두 가지 핵심 컴포넌트를 가진다:
- StepExecutionSplitter: Partitioner를 사용해 전체 데이터를 여러 파티션으로 나누고, 각 파티션마다 독립적인 워커 StepExecution을 생성
- PartitionHandler: 생성된 워커 StepExecution들을 가용한 스레드에 할당하여 병렬 실행을 지시하고, 모든 워커 완료 후 결과를 취합

WorkerStep

실제 데이터 처리를 수행하는 스텝으로, 파티션 개수만큼 병렬로 실행
각 워커는 자신만의 독립적인 ItemReader/ItemWriter 인스턴스를 가짐
- 컴포넌트 공유가 없으므로 lock 경쟁이 원천 차단
각 워커는 전체 데이터셋 중 자신에게 할당된 파티션 영역의 데이터만 처리

                ┌──────────────┐
                │  ManagerStep │
                │ (지휘만 담당)  │
                └──────┬───────┘
                       │
        ┌──────────────┼──────────────┐
        ▼              ▼              ▼
 ┌─────────────┐┌─────────────┐┌─────────────┐
 │ WorkerStep#1││ WorkerStep#2││ WorkerStep#3│
 │ 파티션1 처리  ││ 파티션2 처리  ││ 파티션3 처리  │
 │ 전용 Reader  ││ 전용 Reader  ││ 전용 Reader  │
 │ 전용 Writer  ││ 전용 Writer  ││ 전용 Writer  │
 └─────────────┘└─────────────┘└─────────────┘

Partitioner

@FunctionalInterface
public interface Partitioner {
    Map<String, ExecutionContext> partition(int gridSize);
}

gridSize개의 파티션을 생성하여 Map<String, ExecutionContext>로 반환
- 키: 파티션 식별자 (예: "0", "1" 또는 "MORNING_LOGS" 등 자유 지정)
- 값: 해당 파티션이 처리할 데이터 범위 정보가 담긴 ExecutionContext
StepExecutionSplitter가 파티셔닝 시작 시점에 이 메서드를 호출하고, 반환된 ExecutionContext마다 독립적인 워커 StepExecution을 생성한다

구현 전제: 입력 데이터 범위의 확정

배치 작업은 처리할 입력 데이터의 범위가 사전에 확정되어 있다
- 일일 배치면 하루치, 월간 배치면 한 달치
전체 범위를 알아야 파티션을 나눌 수 있으므로, 이 전제가 Partitioner 구현의 기반이 된다
구현 흐름:
1. 전체 데이터 범위를 결정한다 (예: 24시간)
2. gridSize로 나눠 각 파티션의 범위를 계산한다
3. 파티션마다 ExecutionContext를 생성하고 범위 정보를 저장한다
4. 모든 파티션을 Map에 담아 반환한다

// 24시간을 gridSize개의 시간 블록으로 분할하는 예시
@Override
public Map<String, ExecutionContext> partition(int gridSize) {
    Map<String, ExecutionContext> partitions = new HashMap<>(gridSize);
    int hours = 24 / gridSize; // gridSize=4이면 6시간씩

    for (int i = 0; i < gridSize; i++) {
        ExecutionContext ctx = new ExecutionContext();
        ctx.put("startDateTime", targetDate.atStartOfDay().plusHours(i * hours));
        ctx.put("endDateTime", targetDate.atStartOfDay().plusHours((i + 1) * hours));
        partitions.put(String.valueOf(i), ctx);
    }
    return partitions;
}

워커에서의 파티션 정보 활용

워커 스텝의 ItemReader를 @StepScope로 선언하면, 각 워커 StepExecution마다 새 인스턴스가 생성된다
SpEL 표현식 #{stepExecutionContext['key']}로 파티션별 ExecutionContext에 저장된 범위 정보를 주입받는다

@Bean
@StepScope
public MongoCursorItemReader<Log> reader(
        @Value("#{stepExecutionContext['startDateTime']}") Date start,
        @Value("#{stepExecutionContext['endDateTime']}") Date end) {
    return new MongoCursorItemReaderBuilder<Log>()
            .jsonQuery("{ 'timestamp': { '$gte': ?0, '$lt': ?1 } }")
            .parameterValues(List.of(start, end))
            // ...
            .build();
}

동일한 Reader 구현을 모든 워커가 사용하지만, 각 워커는 서로 다른 파라미터를 주입받아 서로 다른 데이터 범위만 처리한다

파티셔닝 구성

ManagerStep 구성

@Bean
public Step managerStep(Step workerStep) {
    return new StepBuilder("managerStep", jobRepository)
            .partitioner("workerStep", dailyTimeRangePartitioner) // Partitioner 주입
            .step(workerStep)             // 워커 스텝 지정
            .taskExecutor(taskExecutor()) // 병렬 실행용 스레드 풀
            .gridSize(4)                  // 파티션 개수
            .build();
}

partitioner(stepName, partitioner): 이 메서드를 호출하면 Spring Batch가 해당 스텝을 PartitionStep으로 생성한다
- 첫 번째 인자: 워커 스텝의 식별 이름
- 두 번째 인자: 데이터 분할 전략을 담은 Partitioner 구현체
step(workerStep): 실제 데이터를 처리할 워커 스텝을 지정한다. ManagerStep은 이 워커를 파티션 개수만큼 복제하여 실행한다
gridSize(n): 생성할 파티션 개수. Partitioner.partition(gridSize)의 인자로 전달된다

WorkerStep 구성

@Bean
public Step workerStep() {
    return new StepBuilder("workerStep", jobRepository)
            .<Input, Output>chunk(500, transactionManager)
            .reader(reader)       // @StepScope로 파티션별 인스턴스 생성
            .processor(processor)
            .writer(writer)
            .build();
}

일반적인 청크 지향 스텝과 구성이 동일하다 (Tasklet 방식도 가능)
정의는 하나지만, 실행 시 파티션 개수만큼 별도의 StepExecution으로 복제되어 병렬 실행된다

TaskExecutor 설정

gridSize와 스레드 풀 크기를 일치시키는 것이 권장된다
- 풀 크기 < 파티션 수: 일부 파티션이 대기해야 하므로 병렬 처리 이점이 감소
- 풀 크기 > 파티션 수: 남는 스레드가 리소스만 낭비
- 풀 크기 = 파티션 수: 각 파티션이 전용 스레드를 할당받아 대기 없이 즉시 처리

다중 계층 병렬화: 파티셔닝 + 멀티스레드 스텝

워커 스텝 자체를 멀티스레드 스텝으로 구성하면, 두 레벨의 병렬화를 중첩할 수 있다
- 파티셔닝: StepExecution 레벨에서 데이터 분할 병렬화
- 멀티스레드 스텝: 각 파티션 내부에서 청크 처리 병렬화
- 예: 4개 파티션 × 5개 워커 스레드 = 20개 동시 처리

구현

워커 스텝에 taskExecutor()를 추가하면 된다
멀티스레드 환경이므로 SynchronizedItemStreamReader로 Reader를 감싸야 한다
스레드 풀은 파티션용과 워커 멀티스레드용을 별도로 두는 것이 권장된다
- 하나의 큰 풀을 공유할 수도 있지만, 리소스 관리와 디버깅이 어려워짐

실제로 필요한가?

대부분의 경우 파티션 수를 늘리는 것이 더 단순하고 효과적이다
- 멀티스레드 스텝은 lock 경쟁 이슈가 여전히 존재하고, 스레드 풀 이중 관리로 복잡도가 증가
다중 계층 병렬화가 유효한 상황:
- 논리적 파티션 수에 제약이 있을 때: 비즈니스 규칙상 파티션을 5개까지만 나눌 수 있는데 가용 스레드가 20개인 경우, 파티션 내부 병렬화로 남는 스레드를 활용
- ItemProcessor가 병목일 때: 파티션을 늘려도 각 파티션 내 아이템 처리가 순차적이므로, 개별 아이템 처리가 느리면 파티션 내부 병렬화가 필요

파일 기반 파티셔닝

DB 기반 vs 파일 기반

DB 기반: ExecutionContext에 쿼리 범위값(startDateTime, endDateTime)을 전달하여, 같은 데이터 소스에서 범위를 나눠 읽음
파일 기반: 각 파티션이 서로 다른 파일을 완전히 독립적으로 처리. 데이터 소스 자체가 분리되어 있으므로 더 단순하다

MultiResourcePartitioner

Spring Batch가 제공하는 파일 기반 Partitioner 구현체
Resource[] 배열을 받아 각 파일마다 ExecutionContext를 생성하고, "fileName" 키에 파일 URL을 저장한다
gridSize를 무시하고 파일 개수만큼 파티션을 생성한다 (100개 파일 → 100개 파티션)
저장되는 파일 경로는 URL 형식(file://...)이므로, Reader에서 Resource로 변환하여 사용해야 한다

@Bean
@StepScope
public Partitioner partitioner(@Value("#{jobParameters['path']}") String path) {
    MultiResourcePartitioner partitioner = new MultiResourcePartitioner();
    Resource[] resources = new PathMatchingResourcePatternResolver()
            .getResources("file://" + path + "/*.csv");
    partitioner.setResources(resources);
    return partitioner;
}

FlatFileItemWriter 주의사항

@StepScope로 선언하면 파티션마다 별도의 FlatFileItemWriter 인스턴스가 생성된다
이때 모든 인스턴스가 동일한 출력 파일을 타겟으로 하면 데이터 충돌이 발생한다
따라서 파티션마다 서로 다른 출력 파일에 기록하도록 구성해야 한다

결과 파일 병합

파티셔닝으로 분산 처리한 결과를 하나로 합치려면, 파티셔닝 스텝 이후 별도의 병합 스텝을 추가한다
SystemCommandTasklet으로 OS 명령(예: cat *.out > merged.log)을 실행하여 통합
파티셔닝 스텝이 완료된 후에 병합 스텝이 실행되므로 데이터 일관성이 보장된다

@Bean
public Job fileJob(Step managerStep, Step mergeStep) {
    return new JobBuilder("fileJob", jobRepository)
            .start(managerStep)
            .next(mergeStep)    // 파티셔닝 완료 후 병합
            .build();
}

PartitionStep 내부 동작

StepBuilder.partitioner()를 호출하면 PartitionStepBuilder가 생성되고, 최종적으로 PartitionStep이라는 특수한 Step 구현체가 만들어진다
별도 지정이 없으면 기본 컴포넌트가 자동 구성된다:
- TaskExecutorPartitionHandler: 워커 스텝, TaskExecutor, gridSize를 보유하며 병렬 실행을 담당
- SimpleStepExecutionSplitter: Partitioner를 사용해 파티션별 StepExecution을 생성

실행 흐름: 3단계

분할(Split): SimpleStepExecutionSplitter.split()이 Partitioner.partition(gridSize)를 호출하여 ExecutionContext 맵을 받고, 각 엔트리마다 워커 StepExecution을 생성하여 Set<StepExecution>으로 반환
병렬 실행(Parallel Execution): TaskExecutorPartitionHandler.doHandle()이 각 StepExecution을 FutureTask로 감싸 TaskExecutor에 제출하고, step.execute(stepExecution)을 병렬 호출
결과 통합(Aggregation): StepExecutionAggregator.aggregate()가 모든 워커의 실행 결과를 매니저 StepExecution에 병합

DefaultStepExecutionAggregator

상태: BatchStatus.max()로 취합 — 워커 중 하나라도 FAILED이면 매니저도 FAILED
종료 코드: ExitStatus.and()로 취합 — 하나라도 비정상이면 비정상
카운트: readCount, writeCount, commitCount, rollbackCount, skipCount 등 모든 표준 카운트를 합산

커스텀 Aggregator

워커가 ExecutionContext에 저장한 커스텀 데이터(예: 처리 금액 총합)를 매니저 결과에 반영하려면 StepExecutionAggregator를 직접 구현한다
.aggregator(customAggregator)로 매니저 스텝 빌더에 지정