Spring Batch 입문: 3시간 만에 끝내는 대용량 처리의 기초
✅ 1. 배치 처리라는 것은 무엇일까?
배치(Batch) 처리는 대량의 데이터를 정해진 시간에 자동으로 일괄 처리하고, 결과를 출력하는 방식을 의미함.
✅ 2. Scheduler vs Batch
1) Scheduler
- 간편함 :
@Scheduled 어노테이션 하나로 빠르게 구현 가능.
- 단순 처리 : 주로 소량의 데이터를 주기적으로 처리할 때 적합.
- 만약 단순 반복 Loop로 100만명에게 쿠폰을 지급한다면?
- 메모리 부족 (OOM): 100만 건을 한 번에 List로 불러올 경우 서버 메모리가 초과될 수 있음.
- 복구 불가능: 50만 번째에서 에러 발생 시, 지급 완료자와 미지급자를 DB에서 직접 대조해야 함. (처음부터 다시 돌리면 중복 지급 위험)
- 관리 포인트 부재: 현재 몇 건이 성공했는지, 실행 시간이 얼마나 걸렸는지 확인하려면 로그를 일일이 다 뒤져야 함.
2) Batch
- 대용량 특화: 데이터를 일정한 크기(Chunk)로 잘라서 처리하므로 메모리 사용량이 일정하고 안정적임.
- 견고함 (Restartability): 실패 시 메타데이터를 참조하여, 실패한 지점(50만 1번째)부터 정확히 재시작 가능.
- 모니터링 & 통계: 프레임워크가 실행 이력(성공 여부, 소요 시간, 처리 건수 등)을 전용 DB 테이블에 자동으로 기록.
✅ 3. 배치 실무 활용 사례
- 리포트 생성: 전날의 매출 통계나 데이터를 집계하여 보고서 생성
- 정산 시스템: 결제 내역을 바탕으로 판매자에게 정산금 지급
- 데이터 정리: 오래된 로그 삭제 및 데이터 아카이빙
- 백업 및 마이그레이션: 대규모 데이터 이동 및 백업 작업