TIL

10장 일괄 처리

유닉스 도구로 일괄 처리하기

단순 로그 분석

cat /var/log/nginx/access.log |
awk '{print $7}' |
sort |
uniq -c |
sort -r -n |
head -n 5

유닉스 철학

맵리듀스와 분산 파일 시스템

맵리듀스 작업 실행하기

리듀스 사이드 조인과 그룹화

일괄 처리 워크플로의 출력

하둡과 분산 데이터베이스의 비교

맵리듀스를 넘어

중간 상태 구체화

그래프와 반복 처리