1. | 빅데이터의 이해 | HDFS, 맵리듀스, 스파크 탄생 배경 | ||
2. | 스파크 개요 | 기능 구성, 하둡 vs. 스파크, RDD 개요, 배치 및 실시간 처리 개요 | ||
3. | 스파크 설치 및 실행 | 스파크 설치, 주피터 노트북 설치, 실행 방법 | ||
4. | 스파크 기본 아키텍처 및 간단 기능 확인 | 기본 아키텍처, 어플리케이션, 다양한 데이터 프레임, 트랜스포메이션, 액션 | ||
5. | 구조적 API 및 기본 연산 | 스키마, 구조적 타입 개요, 구조적 API 실행과정 | ||
6. | 집계 연산 | 집계함수, 그룹화, 윈도우 함수, 그룹화 셋 | ||
7. | 조인 | 조인 표현식, 조인 타입, 수행 방식 | ||
8. | SQL | JDBC/ODBC 연결, SQLite | ||
9. | 스파크 SQL | 하이브, 스파크 SQL 쿼리 실행 방법 | ||
10. | RDD | 저수준 API, RDD 다루기 |