Phase 2: 데이터 파이프라인 & AI
데이터 레이크와 ETL
Day 6실습
S3 + Glue + Athena로 서버리스 데이터 레이크를 구축하고 ETL 파이프라인을 실습합니다.
학습 목표
- S3 기반 데이터 레이크 계층 구조를 설계한다
- Glue Crawler와 ETL로 데이터를 변환한다
- Athena로 서버리스 SQL 분석을 수행한다
주요 내용
- 데이터 레이크
- S3
- Glue
- Crawler
- ETL
- Athena
- Parquet
관련 레슨
오늘의 실습
S3 + Glue + Athena 기반 서버리스 데이터 레이크 아키텍처 — CSV → Parquet 변환 및 파티셔닝 최적화
S3 (raw/ 버킷)S3 (processed/ 버킷)Glue CrawlerGlue Data CatalogGlue ETL Job+2개
6단계 실습 가이드 · 예상 비용 $0 ~ $3전체 실습 가이드 보기
연결된 미니 프로젝트
🏗️데이터 레이크 구축실습 가이드
S3 + Glue + Athena로 서버리스 데이터 레이크를 구축하고 CSV 데이터를 Parquet으로 변환하여 분석합니다