Auto Scaling — 탄력적 인프라

25
1 / 14

Auto Scaling — 탄력적 인프라

2022년 6월, 대형 할인 행사 직전. 한 국내 이커머스 팀의 인프라 담당자는 불안했습니다. 평소 하루 방문자 30만 명이던 서비스가, 다음 날 오전 10시 행사 시작과 동시에 300만 명이 몰릴 것으로 예측됐습니다. 트래픽이 10배 늘어납니다.

그 팀이 선택한 방법은 두 가지 중 하나였습니다.

선택 A: 평소의 10배에 해당하는 EC2 서버를 미리 켜놓는다. 행사가 끝난 후 9대는 그대로 방치한다. 한 달 추가 비용: 약 $4,500.

선택 B: Auto Scaling을 구성해 트래픽이 늘어나면 자동으로 서버가 추가되고, 행사가 끝나면 자동으로 줄어들도록 설정한다. 행사 당일 피크 4시간 동안만 추가 비용이 발생한다. 추가 비용: 약 $90.

이 레슨을 마치면 다음을 이해할 수 있습니다:

  • 고정 서버 운영의 한계와 Auto Scaling이 해결하는 문제
  • ASG(Auto Scaling Group)의 핵심 구성 요소 — Launch Template, 최소/최대/희망 용량
  • 스케일링 정책 3가지 — Target Tracking, Step Scaling, Scheduled Scaling
  • Scale Out/In 흐름 — CloudWatch 알람과 쿨다운 기간
  • 실무에서의 이벤트 트래픽 대응 전략
고정 서버(낭비) vs Auto Scaling(탄력적) 두 시나리오 비교

사전 지식: 이 레슨은 EC2 인스턴스, VPC, ALB(Application Load Balancer)의 기본 개념을 이미 이해한 분을 대상으로 합니다. ALB가 낯설다면 ALB와 로드 밸런싱 이해하기 레슨을 먼저 읽어보세요.