Auto Scaling 그룹에서 운영하는 모든 서버 자원(CPU Usage, Load Average, Memory Usage 등)을 모니터링할 수 있습니다. 자원별 임계치를 설정하고 임계치를 기준으로 모니터링하여 서버 수를 자동으로 조정합니다. 신규 서비스 출시를 앞두고 유연한 인프라 증설이 필요한 경우, 서비스 출시 후 사용자 트래픽을 예측하기 어려운 경우에 적합합니다.
<예시> 모니터링 시 CPU 사용량이 50% 이상이면 서버 증량
서비스 특성에 따라 고객 트래픽이 몰리는 특정 시간에만 서버를 증량할 수 있습니다. 시간대별로 서비스 트래픽 차이가 크거나 일괄 처리 작업을 진행하는 시간이 정해져 있는 경우에 적합합니다.
<예시> 사용자가 많은 오후 5시~11시 사이에는 서버 5대를 추가하고, 11시 이후에는 추가한 서버를 반납하여 기존 서버 수로 운영
서버 모니터링 중 서버가 다운되거나 응답이 없을 경우 해당 서버를 서비스에서 제외하고, 똑같은 구성의 서버를 자동으로 생성하여 서비스 가용성과 안정성을 유지합니다.
Auto Scling 기능을 통해 서버를 반납할 경우 먼저 생성된 서버부터 반납되는 것이 기본 설정입니다. 만약 생성 순서와 관계 없이 특정 서버를 우선 반납하고 싶을 경우 API 질의 방식으로 반납 대상 서버를 지정할 수 있습니다. 특히 이용률이 낮은 서버부터 반납될 수 있도록 지정할 수 있어 운영 비용을 효율적으로 관리할 수 있습니다.