AWS 구축 및 관리
•
Terraform과 Terragrunt를 이용해 IaC로 점진적으로 넘어가기 위한 구조 설계, 마이그레이션
•
Packer를 이용한 AWS EC2 AMI 관리
•
축소 보호 설정된 ECS on EC2 인스턴스가 Task가 없는데도 축소 보호 설정이 풀리지 않는 문제를 해소하기 위한 Lambda 작성. 이를 통해 낭비되는 EC2 인스턴스 제거
•
MySQL에서 Slow 쿼리가 발생하면 Slack으로 알림이 오도록 Lambda 구현
•
성능 테스트를 위해 nGrinder를 AWS ECS Fargate에 구축했습니다
•
SNS, SQS를 이용한 이벤트 기반 시스템 구축
•
FIS를 이용한 카오스 엔지니어링
•
MSK 클러스터 구축 및 운영 경험
•
ElastiCache 구축 및 운영 경험
•
Secrets Manager, Parameter Store를 통한 보안 정보 관리
•
EC2, ASG, ALB 기반의 서버 구축 및 운영 경험
•
ECS Fargate, ECS on EC2 구축 및 운영 경험
•
CodePipeline, CodeBuild, CodeDeploy를 이용한 CI / CD 구축
•
RDS MySQL → Aurora MySQL 마이그레이션
•
Aurora MySQL 5.6 → Aurora MySQL 5.7 업그레이드
모니터링 시스템
•
Prometheus와 Grafana를 이용해 모니터링 시스템 구축
•
IoT 서버군들의 핵심 지표를 모니터링 할 수 있는 대시보드 제작
•
query-exporter를 이용해 쿼리 결과를 Prometehus에 저장할 수 있도록 함
◦
이를 이용해 다른 팀들을 위한 대시보드 제작
•
prometheus-ecs-discovery를 이용해 Prometheus가 ECS Task로부터 지표를 가져올 수 있도록 구현
비용 절약
•
EC2 Sport Instance를 이용하여 비용 절약
•
EC2 사양을 최적화해 월 60만원 가량을 절약
•
ElasticSearch를 Datadog으로 이전 후 방치되고 있던 AWS OpenSearch를 제거해 월 200만원 가량 절약
•
거의 사용되고 있지 않던 AWS MSK 클러스터를 제거해 월 100만원 가량 절약
•
IoT 서버의 데이터베이스 접근을 최소화해 AWS RDS db.r5.4xlarge → db.r5.2xlarge로 변경. 이를 통한 월 110만원 가량 절약
•
IoT Biz와 IoT Relay 통신에 Kafka가 사용되고 있던 것을 Redis로 교체해 AWS MSK 클러스터 제거. 이를 통한 월 200만원 가량 절약