drift.log

Tag: memory

1 item with this tag.

  • Apr 16, 2026

    t4g.medium 위에서 Pod가 죽지 않는 이유

    • aws
    • eks
    • kubernetes
    • memory
    • oom
    • troubleshooting
    • type/engineering-journal

Recent Posts

  • t4g.medium 위에서 Pod가 죽지 않는 이유

    t4g.medium 노드에서 Pod가 31분 동안 Terminating 상태에 멈춰 있었다. 노드 메모리 고갈로 인한 커널 OOM killer의 개입과 kubelet 사망까지 이어진 연쇄 장애를 추적한 기록.

    Apr 16, 2026

    • aws
    • eks
    • kubernetes
    • memory
    • oom
    • troubleshooting
    • type/engineering-journal
  • 단 하나의 파드가 만든 블랙아웃: Tempo Ingester 연쇄 OOM 추적하기

    Ingester 파드 하나의 OOM이 어떻게 전체 Observability 스택을 마비시켰는지, 그리고 왜 파드가 스스로 복구하지 못하고 무한 재시작 루프에 빠졌는지 추적한 3개월간의 기록입니다.

    Apr 10, 2026

    • engineering-journal
    • observability
    • tempo
    • oom
    • kubernetes
    • troubleshooting
  • Tempo compactor retention 톺아보기

    retention을 14일로 바꿨는데 예상한 boundary보다 30분 이른 시각의 trace가 살아있었다. search API와 compactor 로그, object storage block metadata를 따라 그 이유를 파고든 기록.

    Apr 09, 2026

    • observability
    • tempo
    • troubleshooting
    • type/engineering-journal
  • Pod가 정상인데.. 504가 뜬다구요?

    EKS에서 새 서비스를 배포했는데 ALB가 504를 반환했다. Pod는 정상이었고, 원인은 terraform-aws-eks 모듈의 attach_cluster_primary_security_group 옵션이 LB Controller의 SG 자동 관리와 충돌한 것이었다.

    Mar 31, 2026

    • aws
    • eks
    • security-group
    • terraform
    • type/engineering-journal

Created with Quartz v4.5.2 © 2026

  • GitHub
  • LinkedIn