step-functions

O loop improdutivo que multiplicou nossa conta AWS por quase 6x em quatro madrugadas

Case real de um incidente AWS: uma regressão sutil em uma lambda fez uma Step Function reinvocar a mesma tarefa por quatro madrugadas. A conta do mês saltou quase 6x (mesmo com AWS Cost Anomaly Detection habilitado). Como contivemos, como negociamos a concessão com a AWS via Infomach e TD Synnex, e quais guard rails entraram em pé. Case público para que outros times não descubram essa categoria de falha do mesmo jeito que a gente descobriu.