Hola, que tal. Quería compartirles el excelente reporte de daños que preparó la gente de Slack, a propósito del problema que tuvieron a fines de septiembre cuando estuvieron dando SERVFAIL por varias horas:
https://slack.engineering/what-happened-during-slacks-dnssec-rollout/
Lamentablemente y pese a todas sus pruebas, se toparon con un bug en la implementación de DNSSEC de AWS Route 53, y al intentar hacer rollback cometieron un error grave: retiraron el DS en el padre (.com), pero sacaron de inmediato las llaves y firmas de slack.com, sin esperar el TTL !!
Hay varias conclusiones valiosas que salen de acá. De estos errores y de su excelente post-mortem se aprende mucho.
Saludos,
Hugo