Esta guía proporciona soluciones rápidas a los errores más comunes en servicios de AWS como EC2, S3, IAM, Load Balancers y Bases de Datos, entre otros . Utilícela como primer paso para diagnosticar y resolver incidencias de forma autónoma y eficiente.
Usaré algunas palabras en inglés para mayor comprensión, sobre todo en los nombres de los servicios.

Problemas con S3 y IAM
Bucket S3 No Permite Acceso Público
Pasos para la Solución de Problemas:
Verifique la configuración “Bloquear todo el acceso público” en S3.
Modifique las ACL del bucket para permitir lectura pública (GetObject).
Actualice la política del bucket con los permisos apropiados.
Utilice pre-signed URLs para acceso seguro si es necesario.
Verifique los permisos de IAM para acceso anónimo.
Usuario de IAM No Puede Asumir Rol
Pasos para la Solución de Problemas:
Revise la política de confianza del rol de IAM (sts:AssumeRole).
Asegúrese de que MFA esté habilitado si se requiere.
Verifique que la duración de la sesión esté configurada correctamente.
Use AWS STS para asumir el rol manualmente y diagnosticar el problema.
Revise los registros de CloudTrail en busca de denegaciones de políticas.
Error al Cargar Objetos en S3
Pasos para la Solución de Problemas:
Asegúrese de tener los permisos correctos (s3:PutObject).
Verifique la configuración de cifrado del bucket (si está aplicada).
Confirme los límites de tamaño del objeto (5GB para una sola carga).
Use multipart upload para archivos grandes.
Revise los errores del SDK de AWS o las credenciales mal configuradas.
Autenticación de CLI de AWS Fallando
Pasos para la Solución de Problemas:
Ejecute aws configure y verifique las credenciales.
Asegúrese de que el archivo ~/.aws/credentials exista y sea válido.
Verifique los permisos de IAM.
Revise las variables de entorno (AWS_ACCESS_KEY_ID).
Actualice la CLI de AWS a la versión más reciente.
Reglas de Ciclo de Vida de S3 No Eliminan Objetos
Pasos para la Solución de Problemas:
Asegúrese de que las reglas de ciclo de vida estén configuradas correctamente.
Revise los filtros de prefijos y etiquetas en la política.
Verifique los permisos de IAM (s3:DeleteObject).
Elimine un objeto manualmente para probar.
Revise AWS Config en busca de conflictos de políticas.
Control de Versiones de Bucket S3 No Funciona
Pasos para la Solución de Problemas:
Asegúrese de que el control de versiones esté habilitado (S3 → Bucket → Propiedades).
Verifique los permisos para s3:PutObjectVersion.
Confirme que las políticas de ciclo de vida no estén eliminando versiones antiguas.
Use la CLI de AWS aws s3api list-object-versions para confirmar.
Revise los registros de CloudTrail en busca de cambios en el control de versiones.
Aceleración de Transferencia de S3 No Funciona
Pasos para la Solución de Problemas:
Asegúrese de que la aceleración esté habilitada (S3 → Bucket → Propiedades).
Use el endpoint correcto (.s3-accelerate.amazonaws.com).
Verifique la compatibilidad con la región de AWS.
Pruebe con la CLI de AWS aws s3 cp –endpoint-url.
Verifique la configuración de CloudFront si se usa con S3.
Rol de Instancia EC2 No Puede Acceder a S3
Pasos para la Solución de Problemas:
Verifique el rol de IAM adjunto a la instancia (EC2 → Rol de IAM).
Asegúrese de tener los permisos correctos (s3:ListBucket, s3:GetObject).
Confirme que el servicio de metadatos de la instancia (IMDSv2) sea accesible.
Ejecute aws s3 ls desde la instancia para probar.
Revise los registros de CloudTrail en busca de errores de permisos.
Clave de Acceso de IAM Comprometida
Pasos para la Solución de Problemas:
Inmediatamente deshabilite o elimine la clave en IAM.
Rote las credenciales y actualice todos los servicios que usan la clave.
Revise CloudTrail en busca de llamadas API sospechosas.
Exija MFA para todos los usuarios.
Revise las políticas de seguridad y limite los permisos excesivos.
Problemas con EC2 y el Balanceador de Carga
Instancia Spot de EC2 Terminada Repentinamente
Pasos para la Solución de Problemas:
Revise el historial de precios spot (EC2 → Spot Requests).
Establezca una oferta máxima más alta para precios spot.
Use Spot Fleet o instancias On-Demand para mayor confiabilidad.
Revise las políticas de Auto Scaling de AWS para reemplazar instancias terminadas.
Almacene datos importantes en almacenamiento persistente (EBS o S3).
Grupo de Auto Scaling No Lanza Instancias
Pasos para la Solución de Problemas:
Verifique la plantilla de lanzamiento o configuración en busca de errores.
Asegúrese de que la AMI utilizada sea válida y accesible.
Confirme los límites de instancias para su cuenta de AWS.
Compruebe si existe un problema de subred/IP insuficiente.
Revise las políticas de escalado y las alarmas de CloudWatch.
Instancia EC2 Bloqueada en Estado “Inicializando”
Pasos para la Solución de Problemas:
Revise las métricas de CloudWatch para el uso de CPU, disco y memoria.
Verifique si las comprobaciones de estado de la instancia están fallando.
Reinicie la instancia y compruebe si supera las comprobaciones de salud.
Examine los archivos /var/log/messages o /var/log/syslog usando SSH.
Si el problema persiste, cree una nueva instancia a partir de un snapshot.
Considere aumentar el tamaño de la partición xvda1.
ELB No Acepta Solicitudes HTTPS
Pasos para la Solución de Problemas:
Asegúrese de que hay un certificado SSL adjunto al ELB (ACM → Certificates).
Verifique que el listener esté configurado para HTTPS (443).
Revise las reglas del grupo de seguridad que permiten el puerto 443.
Confirme que las instancias backend acepten tráfico HTTPS.
Revise los registros en CloudTrail y CloudWatch en busca de errores relacionados con SSL.
Alta Utilización de CPU en EC2
Pasos para la Solución de Problemas:
Revise las métricas de CloudWatch en busca de picos en el uso de CPU.
Use top o htop para identificar procesos que consumen mucha CPU.
Reinicie procesos pesados u optimice el código de la aplicación.
Considere aumentar el tipo de instancia (escalado vertical).
Use Auto Scaling (escalado horizontal) si es necesario.
Instancia EC2 Sin Espacio en Disco → Ubuntu Linux
Pasos para la Solución de Problemas:
Ejecute df -hT para verificar el uso del disco.
Identifique archivos grandes con du -sh /* | sort -h.
Limpie logs (/var/log/) o muévalos a S3.
Extienda el volumen mediante la Consola de AWS (EC2 → Volumes → Modify Volume).
Redimensione el sistema de archivos con sudo resize2fs /dev/xvdf.
Balanceador de Carga Elástico (ELB) No Distribuye Tráfico
Pasos para la Solución de Problemas:
Asegúrese de que las instancias objetivo estén saludables (Load Balancer → Target Groups → Health Status).
Verifique que los grupos de seguridad y NACL permitan tráfico hacia y desde el ELB.
Confirme que los listeners estén configurados correctamente (ej: HTTP/HTTPS en los puertos correctos).
Asegúrese del registro de instancias adecuado en el Target Group.
Revise las métricas de CloudWatch para patrones de tráfico del ELB.
Instancia EC2 Terminada Inesperadamente
Pasos para la Solución de Problemas:
Revise los registros de CloudTrail en busca de eventos de terminación.
Verifique la configuración de Auto Scaling de AWS (si está en un grupo).
Compruebe si la instancia alcanzó un límite de facturación o precio de spot.
Revise la configuración de protección contra terminación en EC2.
Restaure la instancia usando una AMI o snapshot.
No Se Puede Conectar por SSH a Instancia EC2
Pasos para la Solución de Problemas:
Verifique que el grupo de seguridad tenga reglas de entrada que permitan SSH (puerto 22).
Asegúrese de que la instancia tenga una IP pública o IP elástica asignada.
Confirme que el par de claves utilizado coincida con el asignado a la instancia.
Use la consola serie de EC2 para diagnóstico si SSH no es accesible.
Reinicie la instancia e intente conectarse nuevamente.
Problemas Aurora & RDS, dynamoDB y Bases de Datos.
Alta Utilización de CPU en RDS
Pasos para la Solución de Problemas:
Revise las métricas de CloudWatch para el uso de CPU (RDS → Monitoring).
Identifique consultas lentas usando Performance Insights.
Ejecute SHOW PROCESSLIST; (MySQL) o consulte pg_stat_activity (PostgreSQL) para detectar consultas de larga duración.
Escale verticalmente la instancia u optimice consultas e índices.
Habilite réplicas de lectura para distribuir la carga.
Tiempo de Espera de Conexión a RDS Agotado
Pasos para la Solución de Problemas:
Confirme que la base de datos esté ejecutándose (RDS → Instancias → Status).
Revise los grupos de seguridad de la VPC y asegúrese de que las reglas de entrada permitan el acceso.
Verifique el grupo de subred y si la base de datos está en la zona de disponibilidad correcta.
Intente conectarse desde otra instancia dentro de la misma VPC.
Asegúrese de que el Acceso Público esté habilitado si se accede desde fuera de AWS.
Instancia de RDS No Se Conecta
Pasos para la Solución de Problemas:
Verifique que la instancia de RDS esté en estado “available” (RDS → Instancias).
Revise los grupos de seguridad y permita tráfico entrante en el puerto correcto (ej: 3306 para MySQL, 5432 para PostgreSQL).
Asegúrese de que las credenciales de la base de datos sean correctas.
Confirme que el grupo de parámetros y el grupo de subred de la base de datos estén configurados correctamente.
Pruebe la conexión usando telnet >PUERTO> o nc -zv .
Almacenamiento de Base de Datos RDS Lleno
Pasos para la Solución de Problemas:
Revise RDS → Monitoring → Free Storage Space.
Aumente el almacenamiento asignado (Modify Instance → Storage).
Identifique tablas grandes con:
SELECT table_schema, table_name, round(sum(data_length + index_length) / 1024 / 1024, 2) FROM information_schema.tables GROUP BY table_schema, table_name;
Elimine datos antiguos o innecesarios.
Habilite el escalado automático de almacenamiento para prevenir problemas futuros.
Conmutación por Error Multi-AZ de RDS No Funciona
Pasos para la Solución de Problemas:
Verifique si Multi-AZ está habilitado (RDS → Modify Instance).
Asegúrese de que la instancia en espera esté disponible (RDS → Events).
Fuerce manualmente una conmutación por error (Actions → Failover).
Verifique la resolución DNS del endpoint (nslookup ).
Si es necesario, reinicie la instancia primaria y pruebe la conmutación por error nuevamente.
No Se Puede Restaurar Snapshot de RDS
Pasos para la Solución de Problemas:
Verifique el estado del snapshot (RDS → Snapshots → Status).
Asegúrese de que el snapshot no esté cifrado con una clave KMS faltante.
Elija un tipo de instancia compatible al restaurar.
Confirme que se usen la VPC y los grupos de seguridad correctos.
Revise los registros de CloudTrail en busca de errores relacionados con permisos.
Réplica de Lectura de RDS Retrasada Respecto a la Primaria
Pasos para la Solución de Problemas:
Verifique el estado de la replicación (SHOW SLAVE STATUS; para MySQL, pg_stat_replication para PostgreSQL).
Aumente el tamaño de la instancia si la réplica es insuficiente.
Ajuste la configuración de replicación (rds_replica_transaction_apply_delay).
Reduzca la carga de escritura en la instancia primaria.
Reinicie la instancia réplica y monitoree el rendimiento.
Problemas de Respaldo y Restauración en DynamoDB
Pasos para la Solución de Problemas:
Verifique el estado del respaldo (DynamoDB → Backups).
Asegúrese de tener los permisos de IAM adecuados (dynamodb:CreateBackup, dynamodb:RestoreTableFromBackup).
Compruebe si la región de restauración es compatible.
Si la restauración falla, intente exportar a S3 y re-importar manualmente.
Use Point-in-Time Recovery (PITR) para reversión automatizada.
Errores de Limitación en DynamoDB (Rendimiento Aprovisionado Excedido)
Pasos para la Solución de Problemas:
Revise los registros de CloudWatch en busca de ThrottledRequests.
Aumente la capacidad de lectura/escritura (DynamoDB → Tables → Capacity).
Habilite Auto Scaling para prevenir limitaciones futuras.
Use retroceso exponencial en las solicitudes API.
Considere habilitar DAX (DynamoDB Accelerator) para cargas de trabajo intensivas en lectura.
Tabla de DynamoDB No Escala
Pasos para la Solución de Problemas:
Revise las métricas de CloudWatch para ReadCapacityUnits y WriteCapacityUnits.
Verifique que Auto Scaling esté habilitado en DynamoDB → Tables → Capacity.
Si está aprovisionado manualmente, aumente la capacidad.
Optimice las consultas para reducir el número de solicitudes de lectura/escritura.
Use DAX (DynamoDB Accelerator) para mejorar el rendimiento de lectura.
Esta guía integral proporciona metodologías probadas para diagnosticar y resolver eficientemente los problemas más frecuentes en los servicios centrales de AWS, incluyendo EC2, S3, IAM, Load Balancers y bases de datos (Aurora & RDS/DynamoDB). Al seguir estos procedimientos sistemáticos de solución de problemas, podrá mantener la salud operativa de su infraestructura en la nube, minimizando tiempos de inactividad y optimizando el rendimiento de sus aplicaciones.