Azure · AZ-305
Supervisión y resiliencia en Azure (AZ-305)
1. Azure Monitor y métricas
Azure Monitor recopila telemetría de recursos, apps y usuarios. Ofrece métricas (numéricas) y logs (detallados).
- Métricas: disponibles en tiempo real; visualización con gráficos.
- Workbooks: paneles personalizables.
- Action Groups: SMS, correo, webhook, Logic App o función.
Todas las alertas y dashboards se basan en Azure Monitor, no en herramientas externas.
2. Log Analytics y diagnóstico
- Workspace central: recopila logs de varias suscripciones.
- Diagnostic Settings: envían logs de actividad y recursos.
- KQL (Kusto Query Language): filtra y analiza eventos.
AzureActivity | where ActivityStatusValue=="Failure" | summarize count() by Caller
3. Alertas y automatización
- Alert Rules: disparan acciones ante condiciones (CPU>80%, error 500).
- Autoscale: ajusta instancias automáticamente.
- Logic Apps / Automation Runbooks: ejecutan respuesta automática.
4. Continuidad y recuperación
- Azure Backup: copias con retención y encriptadas.
- Site Recovery (ASR): orquesta failover entre regiones o sitios.
- Availability Zones: 3 zonas independientes por región.
- Geo-redundancia: Storage GRS/RA-GRS replica entre regiones.
5. Patrón de alta disponibilidad
App Tier: Load Balancer + VMSS / App Service
DB Tier: SQL MI / Cosmos DB (multi-region)
Storage: GRS + soft delete
Networking: LB + zonas de disponibilidad
El objetivo de diseño es ≥99.9% SLA con redundancia por capa.
6. Checklist de examen
- Azure Monitor + Log Analytics + Action Groups.
- ASR para recuperación, Backup para protección.
- Zonas de disponibilidad y GRS.
- Autoscale + alertas = resiliencia operativa.