Azure · AZ-305

Supervisión y resiliencia en Azure (AZ-305)

1. Azure Monitor y métricas

Azure Monitor recopila telemetría de recursos, apps y usuarios. Ofrece métricas (numéricas) y logs (detallados).

  • Métricas: disponibles en tiempo real; visualización con gráficos.
  • Workbooks: paneles personalizables.
  • Action Groups: SMS, correo, webhook, Logic App o función.
Todas las alertas y dashboards se basan en Azure Monitor, no en herramientas externas.

2. Log Analytics y diagnóstico

  • Workspace central: recopila logs de varias suscripciones.
  • Diagnostic Settings: envían logs de actividad y recursos.
  • KQL (Kusto Query Language): filtra y analiza eventos.
AzureActivity | where ActivityStatusValue=="Failure" | summarize count() by Caller

3. Alertas y automatización

  • Alert Rules: disparan acciones ante condiciones (CPU>80%, error 500).
  • Autoscale: ajusta instancias automáticamente.
  • Logic Apps / Automation Runbooks: ejecutan respuesta automática.

4. Continuidad y recuperación

  • Azure Backup: copias con retención y encriptadas.
  • Site Recovery (ASR): orquesta failover entre regiones o sitios.
  • Availability Zones: 3 zonas independientes por región.
  • Geo-redundancia: Storage GRS/RA-GRS replica entre regiones.

5. Patrón de alta disponibilidad

App Tier: Load Balancer + VMSS / App Service
DB Tier: SQL MI / Cosmos DB (multi-region)
Storage: GRS + soft delete
Networking: LB + zonas de disponibilidad
    
El objetivo de diseño es ≥99.9% SLA con redundancia por capa.

6. Checklist de examen

  • Azure Monitor + Log Analytics + Action Groups.
  • ASR para recuperación, Backup para protección.
  • Zonas de disponibilidad y GRS.
  • Autoscale + alertas = resiliencia operativa.