Processus MCO
Implémentation : voir sql/maintenance/ et monitoring/
Cycle de maintenance hebdomadaire
Processus de gestion d'incident
1. Détection
Azure Monitor déclenche une alerte (6 règles configurées)
Ou anomalie détectée via tableau de bord Power BI
Ou requête de supervision manuelle (log_errors_last24h.sql)
2. Qualification
Exécuter dans Azure SQL Query Editor :
-- Vérifier l'état des ressources
SELECT * FROM sys . dm_db_resource_stats ORDER BY end_time DESC ;
-- Identifier les sessions bloquantes
SELECT blocking_session_id , session_id , wait_type , wait_time
FROM sys . dm_exec_requests WHERE blocking_session_id > 0 ;
3. Correction
Type d'incident
Action
Pipeline silencieux
Redémarrer le job Stream Analytics
Fragmentation index > 30%
Exécuter index_maintenance.sql (REBUILD)
Données corrompues / orphelines
Exécuter check_integrity.sql, corriger manuellement
Base indisponible
Déclencher PITR via restore_procedure.sh
4. Reprocess
5. Documentation
Consigner l'incident dans le registre MCO (date, durée, cause, action corrective)
Mettre à jour les runbooks si nécessaire
Indicateurs de santé en continu
Fréquence
Requête
Seuil d'alerte
Toutes les 5 min
log_errors_last24h.sql
Niveau ALERTE détecté
Toutes les 5 min
data_freshness.sql
Pipeline silencieux > 10 min
Mensuelle
sla_availability.sql
Disponibilité < 99,9%
Hebdomadaire
check_integrity.sql
Score cohérence < 75
Commandes opérationnelles
# Contrôle intégrité
sqlcmd -S sql-server-rg-e6-sbuasa.database.windows.net \
-U sqladmin -P 'P@ssw0rd!2024' \
-d dwh-shopnow -i sql/maintenance/check_integrity.sql -C
# Maintenance index
sqlcmd -S sql-server-rg-e6-sbuasa.database.windows.net \
-U sqladmin -P 'P@ssw0rd!2024' \
-d dwh-shopnow -i sql/maintenance/index_maintenance.sql -C
# Backup BACPAC
SQL_ADMIN_PASSWORD = 'P@ssw0rd!2024' bash sql/backups/backup_full.sh
# Vérifier les backups disponibles
az storage blob list \
--account-name stshopnowbackup \
--container-name sql-backups \
--output table --auth-mode key
Niveaux d'escalade
Niveau
Délai
Responsable
Action
L1
0–30 min
DBA
Diagnostic dashboard + alertes Azure Monitor
L2
30–60 min
Data Engineer
Analyse pipeline + exécution scripts
L3
> 60 min
Architecte
Décision restore / escalade métier