SRE
SRE signifie Site Reliability Engineering.
C’est une approche qui applique des pratiques d’ingénierie à la fiabilité des services en production.
Le SRE s’intéresse à la disponibilité, aux incidents, à l’observabilité, à l’automatisation et à la capacité de l’équipe à exploiter sereinement ce qu’elle construit.
Dans l’atelier
Quand l’IA accélère le delivery, le SRE regarde ce que cette vitesse fait à la production.
Plus de changements peuvent vouloir dire plus de valeur. Ils peuvent aussi vouloir dire plus de bruit, plus d’incidents, plus de charge mentale.
Exemple
Un SRE peut utiliser l’IA pour résumer un incident, explorer des logs ou proposer une hypothèse.
Mais la validation reste critique. Une hypothèse IA posée trop vite dans un incident peut envoyer l’équipe au mauvais endroit.
Piège classique
Voir le SRE comme celui qui nettoie derrière.
La fiabilité se construit dès la conception, pas seulement quand le barrage commence à fuir.
À retenir
Le SRE aide l’équipe à livrer vite sans oublier que la production existe.