← Tous les articles

Ingénierie de fiabilité des sites et Scrum : construire pour la production

By XNM Technologies · March 27, 2023 · 1 min read
Ingénierie de fiabilité des sites et Scrum : construire pour la production

Un SLI (Service Level Indicator) est une mesure quantitative du comportement d'un service du point de vue de l'utilisateur (disponibilité, latence, taux d'erreur). Un SLO (Service Level Objective) est une cible pour un SLI — un engagement opérationnel que l'équipe doit maintenir et que le Product Owner devrait posséder. Le budget d'erreurs est le complément arithmétique du SLO : un SLO de disponibilité de 99,9 % laisse un budget d'indisponibilité d'environ 43 minutes par mois. Quand le budget est sain, l'équipe peut livrer de manière agressive; quand il est épuisé, la politique est de geler les nouvelles fonctionnalités jusqu'à ce qu'il se reconstitue. Cela transforme la tension fonctionnalités/fiabilité en une politique basée sur les données, convenue à l'avance.

  • Toil : travail opérationnel manuel, répétitif et automatisable. Mesurer la part de temps que l'équipe y consacre crée un arriéré de travail d'ingénierie.

  • Postmortems sans reproche : processus structuré d'apprentissage des incidents; les actions qui en découlent appartiennent au product backlog.

  • Introduire les concepts SRE progressivement — commencer par un seul SLO, un budget d'erreurs, un postmortem.

Si votre équipe Scrum peine à équilibrer la livraison de fonctionnalités avec les exigences de fiabilité d'un système en production, le conseil en exécution de programmes et de projets de XNM peut vous aider à concevoir un modèle de livraison qui intègre les principes SRE sans submerger une équipe encore en train de développer sa maturité Scrum.