Gå tillbaka

SRE (Site Reliability Engineering)

Vad är SRE?

SRE (Site Reliability Engineering) är en disciplin som tillämpar mjukvaruutvecklingsprinciper på IT-drift för att skapa skalbara och tillförlitliga system. Konceptet skapades av Google och definierar hur driftsteam bör arbeta med automatisering, incidenthantering och kapacitetsplanering.

Nyckelkoncept i SRE

  • SLI/SLO/SLA: Service Level Indicators, Objectives och Agreements – mätbara mål för tillförlitlighet.
  • Error Budget: Accepterad nivå av otillförlitlighet som balanserar innovation med stabilitet.
  • Toil-eliminering: Systematisk minskning av manuellt, repetitivt arbete genom automation.
  • Postmortems: Skuldfria analyser av incidenter för att förbättra systemet.

SRE kompletterar DevOps med konkreta metoder och mätvärden för driftsäkerhet.

Andra relevanta ord i samma kategori