Nicolas et Maxime de Criteo partagent avec Emmanuel leur expérience de mise en place d’une organisation SRE (Site Reliability Engineering).

Enregistré le 12 novembre 2020

Téléchargement de l’épisode LesCastCodeurs-Episode-243.mp3

Interview

Ta vie, ton oeuvre

Twitter Nicolas
Twitter Maxime
Criteo Labs

SRE en 2 phrases

Site Reliability Engineering C’est une façon de monter un salaire de sysadmin ?

Pourquoi

Ops et dev, pourquoi “merger” ?
DevOps avec un sysadmin dans l’équipe vs SRE
Cela a du sens de le faire sur un “petit projet” ou uniquement si on gère 300k machines ?

SRE au quotidien

Journée type

Dashboard

On code en quoi?

Pager (pendant les horaires travails vs dehors)
Les weekends

Taille SRE pour du 24/7

Combien de fois est-on appelé par nuit ? Prod fallback

Le development

Livre: le projet Unicorn

Concepts intéressants

50% eng

SLO SLI SLA
La difficulté de la valeur initiale
Perf passées vs calcul théorique

Error budget
Blast radius
Burn rate

Pré conclusion

C’est la fin de la partie 1 de cette interview

Nous contacter

Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Faire un crowdcast ou une crowdquestion
Contactez-nous via twitter https://twitter.com/lescastcodeurs
sur le groupe Google https://groups.google.com/group/lescastcodeurs
ou sur le site web https://lescastcodeurs.com/