LCC 243 - Interview SRE avec Nicolas Helleringer et Maxime Brugidou - partie 1
Nicolas et Maxime de Criteo partagent avec Emmanuel leur expérience de mise en place d’une organisation SRE (Site Reliability Engineering).
Enregistré le 12 novembre 2020
Téléchargement de l’épisode LesCastCodeurs-Episode-243.mp3
Interview
Ta vie, ton oeuvre
Twitter Nicolas
Twitter Maxime
Criteo Labs
SRE en 2 phrases
Site Reliability Engineering C’est une façon de monter un salaire de sysadmin ?
Pourquoi
Ops et dev, pourquoi “merger” ?
DevOps avec un sysadmin dans l’équipe vs SRE
Cela a du sens de le faire sur un “petit projet” ou uniquement si on gère 300k machines ?
SRE au quotidien
Journée type
Dashboard
On code en quoi?
Pager (pendant les horaires travails vs dehors)
Les weekends
Taille SRE pour du 24/7
Combien de fois est-on appelé par nuit ? Prod fallback
Le development
Concepts intéressants
50% eng
SLO SLI SLA
La difficulté de la valeur initiale
Perf passées vs calcul théorique
Error budget
Blast radius
Burn rate
Pré conclusion
C’est la fin de la partie 1 de cette interview
Nous contacter
Soutenez Les Cast Codeurs sur Patreon https://www.patreon.com/LesCastCodeurs
Faire un crowdcast ou une crowdquestion
Contactez-nous via twitter https://twitter.com/lescastcodeurs
sur le groupe Google https://groups.google.com/group/lescastcodeurs
ou sur le site web https://lescastcodeurs.com/