On-Call bzw. Rufbereitschaft: Eine ewige Hass-Liebe?
Software-Engineers entwickeln die Applikationen. Doch wer maintained diese und bringt diese wieder zurück ins Leben, wenn die Applikationen mal abstürzen? Im klassischen Sinne sind das System-Administratoren. Und für die meisten in diesem Beruf gehört On-Call dazu. Doch ist dies auch im modernen Dev-Ops-Umfeld und in Voll-Autonomen Teams der Fall? Welche Herausforderungen gibt es beim On-Call? Sollten Software-Engineers genauso auf Rufbereitschaft sein? Wie sieht ein strukturierter On-Call-Prozess aus? Und was muss getan werden, um einen solchen zu etablieren? Und welche Modelle zur Bezahlung bzw. Kompensation gibt es, wenn man auch nach der Arbeit für seine App gerade steht?
All das und noch viel mehr gibt es in dieser Episode.
Bonus: Was Pager mit Tamagotchi zu tun haben und ob On-Call zu einer Handy-Phobie führt.
Schaut vorbei in unserer neuen Community: https://engineeringkiosk.dev/join-discord
Das schnelle Feedback zur Episode:
Feedback (gerne auch als Voice Message)
- EngKiosk Community: https://engineeringkiosk.dev/join-discord
- Email: stehtisch@engineeringkiosk.dev
- Mastodon: https://podcasts.social/@engkiosk
- Twitter: https://twitter.com/EngKiosk
- WhatsApp +49 15678 136776
Gerne behandeln wir auch euer Audio Feedback in einer der nächsten Episoden, einfach Audiodatei per Email oder WhatsApp Voice Message an +49 15678 136776
Links
- Engineering Kiosk #17 Was können wir beim Incident Management von der Feuerwehr lernen?: https://engineeringkiosk.dev/podcast/episode/17-was-k%C3%B6nnen-wir-beim-incident-management-von-der-feuerwehr-lernen/
- PagerDuty: https://www.pagerduty.com/
- OpsGenie: https://www.atlassian.com/de/software/opsgenie
- Being On-Call @ PagerDuty: https://response.pagerduty.com/oncall/being_oncall/
Sprungmarken
(00:00:00) Intro
(00:00:48) Handy in Reichweite und Freunde mit Pager
(00:04:57) On-Call bzw. Rufbereitschaft und Wer macht es gerne?
(00:07:01) Was ist On-Call und was bedeutet dies?
(00:08:50) On-Call in kleineren IT-Teams: Es ist kompliziert
(00:09:45) Strukturierte und Organisierte Rufbereitschaft
(00:10:41) Wer braucht denn eigentlich On-Call?
(00:12:51) Welche Rollen sind denn auf Rufbereitschaft?
(00:17:31) Wie kommt man zu einem strukturierten On-Call-Prozess?
(00:24:51) Kompensation und Reaktionszeiten
(00:28:30) Psychologische Herausforderung: Defensive Haltung gegenüber On-Call
(00:34:34) Die beste Schichtlänge für On-Call
(00:38:47) Wie schwierig ist es, Leute fürs On-Call zu begeistern?
(00:43:05) Sollten Engineering Manager On-Call sein?
(00:44:28) Nicht jeder Alert ist auch ein relevanter Alert
(00:46:36) Metriken für On-Call
(00:49:17) Feature Flags und Controlled Deployments als Mittel für's On-Call
(00:52:53) Welche Tools zur Alarmierung gibt es?
(00:54:03) Volle Verantwortung für deine Applikation
(00:58:18) Engineering-Kiosk-Community in Discord
Hosts
- Wolfgang Gassler (https://mastodon.social/@woolf)
- Andy Grunwald (https://twitter.com/andygrunwald)
Feedback (gerne auch als Voice Message)
- EngKiosk Community: https://engineeringkiosk.dev/join-discord
- Email: stehtisch@engineeringkiosk.dev
- Mastodon: https://podcasts.social/@engkiosk
- Twitter: https://twitter.com/EngKiosk
- WhatsApp +49 15678 136776