Wir suchen engagierte Site Reliability Engineers (SRE), die unser wachsendes SRE-Team verstärken und dabei helfen, das Rückgrat unserer cloudbasierten Plattformen mitzugestalten. Diese Rolle ist ideal für Personen, die sowohl Spaß daran haben, Produktionsvorfälle zu lösen, als auch zuverlässige, skalierbare Systeme zu bauen, die solche Vorfälle von vornherein vermeiden. Unser SRE-Team arbeitet nach den Prinzipien aus dem Google SRE Workbook.
Als SRE wirst du deine Zeit zu gleichen Teilen aufteilen:
- 50 % in praktischen Projekten mit DevOps-Teams, z. B. durch das Schreiben umsetzbarer Runbooks und das Einbringen von Erkenntnissen aus Postmortem-Analysen.
- 50 % in einer 24/7-Rufbereitschaft im Third-Level-Support mit einer Reaktionszeit von 30 Minuten – allerdings nur für Systeme, für die du zuvor ein Onboarding durchgeführt hast.
Treten während deiner Schicht keine Vorfälle auf, gehört die Zeit ganz dir – es werden keine zusätzlichen Aufgaben erwartet.
Du berichtest direkt an unseren Head of SRE und spielst eine Schlüsselrolle in unserem sich weiterentwickelnden DevOps-Ökosystem. Wenn du Cloud-begeistert bist und Kenntnisse in Kubernetes sowie AWS mitbringst, bist du bei uns genau richtig!
Ready to improve systems and not just babysit them?