Cloud Plattform Systementwicklung (m/w/d)
Rolle
In dieser Rolle gestaltest und betreibst du eine skalierbare Cloud-Plattform, die Entwickler:innen über Developer Self-Service zu eigenständigen Deployments und effizientem Zugriff auf Informationen befähigt. Du verantwortest Aufbau, Wartung und Weiterentwicklung des Management-Clusters inklusive Hochverfügbarkeit sowie GitOps- und CI/CD-Tooling mit Fokus auf Stabilität und Security-Scanning. Du entwickelst Self-Service-Deployment-Strategien und setzt Berechtigungs- und Policy-Konzepte um, unter anderem für ArgoCD und Vault. Du stärkst Observability und Incident-Management, implementierst Cluster-weites Tracing und verbesserst Alerting- sowie Alertmanager-Konfigurationen. Du unterstützt die Helm-Chart-Entwicklung und evaluierst Sicherheits- und Traffic-Management-Lösungen wie Policy-Management und Service Mesh, um Plattformbetrieb und Security konsequent weiterzuentwickeln.
Verantwortung
- Du baust die Cloud-Plattform weiter aus und übernimmst Betrieb, Wartung sowie die Hochverfügbarkeits-Sicherung des Management-Clusters
- In dieser Rolle befähigst Du App-Entwickler über Developer Self-Service, eigenständig Informationen abzurufen und Deployments zuverlässig durchzuführen
- Du entwickelst die GitOps- und ArgoCD-Strategie weiter, setzt RBAC um und pflegst die ArgoCD-Apps nachhaltig
- Du betreibst und verbesserst den Vault-Secret-Storage inklusive RBAC für Entwickler und weitere Nutzergruppen
- Du stärkst Observability und Incident Management durch Weiterentwicklung des Monitoring-Stacks, Tracing auf Cluster-Ebene sowie präzise Alert-Regeln und Alertmanager-Tuning
- Als Cloud Plattform Systementwicklung treibst Du CI/CD, Provisionierung und Security voran, indem Du OpenTofu-Cluster-Provisionierung und Pipelines stabilisierst, Developer-Tools integrierst und Policy-/User-Management bzw. Service-Mesh-Lösungen evaluierst und einführst
Qualifikationen
- Du verfügst über eine abgeschlossene Ausbildung oder ein Studium.
- Du baust eine skalierbare Cloud-Plattform auf, betreibst und entwickelst das Management-Cluster weiter und stellst Hochverfügbarkeit der Services sicher.
- Mit ArgoCD setzt du GitOps um, etablierst RBAC für Self-Service-Deployments und pflegst ArgoCD-Apps im laufenden Betrieb.
- Du betreibst Vault als Secret-Storage, entwickelst es weiter und implementierst rollenbasierte Zugriffe für verschiedene Nutzergruppen.
- Observability und Incident Management gestaltest du aktiv mit, inklusive Tracing, Alert-Regeln und Optimierung von Prometheus, Alertmanager, Loki und Grafana.
- Du bringst Praxis mit Docker und Kubernetes sowie Tools wie Terraform oder OpenTofu, Helm und GitLab CI mit und kommunizierst sehr gut auf Deutsch sowie gut auf Englisch.
Benefits