Senior Incident Manager für Trading-Systeme (Remote) | AWS & SQL
Aus der Ferne
Vollzeit
Wir suchen einen erfahrenen Incident Manager, der unser dynamisches Team bei der Wartung und Optimierung hochverfügbarer Handelssysteme unterstützt. In dieser kritischen Position sind Sie die erste Verteidigungslinie für unsere Produktionsumgebungen und gewährleisten eine 24/7-Systemzuverlässigkeit sowie schnelle Vorfallbehebung zur Unterstützung unserer globalen Handelsoperationen.
Hauptverantwortlichkeiten
- Überwachung und Wartung hochverfügbarer Handelssysteme in Produktionsumgebungen mit Sicherstellung von 99,9%+ Betriebszeit und optimaler Leistung.
- Proaktive Identifizierung und Lösung von Systemproblemen durch Analyse von Protokollen, Leistungskennzahlen und Dienstinteraktionen.
- Leitung von Vorfallreaktionsprozessen, einschließlich Ursachenanalyse und Implementierung präventiver Maßnahmen.
- Koordination der teamübergreifenden Zusammenarbeit während kritischer Vorfälle zur Minimierung von Systemausfallzeiten.
- Bereitstellung, Automatisierung und Verwaltung von AWS-Cloud-basierten Umgebungen für optimale Verfügbarkeit, Leistung, Skalierbarkeit und Sicherheit.
- Beaufsichtigung von Entwicklungs- und QA-Umgebungen mit Gewährleistung der Konsistenz über Entwicklungspipelines hinweg.
- Analyse der Systemleistung und Empfehlung von Technologieverbesserungen, Upgrades und Modifikationen.
- Erstellung detaillierter Dokumentation von Vorfällen, Lösungswegen und Systemkonfigurationen.
- Implementierung und Verbesserung von Überwachungslösungen zur Erkennung von Problemen, bevor diese Endbenutzer beeinträchtigen.
- Teilnahme an Bereitschaftsdiensten zur Bereitstellung von 24/7-Support für geschäftskritische Systeme.
Erforderliche Qualifikationen
- Mindestens 1 Jahr Erfahrung in der Analyse, Fehlerbehebung und Lösung von Problemen in mehrschichtigen Anwendungsarchitekturen.
- Nachgewiesene Erfahrung mit Microservices-Architektur, die eine 24/7-Verfügbarkeit erfordert.
- Kompetenz im Schreiben und Optimieren von SQL-Abfragen für Problemuntersuchungen.
- Arbeitskenntnisse von Oracle (PL/SQL 19c) und/oder PostgreSQL 14+ Datenbanksystemen.
- Grundlegende Linux-Kenntnisse einschließlich Befehlszeilentools (awk, sed, bash, cat, grep).
- Praktisches Verständnis von AWS-Diensten einschließlich VPC, EC2, ECS, Route53 und S3.
- Erfahrung mit Git-Versionskontrollsystemen und Branching-Strategien.
- Grundlegende Netzwerkkenntnisse einschließlich TCP/IP, DNS und Load-Balancing-Konzepte.
- Starke analytische und Troubleshooting-Fähigkeiten mit der Fähigkeit, unter Druck zu arbeiten.
- Ausgezeichnete schriftliche und mündliche Kommunikationsfähigkeiten in Englisch.
Wünschenswerte Qualifikationen
- Fortgeschrittene Linux-Systemadministration und Webserver-Konfiguration (Nginx 1.20+, Tomcat 10).
- Erfahrung mit modernen DevOps-Tools und -Praktiken (Docker 24.0+, Jenkins, GitLab-CI, Terraform).
- Verständnis der JVM-Konfiguration und Optimierungstechniken (Java 17/21).
- Kenntnisse von API-Protokollen einschließlich REST und gRPC.
- Hintergrund in der Implementierung und Optimierung von hochbelasteten Anwendungen.
- Software-Engineering-Erfahrung, insbesondere in den Bereichen Finanzen, Forex oder Glücksspiel.
- Kompetenz mit JIRA für Vorfallverfolgung und Projektmanagement.
- Erfahrung mit ELK-Stack (Elasticsearch 8.x, Logstash, Kibana) für Log-Management.
- Vertrautheit mit Überwachungstools wie Zabbix 6.0+ oder Prometheus 2.40+.
- Verständnis von Message-Broker-Technologien (Kafka 3.4+, AWS SQS/SNS, ESB).
- Skripterstellungs-Expertise in Bash, Python 3.10+ oder ähnlichen Sprachen.
Warum Sie zu uns kommen sollten
Werden Sie Teil unseres innovativen Teams und bringen Sie Ihre technische Karriere auf die nächste Stufe. Sie arbeiten mit modernsten Technologien in einer anspruchsvollen, schnelllebigen Umgebung, die kontinuierliche Lernmöglichkeiten bietet. Wir bieten wettbewerbsfähige Vergütung, flexible Remote-Arbeitsregelungen und die Chance, einen bedeutenden Einfluss auf kritische Finanzsysteme zu nehmen, die weltweit eingesetzt werden.