Ingénieur DevOps Senior (H/F)
Gridware
Présentation de l'entreprise
Ce qu'ils font
Gridware est une startup pionnière axée sur l'amélioration de la résilience du réseau grâce à une technologie innovante. Leur offre principale, Active Grid Response (AGR), utilise des capteurs Gridscope montés sur poteaux qui surveillent diverses conditions sur les lignes de distribution d'électricité en temps réel. Ces capteurs sont alimentés par l'énergie solaire et communiquent via des réseaux de dispositifs à dispositifs, cellulaires et satellites, garantissant un fonctionnement continu indépendamment de la tension du réseau (source : gridware.io). La technologie est conçue pour détecter une gamme de problèmes, y compris le contact avec la végétation, les lignes tombées et les pannes d'équipement, permettant aux services publics d'effectuer une maintenance prédictive et une désactivation dynamique pour prévenir les incendies de forêt et les pannes (source : cbsnews.com). Les marchés cibles incluent les services publics d'électricité américains, en particulier dans les zones à risque d'incendie de forêt comme la Californie et le Midwest, avec des projets d'expansion internationale à l'avenir (source : promptloop.com). Leurs produits s'intègrent parfaitement aux systèmes de gestion des opérations des services publics, couvrant plus de 90 millions d'heures de terrain et servant 40 % des clients américains grâce à des partenariats (source : gridware.io).
Projets et antécédents
Gridware a déployé avec succès environ 13 000 capteurs dans huit États, en particulier dans les zones à haut risque d'incendie de forêt en Californie, couvrant environ 1 000 miles de lignes électriques. Leur technologie a été créditée pour avoir prévenu des incendies de forêt, comme en témoignent des rapports d'alertes qui ont empêché la végétation en train de brûler de s'enflammer (source : cbsnews.com). Parmi les intégrations notables figurent des partenariats avec PG&E pour la détection de défauts à haute impédance et un projet pilote avec Puget Sound Energy visant à améliorer la priorisation des réparations lors des tempêtes et des incendies de forêt. Dans un cas, un circuit du nord de la Californie a connu une réduction de 70 % des temps de patrouille des pannes, tandis qu'un service public du Midwest a économisé 400 000 minutes de pannes sur quatre circuits (source : gridware.io). Les projets en cours incluent un projet pilote en 2024 avec NorthWestern Energy à Montana City, axé sur la surveillance des actifs en temps réel pour atténuer les risques d'incendie de forêt (source : northwesternenergy.com).
Développements récents
Au cours des deux dernières années, Gridware a levé des fonds importants pour soutenir sa croissance et ses efforts d'expansion. En 2024, ils ont annoncé un tour de financement de série A de 26,4 millions de dollars dirigé par Sequoia Capital, après une extension de seed de 10,5 millions de dollars en 2023 co-dirigée par Lowercarbon Capital et Fifty Years (source : gridware.io). Ce financement vise à améliorer leurs opérations aux États-Unis et à préparer des déploiements internationaux. De plus, Gridware a reçu des distinctions pour sa technologie innovante, notamment en étant nommé l'une des Meilleures Inventions de Time magazine en 2022 pour ses capteurs Gridscope et en ayant des fondateurs présentés dans Forbes 30 Under 30 en 2023 (source : engineering.berkeley.edu). L'entreprise continue d'approfondir ses partenariats avec les services publics, y compris un programme pilote avec NorthWestern Energy prévu pour fin 2024 (source : northwesternenergy.com).
Travailler chez eux
Gridware propose une variété de postes axés sur l'ingénierie, y compris des postes en ingénierie logicielle, en ingénierie de conception électrique, en ingénierie des données et en recrutement technique. L'entreprise est construite par des techniciens et des ingénieurs, reflétant une culture qui met l'accent sur la collaboration avec les travailleurs de terrain et une approche axée sur la mission pour la prévention des incendies de forêt (source : climatepeople.com). Le recrutement est concentré à leur siège de la Bay Area, où ils élargissent rapidement leur équipe pour soutenir la production et le déploiement de capteurs. La culture chez Gridware est décrite comme rigoureuse et axée sur la mission, avec un fort accent sur l'obtention de résultats concrets, tels que les heures de terrain significatives enregistrées par leur technologie (source : gridware.io). Bien que les avantages spécifiques pour les employés ne soient pas détaillés dans les sources, la nature soutenue par des investisseurs de l'entreprise suggère que des avantages compétitifs de startup peuvent être disponibles (source : cbsnews.com).
Dernière mise à jour le févr. 23, 2026 | Signaler un problème
Job Description
We're scaling the deployment of critical infrastructure monitoring devices to detect real-world fault events that lead to wildfires. The platform you'll build and operate ingests millions of events per day from devices in the field, powers customer-facing dashboards and alerting, and supports the data science work that turns raw signals into grid intelligence.
You will own AWS infrastructure, Kubernetes (EKS), CI/CD, and observability end-to-end, partnering with our Cloud Security team to keep the platform safe and compliant, and with backend, firmware, and data teams to keep them shipping fast. As an early member of the DevOps team, you'll have a direct hand in shaping how Gridware builds, deploys, and runs production systems for years to come.
Responsibilities
- Design, build, and maintain scalable, secure, and highly available infrastructure on AWS (EKS, EC2, RDS / Aurora Postgres, MSK, S3, VPC, IAM).
- Manage and optimize Kubernetes clusters (EKS) across multiple environments, and deploy applications using Argo CD with GitOps best practices.
- Implement and maintain CI/CD pipelines using GitHub Actions, including reusable workflows, build/push/scan flows for ECR, and frontend deployment pipelines.
- Operate and tune Kafka-based event streaming on Amazon MSK for high-throughput, low-latency device data pipelines.
- Define and manage Infrastructure as Code with Terraform and Terragrunt, with reusable modules, sensible environment separation, and review-friendly plans.
- Manage identity and access across platforms with Auth0 / EntraID integrations, IAM roles for service accounts (IRSA), and short-lived credentials.
- Build and maintain observability with Grafana, Loki, Prometheus / Mimir, and related tooling so on-call engineers can quickly find and fix issues.
- Monitor and optimize infrastructure cost across environments, partnering with engineering teams on right-sizing, capacity planning, and waste reduction.
- Partner with our Cloud Security team to enforce security standards, integrate with SIEM tooling, and respond to vulnerabilities and incidents.
- Debug complex production issues across infrastructure, deployment, and networking layers, and turn the lessons learned into automation and runbooks.
Required Skills
- 5+ years in DevOps, SRE, or Platform Engineering with production experience operating AWS infrastructure.
- Deep hands-on experience administering Kubernetes (EKS or equivalent) and deploying via GitOps (Argo CD or Flux).
- Proficiency with Infrastructure as Code using Terraform; comfort with Terragrunt or a similar wrapper.
- Hands-on experience designing and maintaining CI/CD pipelines, preferably with GitHub Actions and reusable workflows.
- Production experience operating distributed systems such as Kafka (MSK).
- Strong understanding of networking, DNS, TLS, and security best practices, including IdP-driven access control (Auth0, EntraID, or similar).
- Solid experience with monitoring and logging stacks such as Grafana, Loki, Prometheus, Mimir, or equivalents.
- Ability to debug complex production issues across infrastructure, deployment, and networking layers.
- Comfortable working in Linux environments with strong scripting skills (Python or Bash preferred for automation).
- Knowledge of version control workflows, automated testing, and release management.
Bonus Skills
- Experience operating Apollo Router / GraphQL federation gateways in production.
- Experience operating Argo Workflows or similar Kubernetes-native job / pipeline runners in production.
- Familiarity with Databricks or ML Ops pipelines for data and model deployment.
- Experience designing, operating, and exercising Disaster Recovery (DR) environments, including cross-region replication, backups, and tested failover runbooks.
- Experience with Tailscale or other zero-trust networking tools.
- Experience supporting IoT / embedded fleets at scale, including secure device-to-cloud connectivity.
- Experience in high-growth startup environments where you must wear many hats.
$190,000 - $215,000 a year
This describes the ideal candidate; many of us have picked up this expertise along the way. Even if you meet only part of this list, we encourage you to apply!
Benefits
- Health, Dental & Vision (Gold and Platinum with some providers plans fully covered)
- Paid parental leave
- Alternating day off (every other Monday)
- "Off the Grid", a two week per year paid break for all employees.
- Commuter allowance
- Company-paid training
Postuler maintenant
Offre d’emploi expirée ?Dites à Gridware que vous avez trouvé cet emploi sur Rejobs. Cela nous aide à grandir et à attirer plus de talents dans les énergies renouvelables !
Postuler maintenant
Offre d’emploi expirée ?Dites à Gridware que vous avez trouvé cet emploi sur Rejobs. Cela nous aide à grandir et à attirer plus de talents dans les énergies renouvelables !
Découvrez vos liens
Voir les connexionsConsultez vos contacts chez Gridware sur LinkedIn pour appuyer votre candidature.
Recevoir des alertes emploi
Recevez des alertes pour les emplois dans le domaine Ressources énergétiques distribuées à San Francisco, Californie, États-Unis
Rejoindre le Talent Pool
Laissez les meilleurs employeurs en énergie propre vous trouver
À propos du rôle
14 mai 2026
Temps plein
Entreprise
- San Francisco, Californie, États-Unis
5+ years in DevOps, SRE, or Platform Engineering
UTC-07:00