
Sankhya Gestão de Negócios
Estamos em busca de um(a) Especialista SRE para reforçar nosso time de Cloud e Engenharia de Confiabilidade. Esse profissional será fundamental para garantir a estabilidade, performance e resiliência dos nossos ambientes SaaS, promovendo automação e excelência operacional em escala.
Missão do cargoComo parte da nossa estrutura de Cloud e SRE, sua missão será assegurar que nossos sistemas estejam sempre disponíveis, performáticos e seguros. Você será responsável por aplicar princípios de engenharia de software para resolver desafios operacionais, promovendo uma cultura orientada a dados, automação e confiabilidade.
Todas as nossas vagas estão disponíveis para pessoas com deficiência!Que tal se juntar ao nosso time e embarcar nessa jornada com a gente?Responsabilidades e atribuiçõesDefinir e acompanhar SLIs/SLOs e indicadores de confiabilidade por produto e ambiente;
- Atuar no design e melhoria contínua de pipelines de observabilidade (tracing, métricas e logs);
- Liderar o processo de incident response, conduzir post-mortems e promover ações corretivas;
- Colaborar com times de desenvolvimento para garantir a resiliência desde o design da aplicação;
- Automatizar tarefas operacionais, autoscaling e gestão de capacidade em ambientes em nuvem;
- Participar da construção e disseminação de runbooks, playbooks e estratégias de disaster recovery;
- Apoiar a cultura de excelência operacional com foco em melhoria contínua, previsibilidade e prevenção de falhas;
- Utilizar ferramentas de análise de performance (APM) para diagnóstico e mitigação de gargalos.
- Requisitos e qualificaçõesExperiência com Ambientes Multi-cloud (OCI e AWS) e suas ferramentas de gestão e automação.
- Sólida experiência em SRE, DevOps ou Engenharia de Produção em ambientes de missão crítica;
- Domínio em práticas de observabilidade: métricas, logs, tracing e alertas (ex: Datadog, Prometheus, Grafana, etc);
- Conhecimento avançado em automação e IaC (Terraform, Ansible, CDK ou semelhantes);
- Familiaridade com pipelines de CI/CD (ex: GitHub Actions, GitLab, Azure DevOps);
- Experiência com containers e orquestração (Docker, Kubernetes, ECS, EKS);
- Boa base em sistemas distribuídos, redes, escalabilidade e gerenciamento de capacidade;
- Mentalidade “you build it, you run it”, com foco em confiabilidade e colaboração entre times.
- DiferenciaisCertificações relevantes (ex: Google SRE, AWS DevOps Engineer, Kubernetes CKA/CKS);
- Experiência em ambientes com cultura de SRE madura (SLIs/SLOs, toil reduction, etc);
- Vivência com testes de caos e engenharia de resiliência (Chaos Monkey, Gremlin);
- Capacidade de análise de custos operacionais e otimização de uso da infraestrutura;
- Experiência com automação de testes de performance e de carga;
- Atuação anterior com feature flags, dark launches e blue/green deployments.
Se você deseja crescer, encarar novos desafios e fazer parte de um time que está construindo algo grande, seu lugar é aqui! Topa o desafio?Benefícios que vão além da Jornada SankherNa Sankhya, valorizamos a individualidade e oferecemos benefícios que promovem liberdade, equilíbrio e bem-estar em todas as áreas da vida.
Participação nos Resultados (PPR)Vale Alimentação/Refeição iFoodLicença Maternidade e Paternidade EstendidaAuxílio CrechePlano de saúdePlano odontológicoDay OFF no AniversárioEmpréstimo Consignado️ Gympass / WellhubZenklubSeguro de VidaVale TransporteEquipamentos Fornecidos pela EmpresaAuxílio IdiomasAuxílio Graduação, Pós-Graduação, Auxílio Certificações, Universidade Corporativa SankhyaNa Sankhya, sua jornada de crescimento nunca para.
- Plano de Performance e Desenvolvimento Individual: Plano personalizado para seu crescimento profissional.
- Touchpoints de Evolução com a Liderança: Encontros regulares com líderes para discutir seu progresso e desenvolvimento.