Vaga de parceiro

Site reliability engineer (sre) - São Paulo / SP

Disponível para Assinantes
Salvar nos Favoritos
  • Compartilhe:

Detalhes da Vaga

  • Escolaridade Não Informado
  • Segmento Não Informado
  • Salário Não Informado
  • Área de AtuaçãoDiversos / Outros

O que você irá fazer

  • Atuamos como Fábrica de Software e Body Shop de profissionais de TI, oferecendo soluções inteligentes e personalizadas para diversos setores, como Varejo, Indústria e Seguros.
  • Sobre nós Fundada em 1999, crescemos rapidamente ao unir criatividade e engenharia para desenvolver soluções tecnológicas que fazem a diferença.
  • Nossa missão é transformar vidas com transparência, entusiasmo e vontade incessante de evoluir.
  • Nossa cultura e valores Na Cyber Solutions, acreditamos que as pessoas são o nosso maior ativo.
  • Trabalhamos guiados por princípios que fortalecem nosso time e impulsionam nosso crescimento: Deus: Nossa base é pautada em ética, amor e propósito.
  • Pessoas: Valorizamos respeito, empatia e colaboração.
  • Ação: Agimos com determinação para gerar impacto.
  • Excelência: Qualidade e dedicação estão no nosso DNA.
  • Evolução: Aprendemos e inovamos constantemente.
  • Resultado: Nosso foco é entregar soluções que realmente transformam.
  • Oportunidade: Estamos crescendo! E para fortalecer nosso time, buscamos um Site Reliability Engineer (SRE) para garantir a estabilidade, escalabilidade e eficiência dos nossos sistemas.
  • Será responsável por melhorar a confiabilidade da infraestrutura, automatizar processos e implementar práticas de observabilidade para reduzir falhas e tempo de indisponibilidade.
  • Venha fazer parte do nosso time! Responsabilidades Garantir a alta disponibilidade e performance dos sistemas e aplicações; Implementar e gerenciar pipelines de CI/CD para automatização de deploys; Monitorar métricas de desempenho e corrigir incidentes críticos; Criar e manter infraestrutura como código (IaC) utilizando Terraform, Ansible, CloudFormation ou similar; Trabalhar na automação de tarefas para reduzir intervenções manuais e aumentar a eficiência; Melhorar práticas de observabilidade com ferramentas como Prometheus, Grafana, ELK Stack, Datadog ou New Relic; Gerenciar e otimizar ambientes em cloud (AWS, Google Cloud, Azure); Aplicar conceitos de SLOs, SLIs e SLAs para aprimorar a confiabilidade dos serviços; Trabalhar em conjunto com equipes de desenvolvimento para melhorar a resiliência dos sistemas.
  • Requisitos Experiência em administração de sistemas Linux e/ou Windows Server; Conhecimento avançado em Kubernetes e Docker; Experiência com ferramentas de monitoramento e logging; Habilidades em programação e scripting (Python, Go, Shell, Bash ou similares); Conhecimento em redes e segurança (TLS, VPN, firewall, balanceamento de carga); Experiência prática com bancos de dados SQL e NoSQL; Experiência com cloud computing e serviços gerenciados (AWS, GCP, Azure).
  • Diferenciais (não obrigatórios, mas desejáveis) Certificações como AWS Certified Solutions Architect, Kubernetes Administrator (CKA) ou Google Professional Cloud Engineer; Conhecimento em Chaos Engineering para testes de resiliência; Experiência com Service Mesh (Istio, Linkerd, Consul); Contribuições para projetos open-source ou experiência em comunidades de tecnologia.

Informações Adicionais

  • Quantidade de Vagas 1
  • Jornada Não Informado