Vaga de parceiro

Site reliability engineer sre pleno - São Paulo / SP

Disponível para Assinantes
Salvar nos Favoritos
  • Compartilhe:

Detalhes da Vaga

  • Escolaridade Não Informado
  • Segmento Não Informado
  • Salário Não Informado
  • Área de AtuaçãoDiversos / Outros

O que você irá fazer

  • O nosso clima e jeito de trabalhar são guiados pelos nossos valores: paixão por pensar, tecnologia e gente, foco no cliente, empatia, dedicação e respeito! Estamos à procura de um SRE Pleno para compor o time do nosso cliente, uma empresa multinacional Belga.
  • Você desempenhará um papel crucial na manutenção da confiabilidade, escalabilidade e desempenho de nossos sistemas.
  • Atividades:Demonstrar fortes habilidades de resolução de problemas para diagnosticar e resolver problemas técnicos complexos com eficiência.
  • Colaborar com equipes multifuncionais para identificar e resolver as causas raízes dos problemas do sistema.
  • Compreender e aplicar princípios de arquitetura de sistema para projetar e implantar sistemas escalonáveis, confiáveis e tolerantes a falhas.
  • Contribuir para o projeto e implementação de melhorias de infraestrutura para melhorar o desempenho do sistema.
  • Possuir familiaridade com plataformas em nuvem como Azure, AWS ou Google Cloud.
  • Conhecimento e compreensão da implantação e gerenciamento de recursos em nuvem com confiabilidade, escalabilidade e segurança.
  • Compreensão ou experiência com orquestração Docker e Kubernetes.
  • Implementar scripts e ferramentas de automação para agilizar tarefas repetitivas, garantindo eficiência operacional.
  • Colaborar com equipes de desenvolvimento para integrar a automação aos pipelines de CI/CD e agilizar o processo de lançamento, com foco nos princípios de DevOps.
  • Utilizar ferramentas de monitoramento para monitorar o desempenho do sistema e dos aplicativos, fornecer insights para aprimorar a observabilidade da solução, configurar alertas e analisar métricas.
  • Identificar proativamente possíveis problemas e implementar soluções de monitoramento para garantir a confiabilidade do sistema.
  • Compreender os procedimentos de resposta e gerenciamento de incidentes, incluindo a participação em rodízios de plantão.
  • Contribuir para a resolução de incidentes, escalonamento e análise pós-incidente (Análise de causa raiz/post-mortem sem culpa) para prevenir ocorrências futuras.
  • Assumir a responsabilidade pelos projetos atribuídos, conduzindo-os desde o início até a conclusão.
  • Trabalhar de forma independente e colaborativa para fornecer soluções de alta qualidade dentro de prazos especificados.
  • Requisitos:Forte capacidade analítica e de resolução de problemas.
  • Compreensão dos princípios da arquitetura do sistema.
  • Familiaridade com plataformas em nuvem (Azure, AWS ou Google Cloud) e sua CLI.
  • Familiaridade com plataformas e ferramentas DevOps (Azure DevOps, GitHub, Jenkins).
  • Experiência com ferramentas de monitoramento (Datadog, Prometheus, Dynatrace, Splunk).
  • Conhecimento de procedimentos de resposta e gerenciamento de incidentes.
  • Boas habilidades de comunicação em inglês, tanto escrita quanto verbal.
  • Graduação em Ciência da Computação, Tecnologia da Informação ou áreas afins.
  • Diferenciais:Certificações em nuvem (Az-900, Az-104, AWS ou equivalentes GCP).
  • Certificação CKA ou CKAD.
  • Certificação DevOps ou SRE Foundations ou Practitioner.
  • Contratação no modelo PJ.
  • Modelo 100% Remoto.
  • #J-18808-Ljbffr

Informações Adicionais

  • Quantidade de Vagas 1
  • Jornada Não Informado