A career in IBM Consulting is rooted by long-term relationships and close collaboration with clients across the globe.
You'll work with visionaries across multiple industries to improve the hybrid cloud and AI journey for the most innovative and valuable companies in the world. Your ability to accelerate impact and make meaningful change for your clients is enabled by our strategic partner ecosystem and our robust technology platforms across the IBM portfolio; including Software and Red Hat
Curiosity and a constant quest for knowledge serve as the foundation to success in IBM Consulting. In your role, you'll be encouraged to challenge the norm, investigate ideas outside of your role, and come up with creative solutions resulting in ground breaking impact for a wide network of clients. Our culture of evolution and empathy centers on long-term career growth and development opportunities in an environment that embraces your unique skills and experience.
Nesta função, você trabalhará em um de nossos IBM Consulting Client Innovation Centers (Delivery Centers), onde fornecemos profundo conhecimento técnico e do setor para uma ampla gama de clientes dos setores público e privado em todo o mundo. Nossos centros de entrega oferecem aos nossos clientes habilidades e conhecimentos técnicos locais para impulsionar a inovação e a adoção de novas tecnologias.
- Garantir a alta disponibilidade, confiabilidade e desempenho dos sistemas por meio de práticas de engenharia de confiabilidade de sites (Site Reliability Engineering - SRE).
- Implementar e gerenciar automações para tarefas repetitivas e processos operacionais, reduzindo esforço manual e riscos.
- Monitorar e otimizar sistemas críticos, infraestrutura e aplicações utilizando ferramentas de observabilidade e monitoramento.
- Analisar e gerenciar incidentes críticos, liderando a identificação de causa raiz e implementação de soluções definitivas.
- Desenvolver e manter SLIs, SLOs e SLAs, alinhando-os com as metas de negócios.
- Trabalhar em colaboração com equipes de desenvolvimento, operações e segurança para implementar pipelines CI/CD robustos e promover a infraestrutura como código (IaC).
- Garantir a resiliência do sistema por meio de estratégias de chaos engineering, testes de carga e automação de failovers.
- Realizar otimização de custos em ambientes de nuvem e melhorar a eficiência operacional.
Buscamos profissionais com experiência sólida como SRE, e habilidades necessárias de:
- Sólido conhecimento em design e implementação de arquiteturas resilientes e escaláveis.
- Proficiência em práticas de SRE, como definição de SLIs, SLOs e SLAs, e sua integração nos sistemas.
- Trabalhar em colaboração com equipes de desenvolvimento, operações e segurança para implementar pipelines CI/CD robustos e promover a infraestrutura como código (IaC).
- Experiência com automação avançada e gerenciamento de infraestrutura em larga escala.
- Expertise em monitoramento e otimização de microsserviços e sistemas distribuídos.
- Experiência com Kubernetes e gestão de clusters em produção.
- Conhecimento avançado em práticas de chaos engineering e teste de resiliência.
- Proatividade e habilidade para resolver problemas em cenários complexos.
- Boa comunicação para trabalhar de forma colaborativa com equipes multidisciplinares.
- Capacidade de priorizar demandas e trabalhar em ambientes dinâmicos.