Trabajar en IBM Cloud te brinda la plataforma para aprender, desarrollar y utilizar tus habilidades todos los días trabajando en los últimos productos y servicios tecnológicos relacionados con la nube. Trabajarás en un entorno en el que entendemos cómo podemos prosperar mejor cuando aprovechamos nuestras fortalezas. Es por eso que el desarrollo de nuestra gente es clave para nuestro éxito, la puerta siempre está abierta para aquellos que están listos para avanzar en su carrera.
La curiosidad y el pensamiento valiente son vitales cuando se trabaja en IBM Cloud, ya que continuamos nuestra dedicación para garantizar que estamos a la vanguardia de la tecnología de la nube. Nuestro reconocido legado significa que estamos liderando el camino en todo, desde análisis y seguridad hasta diseños de hardware y software inigualables. Brindamos a nuestros clientes la transformación completa de extremo a extremo a medida que construimos la plataforma de nube de próxima generación de IBM, que se centra en brindar rendimiento y previsibilidad a escala global. El panorama de productos y tecnología de IBM incluye investigación, software e infraestructura. Ingresar a este dominio te posiciona en el corazón de IBM, donde prosperan el crecimiento y la innovación.
Como Site Reliability Engineer Intern, desempeñará un papel crucial en el soporte, mantenimiento y mejora operativa de la infraestructura de la nube. Al trabajar en estrecha colaboración con varios equipos, su enfoque estará en garantizar la salud y la confiabilidad de los sistemas de producción y prueba. Su enfoque proactivo será esencial para responder rápidamente a los problemas y alertas, contribuir al desarrollo de nuevas capacidades y colaborar con otros equipos de SRE y gerentes de programa para brindar servicios de misión crítica al mercado.
Funciones clave:
* Monitoreo del sistema las 24 horas, los 7 días de la semana: monitoree el estado de los sistemas de producción y prueba las 24 horas del día, lo que garantiza una confiabilidad continua.
* Respuesta rápida a problemas: responda rápidamente a los problemas y alertas de producción, brindando una resolución rápida y manteniendo la disponibilidad del sistema.
* Desarrollo de capacidades: respalde el desarrollo de capacidades nuevas y existentes para servicios de computación, almacenamiento y red.
* Asociación colaborativa: asocie a otros equipos de SRE y gerentes de programa, lo que contribuye a la entrega fluida de servicios de misión crítica al mercado.
* Ejecución de automatización: ejecute cambios en el entorno de producción a través de la automatización, lo que garantiza la eficiencia y minimiza el tiempo de inactividad.
* Solución de problemas interfuncionales: colaborar con los equipos de ingeniería para proporcionar evaluaciones iniciales y posibles soluciones alternativas para los problemas de producción. Solucionar y resolver los problemas de producción de manera eficaz.
* Planificación de la integración: trabajar con los equipos de soporte y desarrollo para identificar y resolver los problemas. Analizar y planificar las tareas de integración para mejorar el rendimiento general del sistema.
*Actualmente cursando estudios universitarios con un historial de éxito académico en carreras como: Ingeniería de Computación, Ingeniería de Sistemas, Ingeniería de Software o otras carreras relacionadas;
*Disponibilidad de tiempo para realizar prácticas;
*Conocimientos en Python o otras lenguajes de programación;
*Dominio del idioma inglés;
*Supervisión y resolución de problemas del sistema: conocimientos sobre supervisión/observabilidad, respuesta a problemas y resolución de problemas para un rendimiento óptimo del sistema;
*Competencia en automatización: conocimientos sobre automatización para cambios en el entorno de producción, optimización de procesos para lograr eficiencia y reducción del trabajo;
*Linux: conocimientos de los sistemas operativos Linux;
*Conocimientos sobre el manejo de operaciones diarias, gestión de alertas, soporte ante incidentes, tareas de migración y soporte para reparación de averías;
Conocimientos en:
• Kubernetes/OpenShift: knowledge or experience of Kubernetes/OpenShift
environments.
• Automation/Scripting: knowledge or experience of Ansible, Python, Terraform, and CI/CD tools such as Jenkins, IBM Continuous Delivery, ArgoCD.
• Monitoring/Observability: knowledge or experience crafting alerts and dashboards using tools such as Instana, New Relic, Grafana/Prometheus.
• DBA: Interest or experience configuring and maintaining SQL, NoSQL, and data streaming technologies (e.g. PostgreSQL, CouchDB, Redis, Kafka, Spark, etc.)