Vea cómo al adoptar un enfoque diferente para la resolución de problemas permitió descubrir un mayor conjunto de soluciones efectivas.

Cuando un activo crítico en servicio falla y cuesta más de $ 10 millones repararlo, lo mejor para usted es averiguar por qué se falló y qué puede hacer para evitar que vuelva a suceder, ¿verdad? Sin embargo, a pesar de las mejores intenciones, muchas empresas batallan para llegar al fondo de un problema. Su proceso de investigación deja mucho que desear y termina por decepcionarlos.

Efectivamente, el análisis de causa raíz (RCA) es una estrategia útil para investigar por qué algo salió mal. Pero a menudo, necesitas ir más allá. A continuación, utilizando un ejemplo de uno de nuestros clientes, exploramos cómo la metodología de análisis de causa raíz de Apollo agrega un inmenso valor al RCA.

Un centro de procesamiento y distribución postal utiliza sistemas complejos de clasificación de cinturones cruzados (CBS) para mover paquetes entre áreas de la instalación. Piense en el CBS como un bucle continuo de alta velocidad compuesto por bandejas y cintas transportadoras de alimentación, con estaciones de transferencia para mover productos entre los dos. Estas estaciones de transferencia se pueden activar hasta 600,000 veces por mes; el personal de mantenimiento inspecciona regularmente las placas de metal y las ruedas de goma en cada estación de transferencia para detectar desgaste o grietas.

Una grieta en el sistema.

El sistema CBS es altamente eficiente … hasta que se rompe. Esto es lo que sucedió en el centro de procesamiento: una placa de metal en una de las estaciones de transferencia se partió a la mitad, una mitad se cayó y se interpuso en el camino de las bandejas de CBS. Esto provocó una reacción en cadena, con las bandejas acumulándose en los 10 segundos que tardó el sistema en detenerse por completo. En este tiempo, más de 200 bandejas resultaron dañadas.

Le tomó tres días para obtener piezas de repuesto y luego otros tres para reparar el sistema CBS. Los ingresos perdidos y los costos de reparación superaron los $ 10 millones.

Lo qué se descubrió mediante un proceso interno de resolución de problemas fue lo siguiente:

Se asignó un equipo de investigación de eventos para identificar la causa raíz del evento y recomendar soluciones para evitar una recurrencia.

Según el protocolo estándar, el equipo utilizó el proceso de investigación de eventos de la empresa; El problema se definió tal como sucedió. Es decir, una grieta formada en la placa de metal a partir de millones de ciclos durante diez años de servicio. La grieta creció hasta que la placa de metal se partió por la mitad, lo que resultó en que la mitad de la placa de metal quedara en el camino de las bandejas. La primera bandeja golpeó la placa de metal y comenzó una reacción en cadena de colisiones de bandeja a bandeja. El sistema CBS tardó 10 segundos en detenerse por completo.

La causa raíz se definió como “flexión repetida de la placa de metal durante el uso, lo que causó que el metal se agrietara y eventualmente fallara”.

A partir de esto, el equipo recomendó tres soluciones:

  • Aumentar la frecuencia de inspección de las placas de metal
  • Proporcionar capacitación de actualización sobre cómo inspeccionar las placas de metal para detectar grietas
  • Aumentar las piezas de repuesto que se encuentran en sitio para reducir los retrasos en las reparaciones

El enfoque adoptado por el equipo de investigación no exploró el panorama general, y se dieron cuenta de que era necesario hacer más. Entonces le pidieron a ARMS Reliability que facilitara la investigación del evento utilizando la metodología de análisis de causa raíz de Apollo. Este análisis más profundo reveló algunos hallazgos interesantes.

Lo qué descubrió la metodología del análisis de causa raíz de Apolo

Usando el método Apollo, ARMS Reliability pasó 1.5 días trabajando con su equipo de investigación para desarrollar una tabla detallada de causas y efectos para identificar soluciones que eviten una recaída costosa.

Desde el principio, este enfoque difería de la propia investigación interna de la compañía. En lugar de definir el problema como sucedió, identificamos el problema como un “Paro prolongado de la planta”. De esta definición amplia del problema, surgieron problemas más específicos en el cuadro de causa y efecto. Hubo muchos “momentos, ajá”.

El primero fue que el sistema, realmente no paró porque los controles detectaron que había un problema con el sistema CBS (la suposición inicial del equipo). Más bien, paró porque un paquete bloqueó un sensor en un transportador de alimentación (Conveyor). Esto significó que el sistema llegara a una parada controlada después de que todos los transportadores de alimentación quedaran despejados del producto, en lugar de un paro de emergencia. Esto extendió el tiempo de apagado y el daño del sistema.

Otros hallazgos incluyeron:

  • Mientras que las placas de metal se inspeccionan regularmente, la configuración física de las estaciones de transferencia, junto con las limitaciones de una inspección visual, minimiza la probabilidad de detectar una grieta.
  • Las estaciones de transferencia están a 15 pies por encima del suelo y detrás de guardas de metal. Cada protector mide cuatro pies de ancho por ocho pies de largo y se sujeta en su lugar con 48 pernos y arandelas de seguridad. Más de 300 guardias fueron retiradas / reemplazadas durante la reparación utilizando (ratchets)trinquetes de mano, una tarea tediosa y lenta.
  • El personal necesitaba ir al almacén de repuestos para obtener pernos y arandelas de reemplazo que se dañaron o perdieron debajo del equipo, lo que se sumó al tiempo y esfuerzo de reparación.
  • La información sobre la tasa de falla de la placa metálica se recopila en cada centro de distribución, pero la información no se comparte entre los sitios.
  • Si bien los componentes del sistema CBS son comunes entre los centros de distribución, no existe un suministro central de repuestos en caso de una falla catastrófica como esta.
  • Las vulnerabilidades del sistema CBS no se habían identificado porque no se había realizado un Modo de Falla y Análisis de Efectos ni una Evaluación y Análisis de Vulnerabilidad.
  • El desgaste de otros componentes de la estación de transferencia aumentó la flexión de la placa metálica y, por lo tanto, aumentó la tasa de falla de la placa metálica. Sin embargo, el mantenimiento programado no se realizó para estos componentes de la estación de transferencia.

A partir de esta lista completa de hallazgos, se recomendaron muchas más soluciones para ayudar a protegerse contra una falla similar en el futuro. Esto es lo que propuso ARMS Reliability:

  • Agregar lógica a los controles del sistema CBS para detectar eventos anormales y generar una parada de emergencia
  • Agregar frenos de motor al sistema de transmisión para minimizar el tiempo de parada de emergencia
  • Agregar soportes a las placas de metal para reducir la flexión y la falla subsiguiente
  • Proporcionar puntos de acceso rápido a través de los guardias para inspecciones
  • Proporcionar cámaras de inspección y tinte de inspección de grietas para inspecciones de placas de metal
  • Programación de inspecciones de placa de metal según la tasa de uso de la placa de metal en lugar de en base a tiempo de calendario
  • Realizar una Evaluación y Análisis de Vulnerabilidad en el sistema CBS y abordar las vulnerabilidades más altas
  • Desarrollar estrategias de mantenimiento optimizadas para los componentes críticos del sistema CBS
  • Proporcionar carros de piezas y herramientas eléctricas para reducir el tiempo requerido para retirar y reemplazar un protector (guardias)
  • Compartir las tasas de falla de componentes entre sitios para predecir mejor las tasas de falla y el mantenimiento programado requerido
  • Reconstruir las estaciones de transferencia en base a una agenda de tiempo predeterminada para abordar el desgaste de los componentes antes de que se convierta en un problema
  • Crear planes de contingencia para fallas catastróficas de los sistemas de misión crítica del centro de distribución
  • Establecer un stock central de repuestos del sistema CBS

Análisis comprensivo y “revelador”

Mediante la utilización del método de análisis de causa raíz de Apollo, junto con un facilitador experto, el equipo llegó a un punto de conclusión en solo 1.5 días en el que se entendió claramente la causa del fallo y, lo que es más importante, se pudieron identificar soluciones efectivas para prevenir una recurrencia.

Como es típico cuando se utilizó el método de Apolo, hubo varios momentos en que se abrieron los ojos del equipo al descubrir cómo varias fallas y deficiencias en su operación se alinearon para causar el evento catastrófico. Al profundizar un poco más, se revelaron algunos problemas serios que llevaron a un mayor conjunto de soluciones efectivas que evitarán que el problema vuelva a suceder.

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Post Navigation