¿Qué es el modelo de fiabilidad RAMS de la Curva de la Bañera?

14.05.2020

En este artículo te presentamos un modelo de fiabilidad ampliamente utilizado en la ingeniería RAMS: La Curva de la Bañera. Verás porqué se llama Curva de la Bañera, cuáles son sus tres etapas y cual es la característica en cada una de ellas en cuanto a su fiabilidad o tasa de fallo asociada. Además aprenderás conceptos tan interesantes como la mortalidad infantilla estrategia burn in o las pruebas en vacío, también llamadas marcha blanca. Leedeo Engineering, especialista en Ingenierá RAM y Safety.

Los fallos forman parte de la vida de un activo y en cualquier momento pueden producirse: pueden aparecer durante su funcionamiento, mientras está en reposo, cuando se solicita que haga una función determinada o incluso mientras se desmantela.

Por tanto, si queremos mejorar la fiabilidad de un activo debemos conocer cuánto, cada cuándo y cómo falla un activo y para ello es imprescindible conocer la tasa de fallos (conocida como lambda λ), que no deja de ser el número de fallos detectados en un tiempo determinado:

Pero también, se puede expresar como el porcentaje entre el número de fallos detectados de una serie de activos:

En general, desde la concepción de un activo hasta su retirada existen tres etapas bien diferenciadas en el tiempo donde podemos alojar el origen de un fallo:

  • ETAPA 1: juventud
  • ETAPA 2: madurez
  • ETAPA 3: envejecimiento

Estas tres etapas de un activo se caracterizan, normalmente, por una tasa de fallo en forma de bañera como se observa en la siguiente imagen. De aquí viene el concepto de curva de la bañera:


ETAPA 1: JUVENTUD

La primera etapa de juventud o de Mortalidad Infantil, se considera una etapa crítica, ya que no se conoce cómo se comportará exactamente ese activo durante su operación y de él se espera una tasa de fallos muy alta. El nombre de Mortalidad Infantil viene conceptualmente de la idea de que el activo falla cuando sólo lleva pocas horas de vida de funcionamiento. En algunas ocasiones, no llega a funcionar nunca.

Por ese motivo es imprescindible que se lleve a cabo una investigación minuciosa, de lo contrario, obtendríamos numerosos errores al utilizar el activo (en tiempo de uso o explotación). Asumiendo que se ha llevado a cabo un diseño y validación robusto del activo, estos erros provienen normalmente de errores de los procesos de fabricación, montaje o instalación de los activos. A la práctica en la zona de Mortalidad Infantil, también se recogen errores de diseño que generan fallos en el activo.

Por tanto, de alguna manera, la fase de juventud de la curva de la bañera de un producto (a pocas horas de su primer encendido) nos explica que es en las etapas más tempranas de vida de un producto, cuando este falla debido a errores en su fabricación (montaje o instalación) y también diseño. Por tanto, poniendo números a nivel de ejemplo, tenemos que imaginarnos una fabricación con volumen (pongamos por ejemplo de 1.000 unidades fabricadas) puede haber un porcentaje elevado (pongamos un 1%) que falle a las pocas horas de haberse encendido por primera vez (durante las primera 72 horas).

Evidentemente y, como podemos imaginar, es conveniente que esta mortalidad infantil no llegue al cliente ya que, como veremos más adelante, el cliente ha comprado un producto con un nivel de tasa de fallo igual al de la madurez, no mayor. Como se puede observar en el gráfico de la curva de la bañera, la tasa de fallo de la madurez es bajo y precedible (en muchas ocasiones se modela con una tasa de fallo constante). Además, la Mortalidad Infantil queda normalmente dentro del periodo de garantía del activo, por tanto, tocará hacerse cargo del gasto de reposición del equipo.

Actualmente existen numerosas metodologías de control de calidad a fin de minimizar los defectos derivados de los procesos de fabricación, entre ellas se encuentran la metodología Seis Sigma (6σ) o el Control Estadístico de la Calidad (SQC6). Otra estrategia ampliamente usada es el burn in o proceso de "quemado" inicial en fábrica.

El concepto de burn in consiste en, de forma acelerada o nominal, darle horas de funcionamiento al activo en un entorno bajo control y sin que el producto haya salido de las instalaciones del fabricante, hasta llegar a las horas de funcionamiento que ubique nuestro activo en la fase de madurez.

Pongamos algún ejemplo. Si fabricásemos motores de corriente continua, lo que haríamos en nuestra fábrica sería tener una bancadas donde antes de enviar al cliente, dejaríamos durante 24 horas (por ejemplo), el motor funcionando. O si fabricásemos pulsadores, tendríamos unos útiles donde antes de enviar al cliente, haríamos 1.000 pulsaciones al pulsador antes de enviar al cliente. De este modo, los motores o los pulsadores con defectos de fabricación irían fallando, y los iríamos descartando (seguramente entrarlos en una cadena de producción de reparación y verificación) para que no llegaron dichos equipos al cliente. 

También es muy habitual cuando hablamos de instalaciones, hablar de las pruebas en vacío o marcha blanca. Tanto uno como otro, son la puesta en marcha y funcionamiento de la instalación sin, por ejemplo en el caso del ferrocarril, de pasajeros (de forma muy simplificada). Por tanto, siguiendo las misma estrategia comentada, se les da horas de explotación a la instalación sin poner en peligro a los pasajeros frente a la llegada de un fallo no esperado. Tantos horas como sean necesarias para superar la etapa de juventud y llevar al sistema a la etapa de madurez.   


ETAPA 2: MADUREZ

Superada la etapa de juventud, nos adentramos en la esperada fase de madurez o vida útil del activo. En esta etapa los fallos pueden aparecer cuando el sistema está funcionando dentro de sus condiciones nominales. Este periodo suele ser el de mayor duración y el de mayor interés, siendo siempre recomendable reemplazar el sistema antes de alcanzar la última etapa de su ciclo de vida (antes de entrar en la etapa de envejecimiento). Es importante recalcar que es en la etapa de madurez donde tendremos, o disfrutaremos, de la tasa de fallo por la cual hemos diseñado nuestro equipo.

En los modelos exponenciales utilizados en la Ingeniería RAMS esta etapa se caracteriza por que la tasa de fallos se mantiene constante. Dicho modelo exponencial corresponde al modelo más simple de los modelos de fiabilidad. Suele ser preciso para componentes electrónicos y su simplicidad posibilita también un fácil tratamiento matemático lo que con una aproximación muy cercana a la realidad justifica plenamente su aceptación.

En general, la fiabilidad de un activo la podemos medir como el tiempo medio entre dos fallos consecutivos (MTBF, Mean Time Between Failures). Por tanto, para el cálculo de dicha fiabilidad, al asumir una tasa de fallos constante, se reduce a la siguiente ecuación, siendo la tasa de fallos y el tiempo medio entre fallos (MTBF) inversamente proporcionales:

Este parámetro resulta de gran interés dentro de las metodologías destinadas a predecir la fiabilidad cuando los datos de operación son escasos, no existen o son poco rigurosos.


ETAPA 3: ENVEJECIMIENTO

Finalmente, la tercera y última etapa es conocida como etapa de envejecimiento, donde aparecen principalmente los fallos derivados del desgaste al acumular horas de funcionamiento de forma natural. En esta etapa se aprecia un crecimiento evidente en el valor de la tasa de fallo, de tal forma que el indicador de fiabilidad ve acelerada su disminución conforme pasa el tiempo. Los planes de mantenimiento son la clave para retardar al máximo la aparición de esta última etapa. Es importante balancear correctamente los costes asociados a la falta de fiabilidad, fueras de servicio y actividades de mantenimiento preventivo y correctivo (los cuales se disparan en esta etapa), con la posibilidad de reposición del activo.

En la figura anterior se representan dos curvas de bañera. La de color rojo es un ejemplo de una función real de la tasa de fallo y en cambio la curva de color azul es un ejemplo teórico donde quedan completamente delimitadas las tres fases del ciclo de vida mencionadas anteriormente: la etapa de mortalidad infantil entre los valores de tiempo 0h y 100h, la etapa vida útil (madurez) entre 100h y 600h y finalmente la etapa de envejecimiento desde 600h hasta las 900h. En contraposición, en la realidad (curva roja) las transiciones entre una etapa y otra de la tasa de fallo no se aprecian de forma tan evidente. 


En Leedeo Engineering, somos especialistas dando soporte a nuestros clientes cualquier nivel requerido a las tareas RAM y de Safety, y tanto a nivel de infraestructura o equipamiento embarcado. No dude en contactar con nosotros >>

¿Te interesan nuestros artículos sobre Ingeniería RAMS y Tecnología?

Suscríbete en nuestra newsletter y te mantendremos informado de la publicación de nuevos artículos.