log_aft

Rediseño del proceso de gestión de incidentes para la continuidad del negocio de AFT

El modelo de servicios diseñado para Transantiago es de gran complejidad, al trasladarse de un sistema de transporte con  múltiples operadores, tarificación combinada, redes de carga de tarjetas con una importante capilaridad, un alto volumen de pasajeros y otros aspectos de integración y combinaciones que hacen de Transantiago un proyecto único a nivel mundial.

Para la correcta entrega de los servicios comprometidos con la autoridad, clientes y usuarios de Transantiago se configuran cuatro capas que deben tener una correcta interconexión para que sea eficaz y efectiva la entrega de servicios. Si una de estas capas o uno de sus componentes no funciona adecuadamente provocará un efecto en cadena que imposibilitará la entrega de los servicios comprometidos. Esto se debe al modelo distribuido de servicios externos de distinta tecnología y de distintos proveedores interconectados, con un alto nivel de transacciones: más de 180.000.000 transacciones mensuales de uso y más de 7.500.000 transacciones mensuales de  carga, estas últimas utilizadas como insumo en parte de este proyecto.

En la actualidad AFT no cuenta con un sistema de alerta temprana de la disponibilidad de componentes de negocio, lo que significa un excesivo tiempo en detectar una indisponibilidad del servicio o precisar la componente que causa la pérdida del mismo. Tampoco posee un mecanismo formal para el seguimiento y solución de todos los problemas que se puedan presentar en las distintas componentes utilizadas para la entrega de los servicios. Actualmente se tiene sólo un procedimiento para la formalización de atención de fallas con el operador tecnológico, quedando el resto de los proveedores de servicio fuera de este mecanismo.

Para asegurar la continuidad de servicios se utilizaró el Modelo de Gobernabilidad para la Continuidad Operacional de los servicios prestados por el Administrador Financiero del Transantiago (AFT). Este modelo conforma un marco objetivo para responder de manera adecuada a eventos que comprometan los servicios bajo su responsabilidad; para ello  AFT ha establecido un conjunto de lineamientos orientados a mantener la continuidad de dichos servicios (Continuidad Operacional) al mismo tiempo de realizar las actividades necesarias para corregir el problema que genera la interrupción y permitir la recuperación de servicios.

El proyecto se enmarca dentro del plan de Continuidad Operacional de AFT y l rediseñó del proceso de gestión de incidentes para la continuidad del negocio. El rediseño del proceso de gestión de incidentes se focalizó en la necesidad de gestionar los incidentes de continuidad de negocios de AFT, analizando eventos reflejados inicialmente en el estado de las distintas señales provistas por las distintas entidades que forman parte de la cadena de servicios ofrecidos por AFT, para inferir los estados de servicios y entidades.

Los incidentes que sean detectados serán gestionados en dos instancias; la primera a través de un escalamiento oportuno, de tal forma de manejar adecuadamente la contingencia apenas ésta suceda y como segunda instancia, el análisis respecto al origen de ésta, mediante la recopilación de los antecedentes, consecuencias y evidencias. Para esto se utilizará un mecanismo de administración de fallas; esto se traduce en una solución tecnológica que actualmente opera con el operador tecnológico.

Para soportar el proceso de gestión de incidentes se desarrolló una solución tecnológica que se basa en el tratamiento de señales que envía el operador tecnológico. Estas se refieren al funcionamiento de los sistemas centrales, corazón del andamiaje tecnológico, y que sirve de base para que los servicios puedan ser entregados a los distintos grupos de interés de AFT y las señales de los proveedores de las capas posteriores de servicios, que  sirven para determinar e indicar los posibles puntos de interrupción de servicios.

El punto más sensible de los sistemas centrales y que impacta a los usuarios de Transantiago es el Switch transaccional, el cual permite la comercialización de cuotas de transporte. Es en este sentido que se implementó una solución tecnológica que permite determinar la cobertura de cuotas de transporte en base al pronóstico de demanda de cuotas de transporte, lo cual es fundamental para determinar la oferta disponible y el tiempo en que ésta será consumida, lo que a su vez determinará el tiempo disponible para que el sistema Switch sea repuesto en caso de que salga de servicio.

Para determinar la cobertura de cuotas de transporte se establecieron tres actividades no triviales, tanto por su complejidad y gran volumen de transacciones, que fueron automatizadas; estas son “Pronosticar demanda”, “determinar saldo de cuotas de transporte” y finalmente “determinar el tiempo de cobertura de cuotas de transporte”, lo que permitió determinar el tiempo entre el punto de interrupción y el punto en el cuál debe estar el Switch funcionando nuevamente.

Como resultados se espera:

  1. Disminuir el excesivo tiempo que AFT toma en detectar una indisponibilidad del servicio o precisar la componente que causa la pérdida del mismo. Gestionar la solución de alguna interrupción de los servicios comprometidos a los usuarios de Transantiago.
  2. Formalizar el mecanismo para el seguimiento y solución de todos los problemas que se puedan presentar en las distintas componentes utilizadas para la entrega de los servicios.
  3. Mejorar el proceso por el cual se determina el tiempo máximo de inactividad que puede soportar la disponibilidad de venta de cuotas de transportes (vía Switch transaccional de AFT), de tal forma de no afectar este servicio tan sensible para los usuarios de Transantiago.
  4. Disminuir la exposición a multas por indisponibilidad de servicios

El proyecto se encuentra implementado y la AFT ha prácticamente eliminado las multas que recibía por no disponibilidad de servicios en relación a cuotas de transporte.

 Proyecto realizado por Rodrigo Echeverría

Deja un comentario