Particularmente, estamos interesados en estudiar las redes neuronales artificiales entrenadas para resolver problemas de clasificación. Estas ANN tienen múltiples aplicaciones, como la identificación de comportamientos anormales de humanos, sistemas informáticos o agentes robóticos. Por ejemplo, el propósito de la detección de intrusión, fraude y lavado de dinero es distinguir entre secuencias normales de acciones y de acciones ilegales, llamadas anomalías colectivas.
Por lo general, estos problemas se abordan de la siguiente manera: dado un conjunto de secuencias etiquetadas como normales y anómalas, se entrena una ANN con el objetivo de construir un clasificador. De alguna manera, la ANN oculta un modelo de los comportamientos normales que utiliza para identificar secuencias que no se ajustan a ella.
Por lo tanto, el objetivo de nuestra investigación es proporcionar medios para extraer una representación constructiva del modelo oculto. Más precisamente, se enfoca en el problema de explicar qué es el sistema dinámico que la ANN aprendió cuando se entrena con un conjunto de secuencias etiquetadas.
Un enfoque general para resolver problemas como el que estamos considerando está dado por el marco de referencia del aprendizaje Probablemente Aproximadamente Correcto (PAC). Aquí, un aprendiz, que intenta identificar la máquina oculta dentro de la caja negra, puede interactuar con un maestro, que tiene la capacidad de responder preguntas sobre la máquina desconocida que se debe aprender. Para esto, el maestro usa un oráculo que extrae muestras positivas y negativas con alguna distribución de probabilidad.
Para abordar el problema de la explicabilidad de las ANN sobre secuencias, el plan de investigación consiste en combinar las técnicas PAC para el aprendizaje activo de gramáticas (o inferencia regular) y las basadas en redes generativas adversarias (GAN).