Читать книгу Inteligencia artificial y administración tributaria: eficiencia administrativa y defensa de los derechos de los contribuyentes - Fernando Serrano Antón - Страница 9
4. INTELIGENCIA ARTIFICIAL EN LA LUCHA CONTRA EL FRAUDE
ОглавлениеLa lucha contra el fraude ya sea en fase de declaración o en fase de recaudación, no se limita únicamente a la detección y regularización posterior. Las fases previas de prevención y disuasión son igual de importantes. Prevenir, consiste en evitar que se cometa la infracción y, disuadir, consiste en influir para que no se cometan comportamientos ilícitos. Para ello es necesario que el potencial infractor perciba que la probabilidad de ser descubierto es alta.
La piedra angular de ambas actividades es la detección del fraude. Consiste en identificar patrones de fraude, para analizar la forma de evitar que se cometan, o en hacer patente, que, de cometerse, el fraude será detectado y, consiguientemente, regularizado.
Uno de los valores que tiene el sistema de información de una Administración Tributaria, es que tiene recogida toda la actividad administrativa y la documentación que recoge la motivación de los actos administrativos. Con estas premisas se puede aplicar la inteligencia artificial para detectar los patrones de las actividades de fraude.
Nuevamente, se va a acudir a ejemplos reales para ilustrar estas posibilidades.
En el caso, ya citado, del modelo predictivo para calificar una factura como falsa o real, se podría analizar el texto de las actas de inspección, incoadas durante años, donde se recoge la calificación de facturas falsas hecha por los actuarios.
Utilizando las tecnologías de NLU, se pueden analizar los textos de las actas para localizar expresiones como “factura falsa”, “factura irregular”, “factura que no recoge una operación real” y otras expresiones con el mismo contenido semántico, para identificar una relación emisor-receptor ficticia.
Una vez identificada la dupla, ésta se enriquece con información adicional de ambos obtenida a partir del sistema de información de la Administración Tributaria. Del mismo modo se podrían obtener duplas de cliente-proveedor de obligados tributarios inspeccionados en los que las actas no hicieran referencia a la existencia de facturas falsas. También se le añadirían las mismas variables de información que a los casos anteriores. Los primeros serían los casos positivos (los malos) y los segundos serían los casos negativos (los buenos).
Con estos casos se puede entrenar un modelo de predicción de facturas falsas. Las variables actuarían como discriminantes en la tarea de clasificación. Se agruparían los casos de entrenamiento, según su perfil. Algunos perfiles darían sólo casos de facturas falsas y otros de casos de facturas reales.
La clasificación de los casos identificados, en la fase de entrenamiento del colectivo de facturas falsas podría mostrar diferentes comportamientos que motivan el comportamiento indebido: Fraude fiscal, financiación bancaria a través de facturas falsas y justificación ficticia de subvenciones, entre otras razones.
Si se aplica el modelo URL a este caso, habría que distinguir la fase de entrenamiento de la de ejecución.
En fase de entrenamiento, la U sería la aplicación de tecnologías de NLU para identificar las relaciones emisor-receptor a partir del texto de las actas, tanto las que han sido calificadas como factura falsa, como las que no. La fase R sería la de generar un modelo de clasificación utilizando relaciones cliente proveedor calificadas como falsas y otras que no lo han sido.
En fase de ejecución, la U sería la actividad realizada para que, una vez suministrada una factura con la identificación del emisor y del receptor, enriquecer la dupla con variables del sistema de información de la Administración Tributaria. La R consistiría en aplicar el modelo entrenado para clasificar la factura según su perfil en algunos de los grupos obtenidos en el entrenamiento y la L sería recoger el feedback de la Inspección una vez inspeccionado el receptor de la factura. Este feedback se incorporaría como un caso nuevo para poder reentrenar el modelo.
¿Cómo podría aplicarse este modelo a la disuasión? Habría que identificar la factura falsa antes de que se hubiese recogido como gasto o como deducción en el impuesto correspondiente. Ello permitiría aplicar este modelo para identificar facturas a las que, al menos, habría que pedir alguna aclaración, con lo que en caso de ser falsa se actuaría de forma desincentivadora.
Otro ejemplo podría ser el de construcción de un modelo para prevenir situaciones de insolvencia. En este caso la detección temprana de patrones de vaciamiento patrimonial podría activar la aplicación de medidas cautelares que impidiesen el vaciamiento. Aquí se trataría de medidas preventivas.
Para la construcción de un modelo de este tipo, se podría aprovechar la información relativa a los deudores tributarios y clasificarlos, para el entrenamiento del modelo, en los supuestos en los que se haya producido una declaración de fallido (positivos) y aquellos otros, que hubiesen cumplido con su obligación de pago (casos negativos).
La construcción de estos modelos tiene además una ventaja adicional. Como se ha comentado, en el sistema de información de una Administración Tributaria se halla registrado el rastro de muchos miles de actuaciones y el efecto de las mismas. Los aplazamientos concedidos recuperados y los no recuperados, los obligados tributarios seleccionados para inspección y el resultado de las inspecciones…. Todo está actividad está además documentada. Con la aparición del expediente electrónico estos documentos son electrónicos, por lo que son susceptibles de tratamiento informático aplicando NLU. Este conocimiento es un conocimiento implícito. Con la IA se puede convertir en conocimiento explícito: se pueden construir modelos de predicción o de decisión que se entrenen con los rastros informáticos que ha dejado la actividad de la Administración Tributaria durante más de 30 años.
La construcción de este tipo de modelos utilizaría el conocimiento implícito de los casos registrados en los sistemas de información. Se generaría conocimiento explícito a partir del conocimiento implícito de un sistema basado en casos.
Pero tampoco debe desdeñarse la posibilidad de aprovechar el conocimiento que tienen los expertos utilizando reglas. De hecho, las Administraciones Tributarias han basado sus sistemas de selección en cruces informáticos basados en la experiencia de los inspectores.
Un aspecto importante es la velocidad de respuesta ante las nuevas demandas de los expertos. Una de las ventajas de los sistemas de IA es desvincular la capa del conocimiento del resto de actividades URL. Ello permite implantar nuevos criterios de selección casi de forma inmediata. En la AEAT este paso se dio inicialmente con la herramienta CLASE y posteriormente con el ZÚJAR. Como se ha mencionado, los dos sistemas de razonamiento, Sistemas basado en Reglas (SBR) y Sistemas basados en Casos (SBC), son complementarios. Incluso el resultado de los SBC se puede convertir en reglas en la medida que se confirme la precisión de aquéllos.
Nuevamente, un ejemplo puede ayudar a explicar lo que se pretende decir. Supóngase que el modelo de clasificación para detectar determinado tipo de fraude pone de manifiesto, que hay un conjunto de casos de fraude, en los que concurre determinada variable, que no se había tenido en cuenta en los sistemas basado en reglas. La detección de esta variable “oculta” haría que se incorporase en los nuevos cruces, convirtiéndose en una regla nueva.
Hay otro campo de la lucha contra el fraude, en el que el sistema basado en reglas puede ser muy relevante. Consiste en un sistema basado en reglas que parta del resultado final. Se trata de verificar determinadas hipótesis de partida. El procedimiento normal de aplicación de reglas consiste en partir de hechos y afirmaciones de partida y obtener conclusiones aplicando reglas. Estas conclusiones pueden ser, a su vez, las entradas de nuevas reglas. Este método de inferencia se denomina encadenamiento hacia adelante. Los antecedentes generan los consecuentes. No se conocen a priori las conclusiones finales.
Por el contrario, en el encadenamiento hacia atrás se parten de las conclusiones y se trata de comprobar si hay hechos y afirmaciones de partida que sean coherentes con las conclusiones.
La experiencia de los inspectores expertos consistiría en definir las reglas de comprobación. Partiendo de hechos, se puede llegar a generar pruebas que demuestren la comisión de fraude. Este proceso de inferencia puede ser inmediato: los hechos probados permiten inferir directamente la comisión de fraude. o, por el contrario, pueden ser indicios sobre los que hay seguir trabajando para obtener pruebas finales o nuevos indicios. Una vez establecidas las reglas, se podría realizar el encadenamiento hacia adelante o, partiendo de la intuición, realizar el encadenamiento hacia atrás y encontrar hechos consistentes con el razonamiento basado en los objetivos finales.
Este tipo de conocimiento sería de sumo interés para una Administración Tributaria. Serviría como guía de actuaciones en cualquier procedimiento de comprobación.
El gráfico siguiente puede servir para explicar mejor un sistema basado en reglas aplicándolo a la obtención de pruebas en el ejemplo expuesto de detección de facturas falsas.
Se supone que un modelo de predicción entrenado a partir de casos asigna una probabilidad alta de que una factura sea falsa. Ahora hay que obtener las pruebas necesarias para demostrarlo. Se parte pues de una hipótesis final h (en verde). Aplicando el encadenamiento hacia atrás se deben de cumplir las condiciones a y x para que se aplique la regla 6 (a&x→h). La condición x podría consistir a su vez en la comprobación de la no acreditación de la prestación de un determinado servicio (regla 4) y la condición a en la comprobación de que el pago se ha realizado en efectivo (regla 3) o de que habiéndose pagado mediante cheque (regla 2) o transferencia (regla 8) el ingreso se ha retirado inmediatamente después de haberse abonado en cuenta. Estas tres posibilidades se representan a la entrada del rectángulo vertical azul de la derecha. Cada una de estas tres posibilidades exigiría unas comprobaciones previas como se puede ver en la figura. Serían los antecedentes de las reglas 2, 3 y 8.
El encadenamiento hacia adelante consiste en partir de los datos existentes en el sistema de información y los hechos recogidos en las diligencias de constancia de hechos. A partir de estas premisas, se seleccionarían las reglas cuyas condiciones sean compatibles con ellas. La búsqueda del conjunto de reglas que son compatibles con las condiciones anteriores se denomina equiparación. El resulta de la regla seleccionada se convierte en una nueva premisa, por lo que el proceso de equiparación se debe de ejecutar de nuevo para identificar nuevas reglas de aplicación.
En la práctica inspectora, el actuario parte de la información existente en el Sistema de Información de la Administración Tributaria y de los hechos recogidos en las diligencias de constancia de hechos. Estos elementos constituyen las premisas de las reglas aplicables. En IA, a los primeros se les denomina Base de Hechos y a las reglas, Base de Conocimiento de un SBR (Sistema Basado en Reglas).
Si se incorporara, además, la NLU como elemento de la U del URL, se podrían identificar los hechos recogidos en las diligencias de constancia de hechos e incorporarlos a la Base de Hechos para aplicar la tecnología de un SBR a partir del proceso de equiparación. Sería la R. Una vez incoadas las actas de inspección la confirmación de propuesta de la liquidación por parte del Inspector Jefe y la ulterior firmeza de la liquidación serviría para verificar la validez del sistema de razonamiento aplicado. Sería la L. En caso contrario habría que revisar las reglas para perfeccionarlas o revisar si se han acreditado correctamente los hechos (U).
Una observación importante para tener en cuenta: Las reglas son similares a las condicionales If-Then de la mayoría de los lenguajes de programación. Una diferencia importante es, que en un sistema de IA del tipo SBR no es necesario reprogramar cuando se cambia una regla. Basta con incluirla en la Base de Conocimiento y sería de aplicación inmediata.
Puede suceder que para unas premisas determinadas exista más de una regla aplicable. A esta situación de le denomina conflicto de reglas. En estos casos las soluciones de IA admiten varias alternativas: Dar prioridad a la regla de menor número, a la regla que tenga mayor número de cláusulas antecedentes…