Читать книгу Inteligencia artificial y administración tributaria: eficiencia administrativa y defensa de los derechos de los contribuyentes - Fernando Serrano Antón - Страница 7
2. INTELIGENCIA ARTIFICIAL
ОглавлениеEn verano de 1956 se celebró una reunión en el Darmouth College, donde se acuñó por primera vez la expresión “Inteligencia Artificial”. El objetivo de la reunión era emular el comportamiento inteligente de las personas utilizando una computadora. Han transcurrido 65 años, pero no se ha sido capaz de conseguir plenamente este objetivo. Se ha avanzado en determinadas áreas, pero no se ha conseguido la emulación completa. Pero estos 65 años no han sido improductivos. De hecho, el número de proyectos de investigación y desarrollo con resultados positivos es muy grande y crece año tras año.
Encontrar una teoría computable que contemple la totalidad del comportamiento humano no ha sido posible. El comportamiento humano implica entre otras las siguientes actividades: percibir, sentir, memorizar y recordar, decidir y actuar. No resulta extraño que entre la docena de personas que formaron parte de la reunión de 1956 figurasen matemáticos, ingenieros, físicos y psicólogos.
IBM ha creado una división específica para la Inteligencia Artificial (IA), que denomina Watson, que es el nombre del fundador de la compañía.
Ha decidido organizar sus actividades de Investigación y Desarrollo de IA en tres áreas: Entender (Understand), Razonar (Reason) y Aprender (Learn).
Entender, la U, consiste en traducir al lenguaje simbólico la realidad exterior sobre la que se quiere actuar. Se trataría de emular el comportamiento humano de la percepción. La traslación a un lenguaje entendible por los ordenadores es el principio del proceso. Inicialmente, los esfuerzos de investigación se centraron en transformar a un lenguaje simbólico las percepciones de los sentidos humanos: textos, sonidos, imágenes estáticas y en movimiento.
La inteligencia artificial ha desarrollado unas capacidades increíbles. Los ordenadores son capaces ahora de entender información no estructurada. Como ejemplo de lo anterior, está la rama de la IA denominada NLU, que es un acrónimo de Natural Language Understanding. Lenguaje Natural es una alternativa al Lenguaje Formal. Éste exige unas reglas para que pueda ser entendido por los ordenadores. Con la NLU el ser humano se puede expresar libremente y el ordenador es ahora capaz de entenderle. El lenguaje puede ser utilizado por medio oral o escrito. Imagínese una solicitud, escrito o comunicación presentada por Registro. Aplicando NLU se puede conocer el contenido del documento sin necesidad de que ninguna persona lo lea.
El funcionamiento de la tecnología NLU se basa en tres fases: Primero identifica las oraciones en un texto, después realiza un análisis sintáctico y finalmente procede a efectuar el análisis semántico para darle significado. El análisis semántico se basa, en una parte, en diccionarios que asocian a un significante todos los significados posibles y, en otra parte, en el análisis del contexto. Para ello puede utilizar diccionarios específicos para un dominio determinado, por ejemplo, un diccionario de términos tributarios. También se apoya en el análisis del texto anteriormente tratado del mismo documento.
Esta tecnología se puede aplicar también a textos hablados. Para ello es necesario convertir los audios primero a texto con soluciones del tipo Speech to Text (STT).
El siguiente paso consistió en entender imágenes que no fueran texto. Así, por ejemplo, se puede identificar si una plaza de aparcamiento está o no ocupada, para poder ofrecer un servicio de aparcamiento inteligente (Smart parking). También entender sonidos; las aplicaciones informáticas pueden reconocer una canción con sólo escucharla.
Visto el éxito alcanzado, se extendió la capacidad de entendimiento (la U) a cualquier realidad física. En un proyecto de agricultura inteligente, se puede conocer la cantidad de potasio que existe en un terreno analizando el espectro de frecuencias de la reflexión de una irradiación. La industria ha desarrollado sensores para medir casi todo. Esto es una de las partes del Internet de las cosas (IOT). Lo que ofrecen las capacidades de la U de la inteligencia artificial es transformar esas mediciones a un lenguaje que los ordenadores puedan procesar.
El siguiente grupo de desarrollos relativos a la IA tiene que ver con el razonamiento: La R.
Razonar supone, como es sabido, aplicar unas reglas de actuación a un caso concreto. La IA también pretende hacer esto.
Estas actividades se subdividen a su vez en: Calificar, primero, el conjunto de las señales recibidas con el fin de poder decidir. La segunda es tomar la decisión, que puede hacerse a partir de reglas previamente establecidas (Sistema Basado en Reglas) o, recordando un caso similar y los resultados de las diferentes decisiones adoptadas con anterioridad sobre los mismos (Sistema Basado en Casos Pasados). La IA también permite combinar ambos Sistemas.
En los sistemas basados en casos pasados se trata de un razonamiento creativo; No se aplican reglas predefinidas. El propio análisis de los casos tratados con anterioridad permite inferir las reglas que se podrían aplicar a un caso concreto.
La tercera actividad de la fase R consiste en actuar. Aquí se trasladan los símbolos derivados de la actividad anterior en acciones que repercuten en el medio externo. Previamente, se ha tenido que evaluar las diferentes alternativas posibles y haber escogido una de ellas. La actuación repercute en el mundo exterior.
Si comparamos estas tres fases con el razonamiento humano, se confirma la identidad del proceder humano con la actividad de la IA que acaba de ser descrita:
• Utilizar la representación interna de las percepciones del medio externo, como por ejemplo las imágenes interiores del medio. De hecho, se podría decir que se activan determinadas percepciones guardadas en la memoria.
• Realizar procesos de inferencia intelectual generando nuevas imágenes interiores, para seleccionar una acción.
• Retrasladar al medio externo las imágenes interiores mediante acciones.
Una vez se actúa el medio externo reacciona. Si se mide esta reacción, se puede aprender. Sería la fase L del modelo de IA expuesto.
El aprendizaje (L) permite la realimentación. Hace posible ajustar el proceso de razonamiento R a los resultados obtenidos y también contribuye a verificar si se ha percibido bien la realidad (U).
No se debe confundir el aprendizaje con el entrenamiento. El entrenamiento sirve para enseñar al sistema a entender la realidad física sobre la que se desea actuar y para ajustar de inicio los modelos de decisión.
Se trata, en resumidas cuentas, de adaptar los modelos matemáticos, denominados algoritmos, para que se ajusten a las observaciones del mundo real.
Las técnicas de aprendizaje automático permiten parametrizar estos modelos utilizando datos de experiencias pasadas. De este modo se pueden identificar ciertos patrones para construir aproximaciones al problema que se quiere resolver.
La industria de las TIC ha desarrollado diversos modelos de inferencia que, sólo necesitan de datos pasados, para ser entrenados. No es necesario construir estos algoritmos. Están disponibles en el mercado para su utilización.
Entre otros modelos disponibles, están los siguientes:
• Redes neuronales.
• Árboles de decisión.
• Regresión logística.
A modo de ejemplo para ilustrar el aprendizaje de la fase de entendimiento (U): Si se quiere transformar un espectro de frecuencias en algo computable, tendremos que entrenar el modelo para que entienda las mediciones. Habrá que aportar casos previos, dónde se alimente al sistema con mediciones físicas con sus correspondientes valores simbólicos.
El entrenamiento de la fase de razonamiento (R) se podría ilustrar con el siguiente ejemplo:
Supóngase que se quiere construir (entrenar) un modelo que ayude a seleccionar facturas a inspeccionar que puedan ser falsas. Habrá que utilizar casos positivos: relaciones comerciales emisor-receptor en las que la Inspección de Hacienda haya calificado la factura como factura falsa y también casos negativos que serían facturas examinadas por la Inspección que hayan sido calificadas como correctas. Con estos dos subconjuntos se podrá entrenar un modelo que prediga con un índice de verosimilitud si una factura es falsa o no lo es.
Al existir distintos modelos de inferencia, hay que seleccionar el que mejor reproduzca la realidad que se quiere emular. Para ello hay que entrenar los diferentes modelos disponibles con los datos disponibles y comprobar cuál hace una mejor aproximación.
Para ello se separan determinados casos pasados de los casos utilizados para entrenar. Se distingue, por tanto:
• Conjunto de casos para entrenar.
• Conjunto de casos para supervisar.
Los casos de entrenamiento sirven para ajustar los diferentes algoritmos a comparar.
Los casos de supervisión sirven para medir el nivel de acierto.
Se define la precisión del modelo como el porcentaje de aciertos sobre el conjunto de supervisión.
Una consideración adicional: el ejemplo expuesto será un modelo de decisión interpretable, si es capaz de explicar la razón por la que ha realizado determinada valoración de una factura.
La capa inferior de la figura, que representa la inteligencia artificial, es la relativa al conocimiento. Si bien los restantes subsistemas (URL) se basan en ella, son a su vez independientes de la misma. Puede cambiar el conocimiento, pero se mantienen las herramientas de la URL (entender, razonar y aprender). Así, por ejemplo, en el ejemplo de las facturas falsas, a medida que se detecten nuevos casos positivos y negativos se enriquecerá la capa del conocimiento, pero el resto de los componentes seguirán operativos con la condición de que sean reentrenados con los nuevos casos. De hecho, el comportamiento de los emisores y receptores de facturas falsas irá cambiando a medida que se den cuenta de que son descubiertos. Pero el modelo reaccionará a estos cambios de comportamiento, si se incluyan en la base de conocimiento.
Tal y como ha sido apuntado, el modelo de razonamiento puede basarse en reglas (SBR) y en casos pasados (SBC). El modelo SBR tiene su origen en los denominados sistemas expertos a finales de los 70. Los expertos en una materia definen las reglas en base a su experiencia y la etapa R tiene que realizar un proceso de equiparación para identificar la regla aplicable a los hechos o afirmaciones de partida.
Los SBC nacen a finales de los 90. Ya no es necesario definir las reglas a priori. La IA infiere los modelos de decisión a partir de los casos conocidos que son, de hecho, el nuevo conocimiento.
No es fácil encontrar un problema de inteligencia artificial para el que se disponga de forma precisa y completa de todo el conocimiento necesario para establecer reglas que permitan su solución. El tipo de conocimiento a aplicar habrá de ser de ambos tipos: Se aplicarán algunas reglas proporcionadas por expertos y también se hará uso de los casos previamente recopilados.