Читать книгу Desarrollo de motores de búsqueda utilizando herramientas open source - Jose Manuel Ortega Candel - Страница 6
ÍNDICE
ОглавлениеINTRODUCCIÓN A LOS MOTORES DE BÚSQUEDA
1.1 Definición de motores de búsqueda
1.2 ¿Por qué necesito un motor de búsqueda?
1.2.1 Extracción de texto en documentos
1.3 Funcionamiento de un motor de búsqueda
1.3.1 Buscadores de directorios
1.3.3 Spiders (arañas o crawlers)
1.4.1 Rendimiento en la indexación de documentos
1.5 Recuperación de la información
1.5.1 Extracción de información
1.5.2 Sistema de búsqueda/respuesta
1.6 Motores de búsqueda e indexadores
1.6.5 Otros motores de búsqueda
1.7 Herramientas de procesamiento de lenguaje natural (PLN)
2.1 Introducción a Apache Lucene
2.2 Módulos y funcionalidades de Apache Lucene
2.3 Arquitectura de Apache Lucene
2.3.1 Proceso de tokenización y búsqueda en Apache Lucene
2.4 Trabajar con Apache Lucene
2.4.1 Configuración del entorno
2.4.3 Crear y escribir documentos en un índice
2.5 Realizar búsquedas en Apache Lucene
2.5.1 Obtención de un IndexSearcher
2.5.2 Proceso de búsqueda con IndexSearcher
2.5.3 Crear consultas con Lucene QueryParser
2.5.4 Sintaxis de las consultas en Apache Lucene
2.6 Búsqueda de información con Apache Lucene
2.7 Búsqueda en múltiples índices de Lucene
2.8 Herramientas de administración de Lucene
2.9 Herramientas de búsqueda que usan Apache Lucene
2.9.3 Otros repositorios y portales
3.1 Introducción a Apache Solr
3.2 Arquitectura de Apache Solr
3.3 Indexación e índice invertido en Apache Solr
3.3.1 Relevancia y filtro en las búsquedas
3.5.1 Ficheros de configuración y esquema
3.5.3 Indexación de datos con SimplePostTool
3.5.4 Esquema administrado en Apache Solr
3.5.5 Añadir información al índice
3.6.2 Consultas básicas de Solr
3.6.3 Componente stats (estadísticas)
3.7 Consultas avanzadas de Solr
3.7.1 Paginación y clasificación
3.7.2 Navegación facetada en Solr
3.7.3 Búsqueda de facetas en Solr
3.8 Componentes de una petición en Solr
3.8.1 Controladores Request Handler
3.9 Analizadores en Apache Solr
3.9.1 Definir campos personalizados
3.9.2 Configuración de los tipos de campos
3.10 Monitorización del rendimiento de Apache Solr
3.10.1 Página de plugins/estadísticas de Apache Solr
3.11.1 Terminología usada en SolrCloud
3.12 Arrancar Apache Solr desde Docker
3.13 Interactuar con Solr desde Java
3.13.1 Añadir Solrj a un proyecto Maven
3.13.2 Conexión con el servidor Solr desde Java
3.14 Crawling con Apache Nutch y conexión con Apache Solr
3.15 Conclusiones de Apache Solr
4.1 Introducción a ElasticSearch
4.1.1 Ventajas de ElasticSearch sobre Apache Solr
4.2 Uso de ElasticSearch para proyectos de Big Data
4.3 Arquitectura de ElasticSearch
4.4 ElasticSearch como solución distribuida
4.5 Fragmentos y réplicas en ElasticSearch
4.6 Instalación de ElasticSearch
4.7 Crear un índice en ElasticSearch
4.8.1 Mapping o estructura de los datos del índice
4.8.2 Recuperar parte de un documento
4.8.3 Asignar un mapeo a un índice
4.8.4 Query DSL (solicitudes DSL)
4.8.5 Búsquedas en ElasticSearch
4.8.7 Navegación facetada en ElasticSearch
4.8.8 Agregaciones en documentos
4.8.9 Autocompletado en ElasticSearch
4.8.10 Analizadores en ElasticSearch
4.9 Relevancia de documentos en ElasticSearch
4.9.1 Puntuación y relevancia de los documentos
4.9.2 Mejorar la relevancia de los resultados de búsqueda
4.10 Estadísticas e información sobre el clúster, índices y nodos
4.10.1 Estado del clúster
4.10.3 Estadísticas de los índices
4.11 Herramientas de monitorización en ElasticSearch
4.11.2 ElasticSearch query client
5.1 Clientes de conexión en Java
5.2 Conexión al clúster de ElasticSearch
5.4 Indexación de documentos en el índice
5.5 Búsqueda de documentos en el índice
5.6 Integración con Spring Data
5.7 Seguridad en ElasticSearch
5.8 Conclusiones de ElasticSearch
VISUALIZACIÓN DE DATOS CON KIBANA
6.2.2 Stack ELK en contenedores Docker
6.4.2 Configuración de LogStash
6.4.3 Otros servicios de Elastic
6.5 Monitorización de LogStash desde Kibana
MOTORES DE BÚSQUEDA CON PYTHON
7.1 Conectando con Solr desde Python
7.2 Integración de ElasticSearch con Python
7.2.1 Crear un índice e insertar documentos usando Python
7.2.2 Realizar búsquedas usando Python
7.3 Consultar ElasticSearch a través de la API REST en Python
7.4 Optimizar un índice en ElasticSearch
7.5 Indexar documentación de Django
7.6 Whoosh como motor de búsqueda en Python
7.6.2 Realizar búsquedas en Whoosh y scoring