Jose Manuel Ortega Candel

Desarrollo de motores de búsqueda utilizando herramientas open source


Скачать книгу

/p>

      DESARROLLO DE MOTORES DE BÚSQUEDA

      UTILIZANDO HERRAMIENTAS OPEN SOURCE

      Análisis y desarrollo con Apache Lucene, Solr y ElasticSearch

      José Manuel Ortega Candel

Illustration

      DESARROLLO DE MOTORES DE BÚSQUEDA

      UTILIZANDO HERRAMIENTAS OPEN SOURCE

      Análisis y desarrollo con Apache Lucene, Solr y ElasticSearch

      José Manuel Ortega Candel

Illustration

       Desarrollo de motores de búsqueda utilizando herramientas open source

      © 2021 José Manuel Ortega Candel

      Primera edición, 2021

      © 2021 MARCOMBO, S. L.

       www.marcombo.com

      Diseño de cubierta: ENEDENÚ DISEÑO GRÁFICO

      Maquetación: D. Márquez

      Corrección: Nuria Barroso y Anna Alberola

      Directora de producción: M.a Rosa Castillo Producción del ePub: booqlab

      «Cualquier forma de reproducción, distribución, comunicación pública o transformación de esta obra solo puede ser realizada con la autorización de sus titulares, salvo excepción prevista por la ley. Diríjase a CEDRO (Centro Español de Derechos Reprográficos, www.cedro.org) si necesita fotocopiar o escanear algún fragmento de esta obra».

      ISBN: 978-84-267-3336-8

      Este libro va dedicado a aquellos que me han seguido, me siguen y me seguirán, no importa cuál sea el camino escogido, en algún lugar nos encontraremos.

       ÍNDICE

       INTRODUCCIÓN

       CAPÍTULO 1

       INTRODUCCIÓN A LOS MOTORES DE BÚSQUEDA

       1.1 Definición de motores de búsqueda

       1.2 ¿Por qué necesito un motor de búsqueda?

       1.2.1 Extracción de texto en documentos

       1.2.2 Operaciones de lectura

       1.2.3 Esquema flexible

       1.3 Funcionamiento de un motor de búsqueda

       1.3.1 Buscadores de directorios

       1.3.2 Buscadores jerárquicos

       1.3.3 Spiders (arañas o crawlers)

       1.4 Proceso de indexación

       1.4.1 Rendimiento en la indexación de documentos

       1.4.2 Stopwords

       1.4.3 Steamming

       1.5 Recuperación de la información

       1.5.1 Extracción de información

       1.5.2 Sistema de búsqueda/respuesta

       1.6 Motores de búsqueda e indexadores

       1.6.1 Lucene

       1.6.2 Índice invertido

       1.6.3 Apache Solr

       1.6.4 ElasticSearch

       1.6.5 Otros motores de búsqueda

       1.7 Herramientas de procesamiento de lenguaje natural (PLN)

       CAPÍTULO 2

       APACHE LUCENE

       2.1 Introducción a Apache Lucene

       2.2 Módulos y funcionalidades de Apache Lucene

       2.3 Arquitectura de Apache Lucene

       2.3.1 Proceso de tokenización y búsqueda en Apache Lucene

       2.4 Trabajar con Apache Lucene

       2.4.1 Configuración del entorno

       2.4.2 Crear un índice

       2.4.3 Crear y escribir documentos en un índice

       2.5 Realizar búsquedas en Apache Lucene

       2.5.1 Obtención de un IndexSearcher

       2.5.2 Proceso de búsqueda con IndexSearcher

       2.5.3