Relevancia |
En esta sección es posible aumentar o disminuir la relevancia otorgada a cada uno de los criterios que se tienen en cuenta en la búsqueda general.
Tabla de relevancia estándar
Para ajustar el valor de los criterios de relevancia, utilice el control deslizante para definir el valor deseado, o llene el campo disponible al lado del control. Es posible establecer un valor de 0 a 50.
¿Cómo funciona la relevancia? El orden de los resultados de Elasticsearch se obtiene mediante una puntuación de similitud mediante el algoritmo Okapi BM25. En este algoritmo, se tienen en cuenta los siguientes factores para calcular la puntuación: 1.Frecuencia del término de búsqueda en cada uno de los campos indexados. 2.Tamaño de cada campo indexado que contiene el término. 3.Cantidad de documentos que tienen el término.
Luego se realiza un cálculo matemático que une estos tres factores. Por ejemplo, un documento que contiene dos veces el término "depósito" y solo tiene 1000 palabras es más relevante que otro documento que tiene tres veces el término "depósito" pero tiene 10.000 palabras.
Esto se debe a que, en un texto con menor volumen de caracteres, el tamaño del documento puede terminar siendo más relevante que la frecuencia (obviamente, si aumenta la frecuencia de términos, se reconsiderará el análisis, ya que es una suma de los tres factores).
Sin embargo, si un texto tiene una frecuencia alta de una palabra (especialmente si el texto es más pequeño), la relevancia de ese término será menor para el documento, ya que el algoritmo lo considera como un "término común" en dicho documento.
Además, una vez obtenida la puntuación del algoritmo, se multiplica por el valor del campo previamente definido en las relevancias.
Por eso, es importante comprobar si existen atributos que contengan el término en el documento buscado, ya que estos también incrementarán la puntuación de búsqueda.
|