Inferencia incierta - Enciclopedia

La inferencia incierta fue descrita por primera vez por C. J. van Rijsbergen como una manera de definir formalmente la relación entre una consulta y un documento en la recuperación de información. Esta formalización es una implicación lógica con una medida de incertidumbre adjunta.

Definiciones
Rijsbergen propone que la medida de incertidumbre de un documento d para una consulta q sea la probabilidad de su implicación lógica, es decir:




P
(
d

q
)


{\displaystyle P(d\to q)}


Una consulta de un usuario puede interpretarse como un conjunto de afirmaciones sobre el documento deseado. Es tarea del sistema inferir, dada una documento particular, si las afirmaciones de la consulta son verdaderas. Si lo son, se recupera el documento.
En muchos casos, el contenido de los documentos no es suficiente para afirmar las consultas. Se necesita una base de conocimiento de hechos y reglas, pero algunas de ellas pueden ser inciertas porque puede haber una probabilidad asociada a su uso para la inferencia. Por lo tanto, también podemos referirnos a esto como inferencia plausible. La plausibilidad de una inferencia



d

q


{\displaystyle d\to q}

es una función de la plausibilidad de cada afirmación de la consulta. En lugar de recuperar un documento que coincida exactamente con la consulta, deberíamos clasificar los documentos según su plausibilidad en relación con esa consulta.
Dado que d y q son ambos generados por usuarios, son propensos a errores; por lo tanto,



d

q


{\displaystyle d\to q}

es incerto. Esto afectará la plausibilidad de una consulta dada.
Al hacerlo, logra dos cosas:

Separar los procesos de revisión de probabilidades de la lógica
Separar el tratamiento de la relevancia del tratamiento de las solicitudes
Los documentos multimedia, como imágenes o videos, tienen propiedades de inferencia diferentes para cada tipo de dato. También son diferentes de las propiedades de los documentos de texto. El marco de inferencia plausible nos permite medir y combinar las probabilidades que provienen de estas propiedades diferentes.
La inferencia incierta generaliza las nociones de lógica autoepistémica, donde los valores de verdad son o conocidos o desconocidos, y cuando se conocen, son verdaderos o falsos.

Ejemplo
Si tenemos una consulta de la forma:




q
=
A

B

C


{\displaystyle q=A\wedge B\wedge C}


donde A, B y C son afirmaciones de la consulta, entonces para un documento D queremos la probabilidad:




P
(
D

(
A

B

C
)
)


{\displaystyle P(D\to (A\wedge B\wedge C))}


Si transformamos esto en la probabilidad condicional



P
(
(
A

B

C
)

|

D
)


{\displaystyle P((A\wedge B\wedge C)|D)}

y si las afirmaciones de la consulta son independientes, podemos calcular la probabilidad total de la implicación como el producto de las probabilidades individuales de las afirmaciones.

Trabajo adicional
Croft y Krovetz aplicaron la inferencia incierta a un sistema de recuperación de información para documentos de oficina llamado OFFICER. En los documentos de oficina, la suposición de independencia es válida ya que la consulta se centrará en sus atributos individuales. Además de analizar el contenido de los documentos, también se puede consultar sobre el autor, el tamaño, el tema o la colección, por ejemplo. Idearon métodos para comparar los atributos de los documentos y las consultas, inferir su plausibilidad y combinarlos en una calificación general para cada documento. Además de eso, también se tenía que abordar la incertidumbre del contenido de los documentos y las consultas.

Las redes lógicas probabilísticas es un sistema para realizar inferencia incierta; los valores de verdad crudos verdadero/falso no solo se reemplazan por una probabilidad, sino también por un nivel de confianza, que indica la certeza de la probabilidad.

Las redes lógicas de Markov permiten realizar inferencia incierta; las incertidumbres se calculan utilizando el principio de entropía máxima, de manera análoga a la forma en que las cadenas de Markov describen la incertidumbre de los autómatas de estado finito.

Véase también
Lógica borrosa
Lógica probabilística
Razonamiento plausible
Probabilidad imprecisa

Referencias