不確かな推論 - 百科事典

不確実な推論は、C.J. van Rijsbergenが情報検索におけるクエリとドキュメントの関係を形式化する方法として初めて説明しました。この形式化は、不確実性の測定を伴う論理的含意です。

定義
Rijsbergenは、ドキュメントdがクエリqに対する不確実性の測定を、その論理的含意の確率として提案しました、すなわち：

P(d → q)

{\displaystyle P(d\to q)}

ユーザーのクエリは、望むドキュメントに関する断言の集合として解釈できます。システムのタスクは、特定のドキュメントを与えられた場合、クエリの断言が真であるかどうかを推論することです。それが真である場合、ドキュメントは検索されます。

多くの場合、ドキュメントの内容はクエリを主張するには十分ではありません。事実とルールの知識ベースが必要ですが、その一部は、推論に使用する確率が関連しているため不確実である可能性があります。したがって、これも適切な推論とも言えます。推論の適切性は、各クエリの断言の適切性の関数です。クエリに完全に一致するドキュメントを検索するのではなく、そのクエリに関する適切性に基づいてドキュメントをランク付けするべきです。

dとqはともにユーザーによって生成されるため、誤りが発生しやすく、したがって

d → q

{\displaystyle d\to q}

は不確実です。これは、与えられたクエリの適切性に影響を与えます。

これにより、以下の2つのことを達成します：

確率の修正プロセスと論理を分離
関連性の処理とリクエストの処理を分離

メディアドキュメント、例えば画像や動画は、それぞれのデータ型ごとに異なる推論プロパティを持っています。これらはテキストドキュメントのプロパティとも異なります。適切な推論のフレームワークは、これら異なるプロパティからくる確率を測定および組み合わせることを可能にします。

不確実な推論は、真値が既に知られているか未知である、そして知られている場合には真か偽かであるという自己論理論の概念を一般化します。

例
以下のような形式のクエリを持っている場合：

q = A ∧ B ∧ C

{\displaystyle q=A\wedge B\wedge C}

ここでA、B、Cはクエリの断言であり、ドキュメントDに対して、以下のような確率を求めたいとします：

P(D → (A ∧ B ∧ C))

{\displaystyle P(D\to (A\wedge B\wedge C))}

このことを条件確率

P((A ∧ B ∧ C) | D)

{\displaystyle P((A\wedge B\wedge C)|D)}

に変換し、クエリの断言が独立している場合、個々の断言の確率の積として全体の含意の確率を計算できます。

研究の進展
CroftとKrovetzは、不確実な推論をOFFICERと呼ばれるオフィスドキュメントのための情報検索システムに適用しました。オフィスドキュメントでは、クエリは個々の属性に焦点を当てるため、独立性の仮定が有効です。ドキュメントの内容を分析するだけでなく、著者、サイズ、トピックやコレクションなどについてもクエリできます。彼らは、ドキュメントとクエリの属性を比較し、その適切性を推論し、各ドキュメントに対する総合評価に組み込む方法を考え出しました。これに加えて、ドキュメントとクエリの内容の不確実性も取り扱う必要がありました。

確率論理ネットワークは、不確実な推論を実行するシステムです；鮮明な真/偽の真値は、確率だけでなく、確率の確証度として置き換えられます。Markov連鎖が有限状態機械の不確実性を記述するのと同様に、最大エントロピー原理を使用して不確実性を計算します。

参考情報
ぼやけ論理
確率論理
適切な推論
不確実確率

参考文献