「修辞構造理論」 - 百科事典

修辞構造理論(RST)は、テキストの部分間の関係を記述するテキスト構造の理論です。これはもともとウィリアム・マン、サンダ・トーション、クリスチャン・M・I・M・マティッセンらによって南カリフォルニア大学の情報科学研究所(ISI)で開発され、1988年の論文で定義されました。この理論は、コンピュータに基づくテキスト生成の研究の一環として開発されました。自然言語研究者たちはその後、テキスト要約や他のアプリケーションでRSTを使用し始めました。RSTは、テキストの階層的で連結した構造を仮定することで、一貫性を説明します。2000年には、ISIのダニエル・マルクが、RSTを使用することで実際のディスカースパーサリングやテキスト要約も達成できることを示しました。

修辞関係
修辞関係、または一貫性やディスカース関係は、2つ以上のテキスト部分間に存在する並立(並列)または従属(従属)関係です。このようなテキスト関係を通じて一貫性の概念が広く認められています。RSTを使用した修辞関係は、分析者がテキストを分析するための体系的な方法を提供します。分析は、テキストを読んで関係を使用して木構造を構築することで構築されます。以下の例は、Scientific American誌の記事のタイトルと要約(ラマチャンドランとアンティス、1986年)のトップに現れるものです。元のテキストは、上記の説明に従って番号をつけられています:

[タイトル:] 明示的な動きの感知
[要約:] 间歇的に見られる物体の動きが曖昧な場合、視覚系は物理世界の性質に関する内蔵した知識を反映する手順を適用して混乱を解消します。

図では、1、2、3、4の番号が上記の説明に従って対応するユニットとして示されています。第4ユニットと第3ユニットは「手段」という関係を形成します。第3ユニットはこの関係の本質的な部分であり、関係の核と呼ばれ、第4ユニットは関係の衛星と呼ばれます。同様に、第2ユニットと第3および第4ユニットが「条件」という関係を形成します。すべてのユニットもまた範囲であり、範囲は1つのユニット以上で構成されることがあります。

ディスコースにおける核性
RSTは、2つの異なるタイプのユニットを確立します。核はテキストの最も重要な部分と考えられ、衛星は核に貢献し、二次的なものとされています。
核は基本的な情報を含み、衛星は核に関する追加情報を含みます。衛星は核なしでは通常理解できませんが、衛星が削除されたテキストも一定程度で理解できます。

分析における階層
RST関係はテキストに再帰的に適用され、そのテキストのすべてのユニットがRST関係の構成要素になるまで適用されます。このような分析の結果、RST構造は通常、上位レベルの関係を含むツリーとして表現されます。

RSTの理由
言語学的観点から見ると、RSTはほとんどの言語理論とは異なるテキスト構造の視点を提案します。
RSTは、テキストの一貫性と関係の間に緊密な関係があると指摘します。

計算的観点から見ると、テキスト関係の特徴を提供し、テキスト生成や要約などのアプリケーションに実装されているシステムで使用されています。

デザイン理由
コンピュータサイエンス者であるアナ・クリスタ・ビチャラ・ガルシアとクラリッセ・シケニウス・デ・ソウザは、RSTをADD+という呼ばれるデザイン理由システムの基盤として使用しました。ADD+では、RSTは他の知識表現システム(例えば、問題ベース情報システム(IBIS))と比較して、知識ベースの修辞的構造の基盤として使用されます。同様に、RSTは議論の表現スキームに使用されています。

参考文献
議論採掘
パースツリー