ゲルマネット - 百科事典

GermaNetはドイツ語のセマネット(意味ネットワーク)です。名詞、動詞、形容詞を意味的に関連付けるために、同じ概念を表す語彙単位をシナセットにまとめ、これらのシナセット間の意味関係を定義しています。GermaNetは、ライセンス契約を締結した後は学術用途で無料で利用できます。GermaNetは英語のWordNetと多くの共通点があり、オンラインの同義語集や軽量のオントロジーとして見ることができます。GermaNetは1997年以来、チュービンゲン大学の一般言語学および計算言語学研究グループで開発・保守されています。それは多言語の語彙・意味データベースであるEuroWordNetに統合されています。

データベース


= 内容 =
GermaNetは、意味関係で相互にリンクされた概念のセットを語彙空間に分類しています。意味概念はシナセットでモデル化されます。シナセットは、すべての単語が同じまたはほぼ同じ意味を持つ語群(語彙単位)の集合です。したがって、シナセットは一つの定義や「解説」の下にまとめられた同義語の集合です。
解説に加えて、シナセットはその文法的機能にラベリングされ、シナセット内のそれぞれの異なる意味に対して例文が添付されています。WordNetと同様に、各語類ごとに意味空間が、意味ネットワークの主要なノードに密接に関連する多くの意味分野に分割されます:Ort(場所)、Körper(体)、など。
2020年5月にリリースされたバージョン15.0では、GermaNetには以下が含まれています:

シナセット:144,113
語彙単位:185,000
リテラル:169,521
概念的関係:157,921
語彙関係(同義語を除く):12,203
分割複合語:98,905
相互言語インデックス(ILI)レコード:28,564
Wiktionaryの意味解説:29,548


= フォーマット =
すべてのGermaNetデータはPostgreSQL関係データベースに保存されています。データベーススキーマはGermaNetの内部構造に従っており、シナセット、語彙単位、概念的および語彙関係など、さまざまなテーブルがあります。GermaNetデータは、このデータベース形式とXMLファイルの両方で配布されています。XMLデータでは、シナセット用と関係用の2つのタイプのファイルがGermaNetデータベース内にあるすべてのデータを表現しています。


インターフェース

Java、Python、JavaScript、Perl用のソフトウェアライブラリとAPIが利用できます。これらのプログラムはフリーソフトウェアライセンスで配布されており、GermaNetのさまざまなバージョンのすべての情報に簡単にアクセスできます。
GermaNet Roverは、GermaNet内でシナセットを検索し、それに関連するデータを探索し、シナセットのペアの意味的類似度を計算するオンラインアプリケーションです。ハイパニム関係の視覚化とシナセット検索のための高度なフィルタリングオプションを特徴としています。


ライセンス

2020年5月にリリースされたGermaNet 15.0は以下のいずれかのライセンス契約の下で配布できます:

学術研究ライセンス契約:学術機関での研究のために。学術用途にはライセンス料がかかりません。個別の学生にはライセンスは発行されず、ライセンスを求める場合は学術アドバイザーと話す必要があります。
研究開発ライセンス契約:非学術機関および研究協力体に適用されます。技術開発および内部研究専用です。
商業ライセンス契約:非学術機関および企業に適用されます。技術開発および内部研究に加えて、派生製品やサービスの配布およびマーケティングに非独占的な権利を与えます。


代替案

Open-de-WordNetは、GermaNetに互換性のある無料の代替案で、WordNetと互換性があります。


言語学的応用

GermaNetは、以下のようなさまざまな応用に使用されています:

意味分析
隠された文書構造の浅い認識
複合語分析
セクションの好みの分析
単語の意味分岐の解決


参考項


外部リンク

公式ウェブサイト
GermaNet Roverオンラインブラウザ