ハッタープライズ - 百科事典
ハッタープライズは、マーカス・ハッターによって資金を提供された現金賞で、特定の1GBの英語テキストファイルに対するデータ圧縮の改善を報酬としています。この賞の目的は、人工知能(AI)に関する研究を促進することです。
2006年に始まったこの賞は、Large Text Compression Benchmark(LTCB)で使用される2つのファイルの中で大きなもの、enwik9の圧縮サイズに対して、1%の改善(合計資金500,000ユーロ)に対して5,000ユーロを賞与します。enwik9は、特定のバージョンの英語版ウィキペディアの最初の109バイトから成り立っています。現在進行中のコンテストは、ハッター、マット・マホニー、ジム・ボウリーによって組織されています。
賞は2006年8月6日に、100MBの小さなテキストファイルであるenwik8で発表されました。2020年2月21日には、10倍に増やされ、1GBのenwik9に拡張されました。賞金は50,000ユーロから500,000ユーロに増えました。
目的
ハッタープライズの目的は、人工知能(AI)に関する研究を促進することです。主催者は、テキスト圧縮とAIが同等の問題であると信じています。ハッターは、未知ではあるが計算可能な環境における目的を達成する行動の最適性について証明しました。しかし、コルモゴロフ複雑さが計算不可能であるため、一般解は存在しません。ハッターは、環境が時間tと空間lに制限された制約された場合(AIXItlと呼ばれる)では、解が時間O(t^2l)で計算可能であることを証明しましたが、それでも計算不能です。
さらに、主催者は、自然言語テキストの圧縮が難しいAI問題であり、チューリングテストを通過するに等しいと考えています。したがって、1つの目標への進歩は、他の目標への進歩を表すと主張しています。彼らは、テキストシーケンスで最も可能性が高い文字が次に現れることを予測するには、大量の現実世界の知識が必要であると主張します。テキスト圧縮器は、最も可能性が高いテキストシーケンスに最短のコードを割り当てるために同じ問題を解決する必要があります。
ChatGPTなどのモデルは、さまざまな理由からハッタープライズには最適ではありません。コンテストで許可されているよりも多くの計算リソースを消費する可能性があります。
规則
コンテストはオープンです。誰でも参加できます。参加するためには、コンペティターは圧縮プログラムと、enwik9(2017年までのenwik8)に復元するデコンプレッサーを提出する必要があります。圧縮プログラムの代わりに圧縮ファイルを提出することも可能です。圧縮ファイルとデコンプレッサー(Win32やLinuxの実行可能ファイルとして)の合計サイズは、前回の賞受賞作品の99%以下でなければなりません。1%の改善に対して、コンペティターは5,000ユーロを獲得します。デコンプレッサープログラムも実行時間とメモリ制約を満たす必要があります。
提出物は独立した確認を許可するために公開される必要があります。賞が授与される前に、30日間の公的なコメントの猶予期間があります。2017年には、ソースコードを無料ソフトウェアライセンスの下で公開することを義務付ける規則が変更されました。これは、「過去の提出物(ソースコードを公開していないもの)は他人にとって役に立たず、その中のアイデアは永遠に失われる可能性がある」との懸念が原因です。
優勝者
参考資料
外部リンク
公式ウェブサイト