GPTZero
(ギプティーザー) - 百科事典
GPTZeroは、人工知能生成のテキスト、特に大規模な言語モデルによって生成されたテキストを特定するために開発された人工知能検出ソフトウェアです。GPTZeroは学術的不正直を防ぐための取り組みが称賛されていますが、多くのニュースメディアがツールの誤検出率を批判し、特に学術的な環境で特に有害であると指摘しています。
歴史
GPTZeroは、プリンストン大学の大学院生であるエドワード・ティアンによって開発され、2023年1月にオンラインで発表されました。これは、学術的な盗作におけるAI生成の使用に関する懸念に対する対応です。2023年5月にGPTZeroは、シードファウンドングとして350万ドルを調達したと発表しました。
リリースの初週には、GPTZeroが3万回の使用を受け、クラッシュしました。それはウェブアプリケーション会社のStreamlitによってサポートされ、より多くのサーバー資源が割り当てられました。2024年7月には、1年前の100万人から400万人に達しました。
2024年の夏に、GPTZeroは第Aラウンドの資金調達として1000万ドルを調達しました。
2024年9月に、GPTZeroは「彼らの書き込みプロセスに関するデータ、例えばコピー/ペーストの履歴、編集者が何人いるか、編集がどれくらいかかったか」などのデータを「AI書き込みに関する全有罪または全無罪のパラダイムから、より洗練されたものへと移行するための取り組み」として「著者性追跡ソフトウェア」を発表しました。
メカニズム
GPTZeroは、そのテキストがAIによって書かれたかどうかを判断するために、彼らが「困惑」と「爆発性」と呼ぶ質を用いて試みます。企業によると、「困惑」とはテキストのランダム性や、文の構成方法がユニークまたは「驚くべき」かどうかです。言語モデルに対してより混沌としたか、未知の言語を持つテキスト(つまりモデルを「困惑させる」可能性があるテキスト)は、より多くの人間が書いたとされています。対照的に、「爆発性」は文同士を比較し、その類似性を決定します。人間のテキストはより不連続で、つまり人間はAIよりも多くの文の変化で書く傾向があります。
用例
学術界はGPTZeroを使用して、AI生成のテキストに関する盗作の懸念に対処しようと試みています。プリンストン大学を含む教育機関は、GPTZeroを使用して学術的な環境におけるAI生成のテキストを对抗する議論を行っており、意見は分かれています。2023年10月には、GPTZeroはアメリカ教師連盟と提携しました。
2024年までには、ティアンはGPTZeroが採用者に対する多くの採用管理と履歴書分析での採用を受け入れたと報告しました。
効能
2023年3月に発表された「AI生成のテキストが信頼できるか?」というタイトルの論文で、メリーランド大学のコンピュータサイエンス者であるヴィヌ・サンカール・サダシバン、アウノン・クマール、スリラム・バラスブラマニアン、ウェンシオ・ワン、およびソヘイル・フェイジが、実際の状況でいくつかのAIテキスト検出ツールが信頼できないことを理論的および実験的に示しました。
テクノロジーサイトのFuturismはこのツールをテストし、「結果は目を見張るようなものだが、その誤差率に基づくと、このツールに依存する教師は「無罪な学生の20パーセント近くを学術不正として誤って告発することになる」と述べました。
ワシントンポストは2023年8月にGPTZeroが誤検出に苦しんでいると指摘し、「小さな「誤検出」率でも、一部の学生が間違って[学術不正]として非難される可能性がある」と強調しました。
ニュースサイトのArs Technicaは、人間が非常に規則的な方法で文を書くことができるため、誤検出が発生するとコメントしました。作家のベンジャミン・エドワーズは、困惑度スコアはAIにとって「驚くべき」ということに注意を払い、例えば米国憲法などの非常に一般的なテキストがAI生成された可能性があるとラベル付けされる場合があると続けました。
参考情報
・人工知能内容検出
・人工知能の倫理
・自然言語処理
・ChatGPT
・テキスト生成
・チューリングテスト
参考文献
・Cassidy, Caitlin (January 11, 2023). "College student claims app can detect essays written by chatbot ChatGPT". The Guardian.