概要 - IFD: 内部者報告違反検出のための大規模バンチマーク

タイトル

IFD: 内部者報告違反検出のための大規模バンチマーク

時間

2025-07-27 07:30:28

著者

{"Cheng Huang","Fan Gao","Yutong Liu","Yadi Liu","Xiaoli Ma","Ye Aung Moe","Yuhan Zhang","Yao Ma","Hao Wang","Xiangxiang Wang","Yongbin Yu"}

カテゴリ

{cs.CE}

リンク
http://arxiv.org/abs/2507.20162v1

PDF リンク
http://arxiv.org/pdf/2507.20162v1

概要

この論文では、内部者報告の遅延（IFD）データセットを紹介しています。これは、遅延した内部者報告を検出するための最初の大規模データセットです。このデータセットには、2002年から2025年までの400万件以上のForm 4報告書が含まれており、適合または違反を示す二値ラベルで注釈されています。データセットには、内部者の役割、統治構造、市場の文脈、時系列パターンなどの特徴も含まれています。論文では、Mamba状態空間モデルのシークエンスモデル化能力とXGBoost分類器の解釈可能を組み合わせたハイブリッドフレームワークであるMaBoostを提案しています。実験では、MaBoostが伝統的なモデル、ディープラーニングのベースライン、および大規模言語モデル（LLM）を超える遅延した内部者報告の検出で優れていることを示しています。論文の主要な貢献は以下の通りです： * IFDの構築：内部者報告行動のための最初で最大の公開データセット。 * SEC規則に基づく戦略的公開違反を検出するための新しい二値分類タスクの定義。 * MaBoostの提案：遅延した内部者報告の検出で高い精度と解釈可能を達成するハイブリッドモデル。 * 伝統的なモデル、ディープラーニングモデル、およびLLMに対してMaBoostをベンチマークし、その優位性を示す。論文は、金融規制における行動意識のモデルの重要性を強調し、AIに基づく市場監視と適合監視のための現実的で再現可能な基盤を提供しています。

推奨論文

ジメリ2.5プロが2025年のIMOで金メダルを獲得できる能力を持っています。

流体力学の洞察が、ストリームライン工学を通じて多様な渦流場の動態を駆動します。

グラフベースの複製システムにおける対称的プライベート情報検索（SPIR）

物理学情報に基づくニューラルオペレータ（PINO）を使用して連結されたAllen-CahnとCahn-Hilliard相場方程式を学習する

ReCatcher: コード生成のためのLLMs（強化学習モデル）のリグレッションテストへの挑戦

進化性を学習アルゴリズムとしてシミュレートすること：分布敏感性、耐性、制約のトレードオフに関する経験的研究

NoHumansRequired: 自動化高品質画像編集トリプルミニング

シリアルスケーリング仮説

フロー・マッチングが生物学と生命科学に遭遇する：一つの調査

第6世代（6G）無線ユニット用のFPGA SoCのための拡張可能なリソース管理レイヤー