概要 - CASCADE:GoogleのLLM駆動JavaScriptデオブフューザー

タイトル
CASCADE:GoogleのLLM駆動JavaScriptデオブフューザー

時間
2025-07-23 16:57:32

著者
{"Shan Jiang","Pranoy Kovuri","David Tao","Zhixun Tan"}

カテゴリ
{cs.SE,cs.AI,cs.CR,cs.LG,cs.PL}

リンク
http://arxiv.org/abs/2507.17691v1

PDF リンク
http://arxiv.org/pdf/2507.17691v1

概要

この論文は、CASCADEという新しいハイブリッドアプローチを紹介します。CASCADEは、GeminiとJavaScript Intermediate Representation(JSIR)の機能を組み合わせた、JavaScriptのデオブフュシェーションに対応する方法です。この方法は、元の文字列やAPI名を効果的に復元し、元のプログラムの動作を明らかにし、既存の静的および動的デオブフュシェーション技術の限界を克服します。 CASCADEは、Obfuscator.IOなどのオブフュシェーターによって生成された重要なプレルード関数を特定するためにGeminiを使用し、その後、元の文字列やAPI名を復元するためにJSIRを活用します。このハイブリッドアプローチは以下のような利点を提供します: 1. **ハイブリッド動的実行**:CASCADEは、サンドボックス化されたJavaScript環境で検出されたプレルード関数を動的に実行することで、純粋な静的分析の限界を克服し、正確な結果を確保します。 2. **AI駆動のメンテナンス性**:CASCADEは、最先端のGeminiを活用してプレルード関数の検出に数百から数千の手動ルールを必要とせず、高い精度とコードの小さな変更に対する耐性を実現します。 3. **JSIRを通じた高度な静的分析**:CASCADEは、堅牢なJSIRインフラを利用して包括的なコード分析と変換を行い、より高度なセマンティックレベルの分析と変換を可能にします。 4. **責任あるAIの使用**:CASCADEは、LLMを直接デオブフュシェーションコードを生成するのを避け、錯覚エラーのリスクを低減し、生産環境での実用的な使用を確保します。 論文は、オブフュシェーションされたJavaScriptサンプルのデータセットでCASCADEを評価し、文字列やAPI名の復元におけるその効果を示しました。全体の成功率は98.93%で、平均して1ファイルあたり945.26文字が復元され、平均実行時間は2.298秒でした。 CASCADEはすでにGoogleの生産環境に導入され、JavaScriptのデオブフュシェーション効率の大幅な向上とリバースエンジニアリング作業の削減を示しました。論文は、CASCADEが複雑なオブフュシェーション技術に対する重要な進歩を代表し、自動化および正確なデオブフュシェーションのための有望なアプローチを提供すると結論付けました。


推奨論文

シリアルスケーリング仮説

TRPrompt: テキストベースの報酬からクエリ意識的なプロンプト最適化をブートストラップする

モデリング(デオンティック)モーダル演算子とs(CASP)ゴール指向的な宣言的な答えセットプログラミングシステム Translation: モデリング(デオンティック)モーダル演算子とs(CASP)ゴール指向的な宣言的な答えセットプログラミングシステム

ユークリッドフリーズタグ問題における向上した目覚め時間

「長文文脈長で状態空間モデル(SSM)とSSM-トランスフォーマーハイブリッド言語モデルの性能を特徴化」

MIRAGE-Bench: LLMエージェントが幻覚を見ており、どこにそれらを見つけるか

「高階Datalogにおける否定の力」

DNNベースのHSIセグメンテーション用FPGAベースのSoCのための最適化:実践的なアプローチ

圧縮性と敵対的耐性の相互作用

禁止パターンと植えられた色を持つエッジ色付け問題