論文の概要: ExDoS: Expert-Guided Dual-Focus Cross-Modal Distillation for Smart Contract Vulnerability Detection
- arxiv url: http://arxiv.org/abs/2509.10252v1
- Date: Fri, 12 Sep 2025 13:56:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-15 16:03:08.110752
- Title: ExDoS: Expert-Guided Dual-Focus Cross-Modal Distillation for Smart Contract Vulnerability Detection
- Title(参考訳): ExDoS:スマートコントラクト脆弱性検出のためのエキスパートガイド型デュアルフォーカスクロスモーダル蒸留
- Authors: Yifan Jia, Ye Tian, Yanbin Wang, Jianguo Sun, Haitao Xu,
- Abstract要約: ソースコードからバイトコードへの意味的知識の転送にExDoSを提案する。
グラフレベルの契約埋め込みにおける不明瞭な局所信号に対処するため,デュアルアテンショングラフネットワークを提案する。
実世界の契約に関する実験は,本手法が一貫したF1スコア改善を実現することを示す。
- 参考スコア(独自算出の注目度): 8.236011772496767
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The success of smart contracts has made them a target for attacks, but their closed-source nature often forces vulnerability detection to work on bytecode, which is inherently more challenging than source-code-based analysis. While recent studies try to align source and bytecode embeddings during training to transfer knowledge, current methods rely on graph-level alignment that obscures fine-grained structural and semantic correlations between the two modalities. Moreover, the absence of precise vulnerability patterns and granular annotations in bytecode leads to depriving the model of crucial supervisory signals for learning discriminant features. We propose ExDoS to transfer rich semantic knowledge from source code to bytecode, effectively supplementing the source code prior in practical settings. Specifically, we construct semantic graphs from source code and control-flow graphs from bytecode. To address obscured local signals in graph-level contract embeddings, we propose a Dual-Attention Graph Network introducing a novel node attention aggregation module to enhance local pattern capture in graph embeddings. Furthermore, by summarizing existing source code vulnerability patterns and designing a corresponding set of bytecode-level patterns for each, we construct the first dataset of vulnerability pattern annotations aligned with source code definitions to facilitate fine-grained cross-modal alignment and the capture of function-level vulnerability signals. Finally, we propose a dual-focus objective for our cross-modal distillation framework, comprising: a Global Semantic Distillation Loss for transferring graph-level knowledge and a Local Semantic Distillation Loss enabling expert-guided, fine-grained vulnerability-specific distillation. Experiments on real-world contracts demonstrate that our method achieves consistent F1-score improvements (3\%--6\%) over strong baselines.
- Abstract(参考訳): スマートコントラクトの成功は、攻撃の標的となっているが、そのクローズドソースの性質は、脆弱性検出をバイトコード上で動作させることが多い。
近年の研究では、知識を伝達する訓練中にソースとバイトコードの埋め込みをアライメントしようと試みているが、現在の手法は2つのモード間の微細な構造的および意味的相関を曖昧にするグラフレベルのアライメントに依存している。
さらに、バイトコードに正確な脆弱性パターンや粒度のアノテーションがないため、差別的な特徴を学習するための重要な監視信号のモデルが失われる。
本稿では,ソースコードからバイトコードへのリッチなセマンティック知識の伝達にExDoSを提案する。
具体的には,バイトコードからソースコードと制御フローグラフから意味グラフを構築する。
グラフレベルの契約埋め込みにおいて、不明瞭な局所信号に対処するために、グラフ埋め込みにおける局所的なパターンキャプチャを強化するために、新しいノード注意集約モジュールを導入したデュアルアテンショングラフネットワークを提案する。
さらに,既存のソースコードの脆弱性パターンを要約し,それぞれに対応するバイトコードレベルのパターンを設計することにより,ソースコード定義と整合した最初の脆弱性パターンアノテーションのデータセットを構築し,詳細なクロスモーダルアライメントと関数レベルの脆弱性信号のキャプチャを容易にする。
最後に, グラフレベルの知識を伝達するグローバルセマンティック蒸留損失と, 専門家によるきめ細かな脆弱性特定蒸留を可能にするローカルセマンティック蒸留損失とからなるクロスモーダル蒸留フレームワークの二重焦点目標を提案する。
実世界の契約に関する実験により,本手法は強いベースラインに対して一貫したF1スコア改善 (3\%--6\%) を達成することを示した。
関連論文リスト
- CGP-Tuning: Structure-Aware Soft Prompt Tuning for Code Vulnerability Detection [15.013699967804987]
本稿では,脆弱性検出のためのCGP-Tuningを提案する。
CGP-Tuningでは、コードグラフ内のリッチなセマンティック情報をキャプチャするための型認識埋め込みと、効率的なクロスモーダルアライメントモジュールが導入されている。
最新のDiverseVulデータセットと3つの高度なオープンソースコードLLM、CodeLlama、CodeGemma、Qwen2.5-Coderで評価されている。
論文 参考訳(メタデータ) (2025-01-08T13:56:17Z) - Vul-LMGNNs: Fusing language models and online-distilled graph neural networks for code vulnerability detection [5.536252767247838]
提案するVul-LMGNNは,学習済みのコードLMをグラフニューラルネットワーク(GNN)に統合し,意味情報と構造情報の層間伝播を可能にする。
Vul-LMGNNは、コードプロパティグラフ(CPG)を活用して、構文、制御フロー、データ依存性を統合し、ゲート付きGNNを使って構造抽出を行う。
論文 参考訳(メタデータ) (2024-04-23T03:48:18Z) - CONVERT:Contrastive Graph Clustering with Reliable Augmentation [110.46658439733106]
信頼性オーグメンテーション(CONVERT)を用いたContrastiVe Graph ClustEringネットワークを提案する。
本手法では,データ拡張を可逆的パーターブ・リカバリネットワークにより処理する。
セマンティクスの信頼性をさらに保証するために、ネットワークを制約する新たなセマンティクス損失が提示される。
論文 参考訳(メタデータ) (2023-08-17T13:07:09Z) - An Unbiased Transformer Source Code Learning with Semantic Vulnerability
Graph [3.3598755777055374]
現在の脆弱性スクリーニング技術は、新しい脆弱性を特定したり、開発者がコード脆弱性と分類を提供するのに効果がない。
これらの問題に対処するために,変換器 "RoBERTa" とグラフ畳み込みニューラルネットワーク (GCN) を組み合わせたマルチタスク・アンバイアス脆弱性分類器を提案する。
本稿では、逐次フロー、制御フロー、データフローからエッジを統合することで生成されたソースコードからのセマンティック脆弱性グラフ(SVG)表現と、Poacher Flow(PF)と呼ばれる新しいフローを利用したトレーニングプロセスを提案する。
論文 参考訳(メタデータ) (2023-04-17T20:54:14Z) - ReGVD: Revisiting Graph Neural Networks for Vulnerability Detection [20.65271290295621]
本稿では,脆弱性検出のためのグラフネットワークモデルReGVDを提案する。
特にReGVDは、あるソースコードをフラットなトークンのシーケンスと見なしている。
我々は、脆弱性検出のためのCodeXGLUEから、実世界のベンチマークデータセット上で最も高い精度を得る。
論文 参考訳(メタデータ) (2021-10-14T12:44:38Z) - Software Vulnerability Detection via Deep Learning over Disaggregated
Code Graph Representation [57.92972327649165]
この研究は、コードコーパスから安全でないパターンを自動的に学習するためのディープラーニングアプローチを探求する。
コードには解析を伴うグラフ構造が自然に認められるため,プログラムの意味的文脈と構造的規則性の両方を利用する新しいグラフニューラルネットワーク(GNN)を開発する。
論文 参考訳(メタデータ) (2021-09-07T21:24:36Z) - Information Obfuscation of Graph Neural Networks [96.8421624921384]
本稿では,グラフ構造化データを用いた学習において,情報難読化による機密属性保護の問題について検討する。
本稿では,全変動量とワッサーシュタイン距離を交互に学習することで,事前決定された機密属性を局所的にフィルタリングするフレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-28T17:55:04Z) - Auto-Encoding Twin-Bottleneck Hashing [141.5378966676885]
本稿では,効率よく適応的なコード駆動グラフを提案する。
自動エンコーダのコンテキストでデコードすることで更新される。
ベンチマークデータセットの実験は、最先端のハッシュ手法よりもフレームワークの方が優れていることを明らかに示しています。
論文 参考訳(メタデータ) (2020-02-27T05:58:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。