論文の概要: MAGNET: A Multi-Graph Attentional Network for Code Clone Detection
- arxiv url: http://arxiv.org/abs/2510.24241v1
- Date: Tue, 28 Oct 2025 09:48:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-29 15:35:37.003339
- Title: MAGNET: A Multi-Graph Attentional Network for Code Clone Detection
- Title(参考訳): MAGNET:コードクローン検出のためのマルチグラフ注意ネットワーク
- Authors: Zixian Zhang, Takfarinas Saber,
- Abstract要約: コードクローン検出は、脆弱性検出と盗作分析を支えるソフトウェア工学の基本的なタスクである。
既存の方法は抽象構文木(AST)、制御フローグラフ(CFG)、データフローグラフ(DFG)といった特異表現に依存していることが多い。
本研究では,AST,CFG,DFG表現を併用してソースコードの構文的・意味的特徴を抽出する多グラフアテンショナルフレームワークMAGNETを提案する。
- 参考スコア(独自算出の注目度): 0.14323566945483496
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Code clone detection is a fundamental task in software engineering that underpins refactoring, debugging, plagiarism detection, and vulnerability analysis. Existing methods often rely on singular representations such as abstract syntax trees (ASTs), control flow graphs (CFGs), and data flow graphs (DFGs), which capture only partial aspects of code semantics. Hybrid approaches have emerged, but their fusion strategies are typically handcrafted and ineffective. In this study, we propose MAGNET, a multi-graph attentional framework that jointly leverages AST, CFG, and DFG representations to capture syntactic and semantic features of source code. MAGNET integrates residual graph neural networks with node-level self-attention to learn both local and long-range dependencies, introduces a gated cross-attention mechanism for fine-grained inter-graph interactions, and employs Set2Set pooling to fuse multi-graph embeddings into unified program-level representations. Extensive experiments on BigCloneBench and Google Code Jam demonstrate that MAGNET achieves state-of-the-art performance with an overall F1 score of 96.5\% and 99.2\% on the two datasets, respectively. Ablation studies confirm the critical contributions of multi-graph fusion and each attentional component. Our code is available at https://github.com/ZixianReid/Multigraph_match
- Abstract(参考訳): コードクローン検出は、リファクタリング、デバッグ、盗作検出、脆弱性分析を支える、ソフトウェア工学の基本的なタスクである。
既存のメソッドは抽象構文木(AST)、制御フローグラフ(CFG)、データフローグラフ(DFG)などの特異表現に依存しており、コードセマンティクスの部分的な側面のみをキャプチャしている。
ハイブリッドアプローチが登場したが、その融合戦略は一般的に手作りで非効率である。
本研究では,AST,CFG,DFG表現を併用してソースコードの構文的・意味的特徴を抽出する多グラフアテンショナルフレームワークMAGNETを提案する。
MAGNETは残差グラフニューラルネットワークとノードレベルの自己アテンションを統合して、ローカルと長距離の両方の依存関係を学習し、微細なグラフ間相互作用のためのゲートクロスアテンション機構を導入し、Set2Setプーリングを使用して、マルチグラフの埋め込みを統一されたプログラムレベルの表現に融合する。
BigCloneBenchとGoogle Code Jamの大規模な実験は、MAGNETが2つのデータセットでそれぞれ96.5\%と99.2\%の総合的なF1スコアで最先端のパフォーマンスを達成することを示した。
アブレーション研究は、多重グラフ融合と各注目成分の臨界寄与を裏付ける。
私たちのコードはhttps://github.com/ZixianReid/Multigraph_matchで利用可能です。
関連論文リスト
- AST-Enhanced or AST-Overloaded? The Surprising Impact of Hybrid Graph Representations on Code Clone Detection [0.0]
コードクローンはソフトウェアのメンテナンスコストを大幅に増加させ、脆弱性リスクを高める。
ASTは、その正確な構文構造表現により、ディープラーニングベースのコードクローン検出を支配している。
近年の研究では、ASTベースの表現をセマンティックグラフで豊かにすることでこの問題に対処している。
論文 参考訳(メタデータ) (2025-06-17T12:35:17Z) - Align-GRAG: Reasoning-Guided Dual Alignment for Graph Retrieval-Augmented Generation [79.75818239774952]
大きな言語モデル(LLM)は目覚ましい能力を示しているが、幻覚や時代遅れの情報といった問題に苦戦している。
Retrieval-augmented Generation (RAG) は、情報検索システム(IR)を用いて、外部知識のLLM出力を基底にすることで、これらの問題に対処する。
本稿では、検索後句における新しい推論誘導二重アライメントフレームワークであるAlign-GRAGを提案する。
論文 参考訳(メタデータ) (2025-05-22T05:15:27Z) - DiffCut: Catalyzing Zero-Shot Semantic Segmentation with Diffusion Features and Recursive Normalized Cut [55.21950038225407]
ファンデーションモデルは、言語、ビジョン、マルチモーダルタスクなど、さまざまな領域にまたがる強力なツールとして登場した。
本稿では,拡散UNetエンコーダを基礎ビジョンエンコーダとして使用し,教師なしゼロショットセグメンテーション手法であるDiffCutを紹介する。
我々の研究は、拡散UNetエンコーダに埋め込まれた極めて正確なセマンティック知識を強調し、下流タスクの基盤ビジョンエンコーダとして機能する。
論文 参考訳(メタデータ) (2024-06-05T01:32:31Z) - Meta-Path Based Attentional Graph Learning Model for Vulnerability
Detection [21.10614864296154]
本稿では,MAGNET と呼ばれるコード vulNErability deTection のためのメタパスに基づく注意グラフ学習モデルを提案する。
メタパスに基づく階層型注目グラフニューラルネットワークも提案され,グラフ内の遠隔ノード間の関係を捉える。
その結果, MAGNETはF1スコアにおいて, それぞれ6.32%, 21.50%, 25.40%で最高のベースライン法より優れていた。
論文 参考訳(メタデータ) (2022-12-29T11:51:47Z) - RU-Net: Regularized Unrolling Network for Scene Graph Generation [92.95032610978511]
シーングラフ生成(SGG)は、オブジェクトを検出し、各オブジェクト間の関係を予測することを目的としている。
既存のSGG法は,(1)あいまいな対象表現,2)関係予測の多様性の低下など,いくつかの問題に悩まされることが多い。
両問題に対処する正規化アンローリングネットワーク(RU-Net)を提案する。
論文 参考訳(メタデータ) (2022-05-03T04:21:15Z) - MGAE: Masked Autoencoders for Self-Supervised Learning on Graphs [55.66953093401889]
Masked Graph Autoencoder (MGAE) フレームワークは、グラフ構造データの効果的な学習を行う。
自己指導型学習から洞察を得て、私たちはランダムに大量のエッジを隠蔽し、トレーニング中に欠落したエッジを再構築しようとします。
論文 参考訳(メタデータ) (2022-01-07T16:48:07Z) - GN-Transformer: Fusing Sequence and Graph Representation for Improved
Code Summarization [0.0]
融合シーケンスとグラフのモダリティに基づいてエンドツーエンドの学習を行う新しい手法であるGN-Transformerを提案する。
提案手法は,2つのコード要約データセットと3つの自動コード要約メトリクスにおいて,最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-11-17T02:51:37Z) - Learning Multi-Granular Hypergraphs for Video-Based Person
Re-Identification [110.52328716130022]
ビデオベースの人物識別(re-ID)はコンピュータビジョンにおいて重要な研究課題である。
MGH(Multi-Granular Hypergraph)という新しいグラフベースのフレームワークを提案する。
MARSの90.0%のトップ-1精度はMGHを用いて達成され、最先端のスキームよりも優れていた。
論文 参考訳(メタデータ) (2021-04-30T11:20:02Z) - Detecting Code Clones with Graph Neural Networkand Flow-Augmented
Abstract Syntax Tree [30.484662671342935]
フロー拡張抽象構文木(FA-AST)と呼ばれるプログラムのグラフ表現を構築する。
FA-ASTに2種類のグラフニューラルネットワークを適用し、コードペアの類似性を計測する。
当社のアプローチは,Google Code JamとBigCloneBenchタスクの両面で,最先端のアプローチよりも優れています。
論文 参考訳(メタデータ) (2020-02-20T10:18:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。