論文の概要: funcGNN: A Graph Neural Network Approach to Program Similarity
- arxiv url: http://arxiv.org/abs/2007.13239v3
- Date: Thu, 30 Jul 2020 17:19:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-06 19:54:56.988220
- Title: funcGNN: A Graph Neural Network Approach to Program Similarity
- Title(参考訳): funcGNN: プログラム類似性に対するグラフニューラルネットワークアプローチ
- Authors: Aravind Nair, Avijit Roy, Karl Meinke
- Abstract要約: FuncGNNは、ラベル付きCFGペアでトレーニングされたグラフニューラルネットワークで、効果的な埋め込みベクトルを利用することで、目に見えないプログラムペア間のGEDを予測する。
ハイレベル言語プログラム間の類似性を推定するためにラベル付きCFGにグラフニューラルネットワークが適用されたのはこれが初めてである。
- 参考スコア(独自算出の注目度): 0.90238471756546
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Program similarity is a fundamental concept, central to the solution of
software engineering tasks such as software plagiarism, clone identification,
code refactoring and code search. Accurate similarity estimation between
programs requires an in-depth understanding of their structure, semantics and
flow. A control flow graph (CFG), is a graphical representation of a program
which captures its logical control flow and hence its semantics. A common
approach is to estimate program similarity by analysing CFGs using graph
similarity measures, e.g. graph edit distance (GED). However, graph edit
distance is an NP-hard problem and computationally expensive, making the
application of graph similarity techniques to complex software programs
impractical. This study intends to examine the effectiveness of graph neural
networks to estimate program similarity, by analysing the associated control
flow graphs. We introduce funcGNN, which is a graph neural network trained on
labeled CFG pairs to predict the GED between unseen program pairs by utilizing
an effective embedding vector. To our knowledge, this is the first time graph
neural networks have been applied on labeled CFGs for estimating the similarity
between high-level language programs. Results: We demonstrate the effectiveness
of funcGNN to estimate the GED between programs and our experimental analysis
demonstrates how it achieves a lower error rate (0.00194), with faster (23
times faster than the quickest traditional GED approximation method) and better
scalability compared with the state of the art methods. funcGNN posses the
inductive learning ability to infer program structure and generalise to unseen
programs. The graph embedding of a program proposed by our methodology could be
applied to several related software engineering problems (such as code
plagiarism and clone identification) thus opening multiple research directions.
- Abstract(参考訳): プログラムの類似性は基本的な概念であり、ソフトウェア盗作、クローン同定、コードリファクタリング、コード検索などのソフトウェアエンジニアリングタスクのソリューションの中心である。
プログラム間の正確な類似度推定には、その構造、意味、流れの詳細な理解が必要である。
制御フローグラフ(英: control flow graph、cfg)は、論理制御フローとその意味をキャプチャするプログラムのグラフィカル表現である。
一般的なアプローチは、グラフ編集距離(GED)などのグラフ類似度尺度を用いてCFGを分析してプログラム類似度を推定することである。
しかし、グラフ編集距離はnp問題であり計算コストが高く、複雑なソフトウェアプログラムにグラフ類似性技術を適用することは現実的ではない。
本研究は、関連する制御フローグラフを分析し、プログラムの類似性を推定するためのグラフニューラルネットワークの有効性を検討することを目的とする。
我々は,ラベル付きcfgペアで学習したグラフニューラルネットワークであるfuncgnnを紹介し,有効な埋め込みベクトルを用いてプログラムペア間のgedを予測する。
我々の知る限り、ハイレベル言語プログラム間の類似性を推定するためにラベル付きCFGにグラフニューラルネットワークが適用されたのはこれが初めてである。
結果: funcgnn がプログラム間の ged を推定することの有効性を実証し,実験解析により,エラー率 (0.00194) の低減,高速化 (従来の ged 近似法よりも23倍高速) ,スケーラビリティの向上を実証した。
funcGNNは、プログラム構造を推論し、目に見えないプログラムに一般化する誘導学習能力を持っている。
本手法によって提案されるプログラムのグラフ埋め込みは,複数の関連するソフトウェア工学問題(コードプラジャイズムやクローン識別など)に適用でき,複数の研究の方向性が開ける。
関連論文リスト
- Efficient Graph Similarity Computation with Alignment Regularization [7.143879014059894]
グラフ類似性計算(GSC)は、グラフニューラルネットワーク(GNN)を用いた学習に基づく予測タスクである。
適応正規化(AReg)と呼ばれる,シンプルながら強力な正規化技術によって,高品質な学習が達成可能であることを示す。
推論段階では、GNNエンコーダによって学習されたグラフレベル表現は、ARegを再度使用せずに直接類似度スコアを計算するために使用される。
論文 参考訳(メタデータ) (2024-06-21T07:37:28Z) - Using Graph Neural Networks for Program Termination [0.0]
フォーマルな方法から脱して、マシンラーニングモデルの性質を受け入れるのです。
グラフニューラルネットワークを用いて,プログラムのグラフ表現を利用する。
我々は、これまで他のアプリケーションドメインで使われていた注意とセマンティックセグメンテーションの概念をプログラムに適用する。
論文 参考訳(メタデータ) (2022-07-28T12:16:37Z) - End-to-end Mapping in Heterogeneous Systems Using Graph Representation
Learning [13.810753108848582]
本稿では,エンドツーエンドでプログラム可能なグラフ表現学習フレームワークを提案する。
高レベルのプログラムの複雑さを普遍的な中間表現にマイニングし、特定の計算パターンを抽出し、特定のコア上でどのコードセグメントがベストに動作するかを予測できる。
評価では、スレッドベースの実行と比較して最大速度が6.42倍、最先端技術と比較して2.02倍であることを示す。
論文 参考訳(メタデータ) (2022-04-25T22:13:13Z) - Towards Unsupervised Deep Graph Structure Learning [67.58720734177325]
本稿では,学習したグラフトポロジを外部ガイダンスなしでデータ自身で最適化する,教師なしグラフ構造学習パラダイムを提案する。
具体的には、元のデータから"アンカーグラフ"として学習目標を生成し、対照的な損失を用いてアンカーグラフと学習グラフとの一致を最大化する。
論文 参考訳(メタデータ) (2022-01-17T11:57:29Z) - Training Free Graph Neural Networks for Graph Matching [103.45755859119035]
TFGMは、グラフニューラルネットワーク(GNN)ベースのグラフマッチングのパフォーマンスをトレーニングなしで向上するフレームワークである。
TFGMをさまざまなGNNに適用することは、ベースラインよりも有望な改善を示している。
論文 参考訳(メタデータ) (2022-01-14T09:04:46Z) - CogDL: A Comprehensive Library for Graph Deep Learning [55.694091294633054]
研究者や実践者が実験を行い、メソッドを比較し、簡単かつ効率的にアプリケーションを構築することができるグラフ深層学習ライブラリであるCogDLを紹介します。
CogDLでは,様々なグラフタスクに対するGNNモデルのトレーニングと評価のための統一設計を提案し,既存のグラフ学習ライブラリに固有のものである。
我々はCogDLのための効率的なスパース演算子を開発し、効率性のための最も競争力のあるグラフライブラリとなる。
論文 参考訳(メタデータ) (2021-03-01T12:35:16Z) - Learning to Execute Programs with Instruction Pointer Attention Graph
Neural Networks [55.98291376393561]
グラフニューラルネットワーク(GNN)は、ソフトウェアエンジニアリングタスクを学習するための強力なツールとして登場した。
リカレントニューラルネットワーク(RNN)は、長いシーケンシャルな推論の連鎖に適しているが、プログラム構造を自然に組み込んでいるわけではない。
本稿では,新しいGNNアーキテクチャ,IPA-GNN(Instruction Pointer Attention Graph Neural Networks)を導入する。
論文 参考訳(メタデータ) (2020-10-23T19:12:30Z) - Beyond Graph Neural Networks with Lifted Relational Neural Networks [14.63152363481139]
我々は,Lfted Neural Networks の言語に基づく宣言型微分可能プログラミングフレームワークを実演する。
小さなパラメータ化プログラムは学習を符号化するために使用される。
このアイデアは、様々な高度なニューラルネットワークの効率的な符号化にどのように使用できるかを示す。
論文 参考訳(メタデータ) (2020-07-13T10:10:58Z) - GCC: Graph Contrastive Coding for Graph Neural Network Pre-Training [62.73470368851127]
グラフ表現学習は現実世界の問題に対処する強力な手法として登場した。
自己教師付きグラフニューラルネットワーク事前トレーニングフレームワークであるGraph Contrastive Codingを設計する。
3つのグラフ学習タスクと10のグラフデータセットについて実験を行った。
論文 参考訳(メタデータ) (2020-06-17T16:18:35Z) - Graph Representation Learning via Graphical Mutual Information
Maximization [86.32278001019854]
本稿では,入力グラフとハイレベルな隠蔽表現との相関を測る新しい概念であるGMIを提案する。
我々は,グラフニューラルエンコーダの入力と出力の間でGMIを最大化することで訓練された教師なし学習モデルを開発する。
論文 参考訳(メタデータ) (2020-02-04T08:33:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。