論文の概要: Multi-View Graph Representation for Programming Language Processing: An
Investigation into Algorithm Detection
- arxiv url: http://arxiv.org/abs/2202.12481v1
- Date: Fri, 25 Feb 2022 03:35:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-28 16:05:33.033820
- Title: Multi-View Graph Representation for Programming Language Processing: An
Investigation into Algorithm Detection
- Title(参考訳): プログラミング言語処理のための多視点グラフ表現:アルゴリズム検出の検討
- Authors: Ting Long, Yutong Xie, Xianyu Chen, Weinan Zhang, Qinxiang Cao, Yong
Yu
- Abstract要約: 本稿では,マルチビューグラフ(MVG)プログラム表現法を提案する。
MVGはコードのセマンティクスにより多くの注意を払っており、同時に複数のビューとしてデータフローと制御フローの両方を含んでいる。
実験では、MVGは従来の方法よりも大幅に優れていた。
- 参考スコア(独自算出の注目度): 35.81014952109471
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Program representation, which aims at converting program source code into
vectors with automatically extracted features, is a fundamental problem in
programming language processing (PLP). Recent work tries to represent programs
with neural networks based on source code structures. However, such methods
often focus on the syntax and consider only one single perspective of programs,
limiting the representation power of models. This paper proposes a multi-view
graph (MVG) program representation method. MVG pays more attention to code
semantics and simultaneously includes both data flow and control flow as
multiple views. These views are then combined and processed by a graph neural
network (GNN) to obtain a comprehensive program representation that covers
various aspects. We thoroughly evaluate our proposed MVG approach in the
context of algorithm detection, an important and challenging subfield of PLP.
Specifically, we use a public dataset POJ-104 and also construct a new
challenging dataset ALG-109 to test our method. In experiments, MVG outperforms
previous methods significantly, demonstrating our model's strong capability of
representing source code.
- Abstract(参考訳): プログラムのソースコードを自動抽出したベクトルに変換するプログラム表現は、プログラミング言語処理(PLP)の根本的な問題である。
最近の研究は、ソースコード構造に基づいたニューラルネットワークによるプログラムの表現を試みる。
しかし、このような手法はしばしば構文に焦点を合わせ、プログラムの単一の視点のみを考慮し、モデルの表現力を制限する。
本稿では,マルチビューグラフ(MVG)プログラム表現法を提案する。
mvgはコードのセマンティクスにもっと注意を払って、複数のビューとしてデータフローとコントロールフローの両方を同時に含む。
これらのビューはグラフニューラルネットワーク(GNN)によって合成され、さまざまな側面をカバーする包括的なプログラム表現を得る。
PLPの重要かつ挑戦的なサブフィールドであるアルゴリズム検出の文脈において,提案したMVGアプローチを徹底的に評価した。
具体的には、公開データセットpoj-104を使用し、新しい挑戦的なデータセットalg-109を構築してメソッドをテストする。
実験では、mvgは以前の手法を大幅に上回り、我々のモデルがソースコードを表現する強力な能力を示している。
関連論文リスト
- Masked Image Modeling: A Survey [73.21154550957898]
マスク付き画像モデリングは、コンピュータビジョンにおける強力な自己教師付き学習技術として登場した。
我々は近年,分類学を構築し,最も顕著な論文をレビューしている。
我々は,最も人気のあるデータセット上で,様々なマスク付き画像モデリング手法の性能評価結果を集約する。
論文 参考訳(メタデータ) (2024-08-13T07:27:02Z) - Deep Graph Reprogramming [112.34663053130073]
グラフニューラルネットワーク(GNN)に適したタスク再利用モデル「ディープグラフ再プログラミング」
本稿では,モデル再プログラミングパラダイムと並行して,革新的なデータ再プログラミングパラダイムを提案する。
論文 参考訳(メタデータ) (2023-04-28T02:04:29Z) - Software Vulnerability Detection via Deep Learning over Disaggregated
Code Graph Representation [57.92972327649165]
この研究は、コードコーパスから安全でないパターンを自動的に学習するためのディープラーニングアプローチを探求する。
コードには解析を伴うグラフ構造が自然に認められるため,プログラムの意味的文脈と構造的規則性の両方を利用する新しいグラフニューラルネットワーク(GNN)を開発する。
論文 参考訳(メタデータ) (2021-09-07T21:24:36Z) - On the Impact of Multiple Source Code Representations on Software
Engineering Tasks -- An Empirical Study [4.049850026698639]
我々は、ASTパスに基づくアプローチを変更し、複数の表現をアテンションベースモデルへの入力として受け入れる。
提案手法は,メソッドナーミング,プログラム分類,クローン検出の3つのタスクで評価する。
論文 参考訳(メタデータ) (2021-06-21T08:36:38Z) - Code2Image: Intelligent Code Analysis by Computer Vision Techniques and
Application to Vulnerability Prediction [0.6091702876917281]
本稿では,意味的および構文的性質を維持しつつ,ソースコードを画像として表現する新しい手法を提案する。
この手法により,ソースコードのイメージ表現を直接入力として深層学習(DL)アルゴリズムに入力することができる。
脆弱性予測ユースケースをパブリックデータセット上で実現することで,本手法の実現可能性と有効性を示す。
論文 参考訳(メタデータ) (2021-05-07T09:10:20Z) - How to Design Sample and Computationally Efficient VQA Models [53.65668097847456]
テキストを確率的プログラムとして表現し,イメージをオブジェクトレベルのシーングラフとして表現することが,これらのデシラタを最も満足していることが判明した。
既存のモデルを拡張して,これらのソフトプログラムとシーングラフを活用して,エンドツーエンドで質問応答ペアをトレーニングします。
論文 参考訳(メタデータ) (2021-03-22T01:48:16Z) - Enhancing Handwritten Text Recognition with N-gram sequence
decomposition and Multitask Learning [36.69114677635806]
手書きテキスト認識の分野における現在のアプローチは、主にユニグラム、文字レベルターゲットユニットを備えた単一のタスクです。
本研究では, 多タスク学習方式を用いて, 異なる粒度の目標単位を用いて, 対象シーケンスの分解を行うためのモデルを訓練する。
提案モデルでは,ユニグラムのタスクでのみ評価されるが,WERが2.52%,CERが1.02%と同等である。
論文 参考訳(メタデータ) (2020-12-28T19:35:40Z) - funcGNN: A Graph Neural Network Approach to Program Similarity [0.90238471756546]
FuncGNNは、ラベル付きCFGペアでトレーニングされたグラフニューラルネットワークで、効果的な埋め込みベクトルを利用することで、目に見えないプログラムペア間のGEDを予測する。
ハイレベル言語プログラム間の類似性を推定するためにラベル付きCFGにグラフニューラルネットワークが適用されたのはこれが初めてである。
論文 参考訳(メタデータ) (2020-07-26T23:16:24Z) - ProGraML: Graph-based Deep Learning for Program Optimization and
Analysis [16.520971531754018]
本稿では,機械学習のためのグラフベースのプログラム表現であるProGraMLを紹介する。
ProGraMLは平均94.0F1スコアを獲得し、最先端のアプローチを著しく上回っている。
そして、我々のアプローチを2つのハイレベルなタスク - 不均一なデバイスマッピングとプログラム分類 - に適用し、その両方で新しい最先端のパフォーマンスを設定します。
論文 参考訳(メタデータ) (2020-03-23T20:27:00Z) - Weakly Supervised Visual Semantic Parsing [49.69377653925448]
SGG(Scene Graph Generation)は、画像からエンティティ、述語、それらの意味構造を抽出することを目的としている。
既存のSGGメソッドでは、トレーニングのために何百万もの手動アノテーション付きバウンディングボックスが必要である。
本稿では,ビジュアルセマンティック・パーシング,VSPNet,グラフベースの弱教師付き学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-01-08T03:46:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。