論文の概要: AutoPruner: Transformer-Based Call Graph Pruning
- arxiv url: http://arxiv.org/abs/2209.03230v1
- Date: Wed, 7 Sep 2022 15:35:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-08 12:56:26.129900
- Title: AutoPruner: Transformer-Based Call Graph Pruning
- Title(参考訳): AutoPruner: トランスフォーマーベースのコールグラフプルーニング
- Authors: Thanh Le-Cong, Hong Jin Kang, Truong Giang Nguyen, Stefanus Agus
Haryono, David Lo, Xuan-Bach D. Le, Huynh Quyet Thang
- Abstract要約: 本稿では,統計的意味解析と構造解析の両方を通じて,コールグラフの偽陽性を除去する新しいコールグラフ解析手法であるAutoPrunerを提案する。
実世界のプログラムのベンチマークデータセットに対する実証的な評価は、AutoPrunerが最先端のベースラインを上回っていることを示している。
- 参考スコア(独自算出の注目度): 7.319973664340497
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Constructing a static call graph requires trade-offs between soundness and
precision. Program analysis techniques for constructing call graphs are
unfortunately usually imprecise. To address this problem, researchers have
recently proposed call graph pruning empowered by machine learning to
post-process call graphs constructed by static analysis. A machine learning
model is built to capture information from the call graph by extracting
structural features for use in a random forest classifier. It then removes
edges that are predicted to be false positives. Despite the improvements shown
by machine learning models, they are still limited as they do not consider the
source code semantics and thus often are not able to effectively distinguish
true and false positives. In this paper, we present a novel call graph pruning
technique, AutoPruner, for eliminating false positives in call graphs via both
statistical semantic and structural analysis. Given a call graph constructed by
traditional static analysis tools, AutoPruner takes a Transformer-based
approach to capture the semantic relationships between the caller and callee
functions associated with each edge in the call graph. To do so, AutoPruner
fine-tunes a model of code that was pre-trained on a large corpus to represent
source code based on descriptions of its semantics. Next, the model is used to
extract semantic features from the functions related to each edge in the call
graph. AutoPruner uses these semantic features together with the structural
features extracted from the call graph to classify each edge via a feed-forward
neural network. Our empirical evaluation on a benchmark dataset of real-world
programs shows that AutoPruner outperforms the state-of-the-art baselines,
improving on F-measure by up to 13% in identifying false-positive edges in a
static call graph.
- Abstract(参考訳): 静的なコールグラフを構築するには、音質と精度のトレードオフが必要となる。
コールグラフを構築するためのプログラム解析技術は通常不正確である。
この問題に対処するため、研究者は最近、静的解析によって構築されたコールグラフの処理後処理に機械学習によって強化されたコールグラフプルーニングを提案している。
ランダムな森林分類器で使用する構造的特徴を抽出することにより、コールグラフから情報を取得する機械学習モデルを構築する。
その後、偽陽性と予測されるエッジを除去する。
機械学習モデルによって示された改善にもかかわらず、ソースコードの意味を考慮せず、しばしば真と偽の正を効果的に区別できないため、まだ制限されている。
本稿では,統計的意味論と構造分析の両方を通じて,コールグラフの誤陽性を解消する新しいコールグラフプルーニング手法であるautoprunerを提案する。
従来の静的解析ツールで構築されたコールグラフが与えられると、autoprunerはトランスフォーマーベースのアプローチを採用して、コールグラフの各エッジに関連付けられた呼び出し元と呼び出し元関数間の意味関係をキャプチャする。
そのためにautoprunerは、大きなコーパスで事前トレーニングされたコードのモデルを微調整して、そのセマンティクスの説明に基づいてソースコードを表現する。
次に、モデルを使用して、呼び出しグラフの各エッジに関連する関数から意味的特徴を抽出する。
autoprunerはこれらのセマンティック機能をコールグラフから抽出した構造的特徴と合わせて、フィードフォワードニューラルネットワークを介して各エッジを分類する。
実世界のプログラムのベンチマークデータセットを用いた実証評価では、AutoPrunerは最先端のベースラインよりも優れており、静的コールグラフにおける偽陽性エッジの識別において最大13%向上している。
関連論文リスト
- Similarity-aware Positive Instance Sampling for Graph Contrastive
Pre-training [82.68805025636165]
トレーニングセット内の既存グラフから直接正のグラフインスタンスを選択することを提案する。
私たちの選択は、特定のドメイン固有のペアワイズ類似度測定に基づいています。
さらに,ノードを動的にマスキングしてグラフ上に均等に分配する適応ノードレベルの事前学習手法を開発した。
論文 参考訳(メタデータ) (2022-06-23T20:12:51Z) - Explanation Graph Generation via Pre-trained Language Models: An
Empirical Study with Contrastive Learning [84.35102534158621]
エンドツーエンドで説明グラフを生成する事前学習言語モデルについて検討する。
本稿では,ノードとエッジの編集操作によるグラフ摂動の簡易かつ効果的な方法を提案する。
提案手法は,説明グラフの構造的精度と意味的精度を両立させる。
論文 参考訳(メタデータ) (2022-04-11T00:58:27Z) - Multi-task Self-distillation for Graph-based Semi-Supervised Learning [6.277952154365413]
本稿では,グラフ畳み込みネットワークに自己教師付き学習と自己蒸留を注入するマルチタスク自己蒸留フレームワークを提案する。
まず、プレテキストタスクに基づいて自己超越パイプラインを定式化し、グラフの異なるレベルの類似性をキャプチャする。
第二に、自己蒸留はモデル自体のソフトラベルを追加の監督として使用する。
論文 参考訳(メタデータ) (2021-12-02T12:43:41Z) - Joint Graph Learning and Matching for Semantic Feature Correspondence [69.71998282148762]
本稿では,グラフマッチングを向上するための信頼度の高いグラフ構造を探索するために,GLAMという共用電子グラフ学習とマッチングネットワークを提案する。
提案手法は,3つの人気ビジュアルマッチングベンチマーク (Pascal VOC, Willow Object, SPair-71k) で評価される。
すべてのベンチマークにおいて、従来の最先端のグラフマッチング手法よりも大きなマージンを達成している。
論文 参考訳(メタデータ) (2021-09-01T08:24:02Z) - Temporal Graph Network Embedding with Causal Anonymous Walks
Representations [54.05212871508062]
本稿では,時間グラフネットワークに基づく動的ネットワーク表現学習のための新しいアプローチを提案する。
評価のために、時間的ネットワーク埋め込みの評価のためのベンチマークパイプラインを提供する。
欧州の大手銀行が提供した実世界のダウンストリームグラフ機械学習タスクにおいて、我々のモデルの適用性と優れた性能を示す。
論文 参考訳(メタデータ) (2021-08-19T15:39:52Z) - Partial Graph Reasoning for Neural Network Regularization [26.793648333908905]
ドロップアウト(Dropout)は、よく使われる正規化手法であり、ネットワーク最適化中にニューロンのc-tivationsを無効にする。
バックボーンの特徴からスタンドアローングラフを構築することで正規化関数を学習するDropGraphを提案する。
このアドオングラフはトレーニング中にネットワークを正規化し、推論中に完全にスキップすることができる。
論文 参考訳(メタデータ) (2021-06-03T12:57:01Z) - Learnable Graph Matching: Incorporating Graph Partitioning with Deep
Feature Learning for Multiple Object Tracking [58.30147362745852]
フレーム間のデータアソシエーションは、Multiple Object Tracking(MOT)タスクの中核にある。
既存の手法は、主にトラックレットとフレーム内検出の間のコンテキスト情報を無視する。
そこで本研究では,学習可能なグラフマッチング手法を提案する。
論文 参考訳(メタデータ) (2021-03-30T08:58:45Z) - Line Graph Neural Networks for Link Prediction [71.00689542259052]
実世界の多くのアプリケーションにおいて古典的なグラフ解析問題であるグラフリンク予測タスクについて検討する。
このフォーマリズムでは、リンク予測問題をグラフ分類タスクに変換する。
本稿では,線グラフをグラフ理論に用いて,根本的に異なる新しい経路を求めることを提案する。
特に、線グラフの各ノードは、元のグラフのユニークなエッジに対応するため、元のグラフのリンク予測問題は、グラフ分類タスクではなく、対応する線グラフのノード分類問題として等価に解決できる。
論文 参考訳(メタデータ) (2020-10-20T05:54:31Z) - Learning Graph Structure With A Finite-State Automaton Layer [31.028101360041227]
本研究は,本質的なグラフ構造から抽象的関係を導出する学習の課題について考察する。
この問題を緩和して有限状態オートマトンポリシーを学習することで、これらの関係をエンドツーエンドで学習する方法を示す。
我々は,このレイヤがグリッドワールドグラフのショートカットを見つけ,Pythonプログラム上で単純な静的解析を再現できることを実証した。
論文 参考訳(メタデータ) (2020-07-09T17:01:34Z) - Non-Parametric Graph Learning for Bayesian Graph Neural Networks [35.88239188555398]
グラフ隣接行列の後方分布を構築するための新しい非パラメトリックグラフモデルを提案する。
このモデルの利点を,ノード分類,リンク予測,レコメンデーションという3つの異なる問題設定で示す。
論文 参考訳(メタデータ) (2020-06-23T21:10:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。