論文の概要: Leveraging Structural Properties of Source Code Graphs for Just-In-Time
Bug Prediction
- arxiv url: http://arxiv.org/abs/2201.10137v1
- Date: Tue, 25 Jan 2022 07:20:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-26 16:05:35.406680
- Title: Leveraging Structural Properties of Source Code Graphs for Just-In-Time
Bug Prediction
- Title(参考訳): ジャストインタイムバグ予測のためのソースコードグラフの構造特性の活用
- Authors: Md Nadim, Debajyoti Mondal, Chanchal K. Roy
- Abstract要約: グラフは関係データを理解するのに最もよく使われる表現の1つである。
本研究では,ソースコードのリレーショナル特性をグラフ形式で活用する手法を提案する。
- 参考スコア(独自算出の注目度): 6.467090475885797
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The most common use of data visualization is to minimize the complexity for
proper understanding. A graph is one of the most commonly used representations
for understanding relational data. It produces a simplified representation of
data that is challenging to comprehend if kept in a textual format. In this
study, we propose a methodology to utilize the relational properties of source
code in the form of a graph to identify Just-in-Time (JIT) bug prediction in
software systems during different revisions of software evolution and
maintenance. We presented a method to convert the source codes of commit
patches to equivalent graph representations and named it Source Code Graph
(SCG). To understand and compare multiple source code graphs, we extracted
several structural properties of these graphs, such as the density, number of
cycles, nodes, edges, etc. We then utilized the attribute values of those SCGs
to visualize and detect buggy software commits. We process more than 246K
software commits from 12 subject systems in this investigation. Our
investigation on these 12 open-source software projects written in C++ and Java
programming languages shows that if we combine the features from SCG with
conventional features used in similar studies, we will get the increased
performance of Machine Learning (ML) based buggy commit detection models. We
also find the increase of F1~Scores in predicting buggy and non-buggy commits
statistically significant using the Wilcoxon Signed Rank Test. Since SCG-based
feature values represent the style or structural properties of source code
updates or changes in the software system, it suggests the importance of
careful maintenance of source code style or structure for keeping a software
system bug-free.
- Abstract(参考訳): データ可視化の最も一般的な用途は、適切な理解のために複雑さを最小化することである。
グラフは関係データを理解するために最もよく使われる表現の1つである。
テキスト形式で保持されている場合の理解が困難であるデータの簡易表現を生成する。
本研究では,ソースコードのリレーショナル特性をグラフ形式で活用し,ソフトウェアの進化とメンテナンスの異なる修正において,ソフトウェアシステムにおけるJust-in-Time(JIT)バグ予測を識別する手法を提案する。
我々はコミットパッチのソースコードを等価なグラフ表現に変換する方法を示し、それをソースコードグラフ(SCG)と名付けた。
複数のソースコードグラフを解析・比較するために,密度,周期数,ノード数,エッジ数など,これらのグラフの構造特性を抽出した。
そして、それらのscgの属性値を利用して、バグの多いソフトウェアコミットを視覚化し、検出します。
この調査では12の被験者システムから246K以上のソフトウェアコミットを処理する。
c++とjavaで記述されたこれらの12のオープンソースソフトウェアプロジェクトに関する調査は、scgの機能を同様の研究で使用される従来の機能と組み合わせることで、機械学習(ml)ベースのバギーコミット検出モデルのパフォーマンスが向上することを示している。
また、Wilcoxon Signed Rank Test を用いて、バグや非バグのコミットを統計的に有意に予測する際の F1~Scores の増加も見出した。
SCGベースの特徴値は、ソースコードの更新やソフトウェアシステムの変更のスタイルや構造を表現しているため、ソースコードのスタイルや構造を慎重にメンテナンスすることの重要性が示唆されている。
関連論文リスト
- GC-Bench: An Open and Unified Benchmark for Graph Condensation [54.70801435138878]
我々は,グラフ凝縮の性能を解析するための総合的なグラフ凝縮ベンチマーク (GC-Bench) を開発した。
GC-Benchは、グラフ凝縮の特徴を以下の次元で体系的に研究している。
我々は,再現性のある研究を容易にするために,異なるGC手法を訓練し,評価するための簡易ライブラリを開発した。
論文 参考訳(メタデータ) (2024-06-30T07:47:34Z) - CONCORD: Towards a DSL for Configurable Graph Code Representation [3.756550107432323]
カスタマイズ可能なグラフ表現を構築するためのドメイン固有言語であるCONCORDを紹介する。
実例として,コードの臭い検出に有効であることを示す。
ConCORDは、研究者がカスタマイズ可能なグラフベースのコード表現を作成し、実験するのに役立つ。
論文 参考訳(メタデータ) (2024-01-31T16:16:48Z) - Semantic Code Graph -- an information model to facilitate software
comprehension [0.0]
メンテナンスを容易にし、関連するコストを削減するために、コード理解プロセスを加速する必要性が高まっています。
さまざまなコード構造モデルがすでに存在していますが、ソースコードを密接に表現するモデルが驚くほど不足しています。
本稿では,コード依存関係の詳細な抽象表現を提供する情報モデルであるSemantic Code Graph (SCG)を提案する。
論文 参考訳(メタデータ) (2023-10-03T15:09:49Z) - DSHGT: Dual-Supervisors Heterogeneous Graph Transformer -- A pioneer study of using heterogeneous graph learning for detecting software vulnerabilities [12.460745260973837]
脆弱性検出はソフトウェアセキュリティにおいて重要な問題であり、学術と産業の両方から注目を集めている。
ディープラーニング、特にグラフニューラルネットワーク(GNN)の最近の進歩は、幅広いソフトウェア脆弱性の自動検出の可能性を明らかにしている。
この研究において、我々はCode Property Graphという形で異種グラフ表現を最初に探求した1人です。
論文 参考訳(メタデータ) (2023-06-02T08:57:13Z) - A Unified Active Learning Framework for Annotating Graph Data with
Application to Software Source Code Performance Prediction [4.572330678291241]
ソフトウェアの性能予測を専門とする一貫したアクティブラーニングフレームワークを開発した。
能動的・受動的学習に異なるレベルの情報を用いることが与える影響について検討する。
我々のアプローチは、異なるソフトウェアパフォーマンス予測のためのAIモデルへの投資を改善することを目的としています。
論文 参考訳(メタデータ) (2023-04-06T14:00:48Z) - GraphCoCo: Graph Complementary Contrastive Learning [65.89743197355722]
グラフコントラスト学習(GCL)は、手作業によるアノテーションの監督なしに、グラフ表現学習(GRL)において有望な性能を示した。
本稿では,この課題に対処するため,グラフココというグラフ補完型コントラスト学習手法を提案する。
論文 参考訳(メタデータ) (2022-03-24T02:58:36Z) - Software Vulnerability Detection via Deep Learning over Disaggregated
Code Graph Representation [57.92972327649165]
この研究は、コードコーパスから安全でないパターンを自動的に学習するためのディープラーニングアプローチを探求する。
コードには解析を伴うグラフ構造が自然に認められるため,プログラムの意味的文脈と構造的規則性の両方を利用する新しいグラフニューラルネットワーク(GNN)を開発する。
論文 参考訳(メタデータ) (2021-09-07T21:24:36Z) - deGraphCS: Embedding Variable-based Flow Graph for Neural Code Search [15.19181807445119]
ソースコードを変数ベースのフローグラフに変換する学習可能なDeGraph for Code Search(deGraphCSと呼ばれる)を提案する。
C言語で記述された41,152のコードスニペットを含む大規模なデータセットをGitHubから収集しています。
論文 参考訳(メタデータ) (2021-03-24T06:57:44Z) - Learning to map source code to software vulnerability using
code-as-a-graph [67.62847721118142]
セキュリティの観点からソースコードのニュアンス学習におけるグラフニューラルネットワークの適用性について検討する。
我々は,既存のコード・アズ・フォトや線形シーケンスの符号化手法よりも,脆弱性検出に有効なコード・アズ・グラフの符号化法を示す。
論文 参考訳(メタデータ) (2020-06-15T16:05:27Z) - A Transformer-based Approach for Source Code Summarization [86.08359401867577]
コードトークン間のペア関係をモデル化することにより,要約のためのコード表現を学習する。
アプローチは単純であるにもかかわらず、最先端技術よりもかなりの差があることが示される。
論文 参考訳(メタデータ) (2020-05-01T23:29:36Z) - Auto-Encoding Twin-Bottleneck Hashing [141.5378966676885]
本稿では,効率よく適応的なコード駆動グラフを提案する。
自動エンコーダのコンテキストでデコードすることで更新される。
ベンチマークデータセットの実験は、最先端のハッシュ手法よりもフレームワークの方が優れていることを明らかに示しています。
論文 参考訳(メタデータ) (2020-02-27T05:58:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。