論文の概要: Code Revert Prediction with Graph Neural Networks: A Case Study at J.P. Morgan Chase
- arxiv url: http://arxiv.org/abs/2403.09507v1
- Date: Thu, 14 Mar 2024 15:54:29 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-15 19:57:52.418930
- Title: Code Revert Prediction with Graph Neural Networks: A Case Study at J.P. Morgan Chase
- Title(参考訳): グラフニューラルネットワークによるコード反転予測: J.P. Morgan Chaseでのケーススタディ
- Authors: Yulong Pei, Salwa Alamir, Rares Dolga, Sameena Shah,
- Abstract要約: コードリバース予測は、コード変更がソフトウェア開発で逆転またはロールバックされる可能性を予測または予測することを目的としている。
コード欠陥検出の以前の方法は、独立した機能に依存していたが、コードスクリプト間の関係を無視していた。
本稿では,コードインポートグラフとコード特徴を統合した,コード逆転予測のための系統的研究について述べる。
- 参考スコア(独自算出の注目度): 10.961209762486684
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Code revert prediction, a specialized form of software defect detection, aims to forecast or predict the likelihood of code changes being reverted or rolled back in software development. This task is very important in practice because by identifying code changes that are more prone to being reverted, developers and project managers can proactively take measures to prevent issues, improve code quality, and optimize development processes. However, compared to code defect detection, code revert prediction has been rarely studied in previous research. Additionally, many previous methods for code defect detection relied on independent features but ignored relationships between code scripts. Moreover, new challenges are introduced due to constraints in an industry setting such as company regulation, limited features and large-scale codebase. To overcome these limitations, this paper presents a systematic empirical study for code revert prediction that integrates the code import graph with code features. Different strategies to address anomalies and data imbalance have been implemented including graph neural networks with imbalance classification and anomaly detection. We conduct the experiments on real-world code commit data within J.P. Morgan Chase which is extremely imbalanced in order to make a comprehensive comparison of these different approaches for the code revert prediction problem.
- Abstract(参考訳): コードリバース予測(Code Revert Prediction)は、ソフトウェア欠陥検出の特殊な形式であり、コード変更がソフトウェア開発で逆転またはロールバックされる可能性を予測または予測することを目的としている。
このタスクは、逆転しやすいコード変更を特定することで、開発者とプロジェクトマネージャが積極的に対策を講じ、問題を避け、コード品質を改善し、開発プロセスを最適化できるため、実際には非常に重要です。
しかし、コード欠陥検出と比較して、コード逆転予測は以前の研究ではほとんど研究されていない。
さらに、コード欠陥検出の多くの従来の方法は、独立した機能に依存していたが、コードスクリプト間の関係を無視していた。
さらに、企業の規制、限られた機能、大規模なコードベースといった業界環境の制約により、新たな課題がもたらされる。
これらの制約を克服するために,コードインポートグラフとコード機能を統合する,コード逆転予測の体系的研究を行った。
異常とデータ不均衡に対処するさまざまな戦略が実装され、不均衡分類と異常検出を備えたグラフニューラルネットワークが実装されている。
J.P. Morgan Chase 内の実世界のコードコミットデータについて実験を行い、コード反転予測問題に対するこれらの異なるアプローチを包括的に比較するため、非常に不均衡である。
関連論文リスト
- LLMs as Continuous Learners: Improving the Reproduction of Defective Code in Software Issues [62.12404317786005]
EvoCoderは、イシューコード再現のための継続的学習フレームワークである。
その結果,既存のSOTA法よりも20%改善した。
論文 参考訳(メタデータ) (2024-11-21T08:49:23Z) - Understanding Code Understandability Improvements in Code Reviews [79.16476505761582]
GitHub上のJavaオープンソースプロジェクトからの2,401のコードレビューコメントを分析した。
改善提案の83.9%が承認され、統合され、1%未満が後に復活した。
論文 参考訳(メタデータ) (2024-10-29T12:21:23Z) - Chain of Targeted Verification Questions to Improve the Reliability of Code Generated by LLMs [10.510325069289324]
LLMが生成するコードの信頼性向上を目的とした自己補充手法を提案する。
当社のアプローチは,初期コード内の潜在的なバグを特定するために,対象とする検証質問(VQ)に基づいています。
本手法は,LLMをターゲットとするVQと初期コードで再プロンプトすることで,潜在的なバグの修復を試みる。
論文 参考訳(メタデータ) (2024-05-22T19:02:50Z) - Mining Action Rules for Defect Reduction Planning [14.40839500239476]
ブラックボックスモデルを使わずに欠陥低減計画を生成するための,非実効的アクティオンルールマイニング手法であるCounterACTを導入する。
我々は,9つのソフトウェアプロジェクトにおいて,CounterACTの有効性を,元のアクションルールマイニングアルゴリズムと6つの確立された欠陥低減手法と比較した。
その結果、競合するアプローチと比較して、CounterACTの説明可能なプランはリリースレベルで高いオーバーラップスコアを得ることができた。
論文 参考訳(メタデータ) (2024-05-22T15:31:09Z) - BAFLineDP: Code Bilinear Attention Fusion Framework for Line-Level
Defect Prediction [0.0]
本稿では,BAFLineDP(Code Bilinear attention fusion framework)に基づくラインレベルの欠陥予測手法を提案する。
以上の結果から,BAFLineDPは現在のファイルレベルおよびラインレベルの欠陥予測手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-02-11T09:01:42Z) - Predicting Line-Level Defects by Capturing Code Contexts with
Hierarchical Transformers [4.73194777046253]
Bugsplorerは、ラインレベルの欠陥予測のための新しいディープラーニング技術である。
上位1~3%の疑わしい線のうち、最初の20%の欠陥線をランク付けできる。
欠陥ラインのランクを高くすることで、SQAコストを大幅に削減する可能性がある。
論文 参考訳(メタデータ) (2023-12-19T06:25:04Z) - Testing the Accuracy of Surface Code Decoders [55.616364225463066]
大規模でフォールトトレラントな量子計算は量子エラー訂正符号(QECC)によって実現される
本研究は,QECC復号方式の精度と有効性をテストするための最初の体系的手法である。
論文 参考訳(メタデータ) (2023-11-21T10:22:08Z) - Refining neural network predictions using background knowledge [68.35246878394702]
学習システムにおける論理的背景知識を用いて,ラベル付きトレーニングデータの不足を補うことができることを示す。
そこで本研究では,修正された予測を元の予測に近い精度で検出する微分可能精細関数を提案する。
このアルゴリズムは、複雑なSATの公式に対して、非常に少ない繰り返しで最適に洗練され、勾配降下ができない解がしばしば見つかる。
論文 参考訳(メタデータ) (2022-06-10T10:17:59Z) - Graph-Based Machine Learning Improves Just-in-Time Defect Prediction [0.38073142980732994]
グラフベースの機械学習を使用して、Just-In-Time(JIT)の欠陥予測を改善します。
私たちの最高のモデルでは、コード変更がF1スコアが最大77.55%の欠陥につながるかどうかを予測できます。
これは、最先端のJIT欠陥予測よりも152%高いF1スコアと3%高いMCCを示している。
論文 参考訳(メタデータ) (2021-10-11T16:00:02Z) - Measuring Coding Challenge Competence With APPS [54.22600767666257]
コード生成のベンチマークであるAPPSを紹介する。
私たちのベンチマークには1万の問題が含まれています。
GPT-Neoのような最近のモデルでは、導入問題のテストケースの約15%をパスできる。
論文 参考訳(メタデータ) (2021-05-20T17:58:42Z) - Relaxing the Constraints on Predictive Coding Models [62.997667081978825]
予測符号化(英: Predictive coding)は、脳が行う主計算が予測誤差の最小化であるとする皮質機能の影響力のある理論である。
アルゴリズムの標準的な実装は、同じ前方と後方の重み、後方の非線形微分、1-1エラーユニット接続といった、潜在的に神経的に予測できない特徴を含んでいる。
本稿では,これらの特徴はアルゴリズムに不可欠なものではなく,Hebbianの更新ルールを用いてパラメータセットを直接あるいは学習することで,学習性能に悪影響を及ぼすことなく除去可能であることを示す。
論文 参考訳(メタデータ) (2020-10-02T15:21:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。