論文の概要: DapStep: Deep Assignee Prediction for Stack Trace Error rePresentation
- arxiv url: http://arxiv.org/abs/2201.05256v1
- Date: Fri, 14 Jan 2022 00:16:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-17 15:33:05.936534
- Title: DapStep: Deep Assignee Prediction for Stack Trace Error rePresentation
- Title(参考訳): dapstep:スタックトレースエラー表現のディープアサイン予測
- Authors: Denis Sushentsev, Aleksandr Khvorov, Roman Vasiliev, Yaroslav Golubev,
Timofey Bryksin
- Abstract要約: 本稿では,バグトリアージ問題を解決するための新しいディープラーニングモデルを提案する。
モデルは、注目された双方向のリカレントニューラルネットワークと畳み込みニューラルネットワークに基づいている。
ランキングの質を向上させるために,バージョン管理システムのアノテーションから追加情報を利用することを提案する。
- 参考スコア(独自算出の注目度): 61.99379022383108
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The task of finding the best developer to fix a bug is called bug triage.
Most of the existing approaches consider the bug triage task as a
classification problem, however, classification is not appropriate when the
sets of classes change over time (as developers often do in a project).
Furthermore, to the best of our knowledge, all the existing models use textual
sources of information, i.e., bug descriptions, which are not always available.
In this work, we explore the applicability of existing solutions for the bug
triage problem when stack traces are used as the main data source of bug
reports. Additionally, we reformulate this task as a ranking problem and
propose new deep learning models to solve it. The models are based on a
bidirectional recurrent neural network with attention and on a convolutional
neural network, with the weights of the models optimized using a ranking loss
function. To improve the quality of ranking, we propose using additional
information from version control system annotations. Two approaches are
proposed for extracting features from annotations: manual and using an
additional neural network. To evaluate our models, we collected two datasets of
real-world stack traces. Our experiments show that the proposed models
outperform existing models adapted to handle stack traces. To facilitate
further research in this area, we publish the source code of our models and one
of the collected datasets.
- Abstract(参考訳): バグを修正するのに最適な開発者を見つけるタスクは、バグトリアージと呼ばれる。
既存のアプローチのほとんどは、バグトリアージタスクを分類問題とみなしているが、クラスセットが時間とともに変化する場合(開発者がプロジェクトでよく行うように)、分類は適切ではない。
さらに、私たちの知る限りでは、既存のモデルはすべて、テキストによる情報ソース(バグ記述など)を使用しているが、これは必ずしも利用できない。
本研究では,スタックトレースをバグレポートの主要データ源として使用する場合のバグトリアージ問題に対する既存ソリューションの適用可能性を検討する。
さらに,この課題をランキング問題として再編成し,新しい深層学習モデルを提案する。
モデルは、注目された双方向のリカレントニューラルネットワークと畳み込みニューラルネットワークに基づいており、ランキング損失関数を用いて最適化されたモデルの重み付けがある。
ランキングの質を向上させるために,バージョン管理システムアノテーションから追加情報を利用することを提案する。
手動と追加のニューラルネットワークを使用するアノテーションから特徴を抽出するための2つのアプローチが提案されている。
モデルを評価するために,実世界のスタックトレースのデータセットを2つ収集した。
実験の結果,提案手法はスタックトレースに適応した既存モデルよりも優れていた。
この領域のさらなる研究を容易にするために、我々はモデルのソースコードと収集されたデータセットの1つを公開する。
関連論文リスト
- SINDER: Repairing the Singular Defects of DINOv2 [61.98878352956125]
大規模なデータセットでトレーニングされたビジョントランスフォーマーモデルは、抽出したパッチトークンにアーティファクトを表示することが多い。
本稿では,小さなデータセットのみを用いて構造欠陥を補正するスムーズなスムーズな正規化を提案する。
論文 参考訳(メタデータ) (2024-07-23T20:34:23Z) - Zero-shot Retrieval: Augmenting Pre-trained Models with Search Engines [83.65380507372483]
大規模で事前訓練されたモデルは、問題を解決するのに必要なタスク固有のデータの量を劇的に削減するが、多くの場合、ドメイン固有のニュアンスを箱から取り出すのに失敗する。
本稿では,NLPとマルチモーダル学習の最近の進歩を活用して,検索エンジン検索による事前学習モデルを強化する方法について述べる。
論文 参考訳(メタデータ) (2023-11-29T05:33:28Z) - Do Language Models Learn Semantics of Code? A Case Study in
Vulnerability Detection [7.725755567907359]
我々は,解釈可能性ツール,注意分析,相互作用行列解析という3つの異なる手法を用いてモデルを解析する。
モデル入力内のバグセマンティクスをハイライトする2つのアノテーション手法を開発した。
この結果から,より複雑なパスベースのバグセマンティクスを学習する上で,モデルにバグセマンティクスの情報を提供し,モデルがそれに参加することができることを示唆した。
論文 参考訳(メタデータ) (2023-11-07T16:31:56Z) - An Effective Data-Driven Approach for Localizing Deep Learning Faults [20.33411443073181]
問題パターンの学習にモデル機能を活用する新しいデータ駆動手法を提案する。
本手法は,手作業によるマッピングを必要とせず,バグ症状を根本原因に自動的に関連付ける。
以上の結果から,本手法は様々なバグタイプを効果的に検出・診断できることが示唆された。
論文 参考訳(メタデータ) (2023-07-18T03:28:39Z) - Debugging using Orthogonal Gradient Descent [7.766921168069532]
部分的に欠陥があるトレーニングされたモデルを考えると、モデルをスクラッチからトレーニングすることなく、その振る舞いを修正できますか?
言い換えれば、ニューラルネットワークは、数学的モデルと標準的なコンピュータコードのバグに対処する方法に似ていますか?
論文 参考訳(メタデータ) (2022-06-17T00:03:54Z) - Annotation Error Detection: Analyzing the Past and Present for a More
Coherent Future [63.99570204416711]
我々は、潜在的なアノテーションの誤りを検知するための18の手法を再実装し、9つの英語データセット上で評価する。
アノテーションエラー検出タスクの新しい形式化を含む一様評価設定を定義する。
私たちはデータセットと実装を,使いやすく,オープンソースのソフトウェアパッケージとしてリリースしています。
論文 参考訳(メタデータ) (2022-06-05T22:31:45Z) - Optimizing Active Learning for Low Annotation Budgets [6.753808772846254]
ディープラーニングでは、アクティブな学習は通常、微調整によって連続した深層モデルを更新する反復的なプロセスとして実装される。
移行学習にインスパイアされたアプローチを用いてこの問題に対処する。
本稿では,ALプロセスの反復性を利用してより堅牢なサンプルを抽出する新しい取得関数を提案する。
論文 参考訳(メタデータ) (2022-01-18T18:53:10Z) - X-model: Improving Data Efficiency in Deep Learning with A Minimax Model [78.55482897452417]
ディープラーニングにおける分類と回帰設定の両面でのデータ効率の向上を目標とする。
両世界の力を生かすために,我々は新しいX-モデルを提案する。
X-モデルは、特徴抽出器とタスク固有のヘッドの間でミニマックスゲームを行う。
論文 参考訳(メタデータ) (2021-10-09T13:56:48Z) - Towards Open-World Feature Extrapolation: An Inductive Graph Learning
Approach [80.8446673089281]
グラフ表現と学習を伴う新しい学習パラダイムを提案する。
本フレームワークは,1) 下位モデルとしてのバックボーンネットワーク(フィードフォワードニューラルネットなど)が,予測ラベルの入力および出力として機能を取り,2) 上位モデルとしてのグラフニューラルネットワークが,観測データから構築された特徴データグラフをメッセージパッシングすることで,新機能の埋め込みを外挿することを学ぶ。
論文 参考訳(メタデータ) (2021-10-09T09:02:45Z) - An Efficient Method of Training Small Models for Regression Problems
with Knowledge Distillation [1.433758865948252]
回帰問題に対する知識蒸留の新しい定式化を提案する。
まず,教師モデル予測を用いて,教師モデルを用いた学習サンプルの退学率を下げる新たな損失関数,教師の退学率の減少を提案する。
マルチタスクネットワークを考えることで、学生モデルの特徴抽出の訓練がより効果的になる。
論文 参考訳(メタデータ) (2020-02-28T08:46:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。