Fugu-MT 論文翻訳(概要): HaPy-Bug -- Human Annotated Python Bug Resolution Dataset

論文の概要: HaPy-Bug -- Human Annotated Python Bug Resolution Dataset

arxiv url: http://arxiv.org/abs/2504.04810v1
Date: Mon, 07 Apr 2025 08:04:56 GMT
ステータス: 翻訳完了
システム内更新日: 2025-04-15 21:09:29.298743
Title: HaPy-Bug -- Human Annotated Python Bug Resolution Dataset
Title（参考訳）: HaPy-Bug - Pythonの注釈付きバグ解決データセット
Authors: Piotr Przymus, Mikołaj Fejzer, Jakub Narębski, Radosław Woźniak, Łukasz Halada, Aleksander Kazecki, Mykhailo Molchanov, Krzysztof Stencel,
Abstract要約: HaPy-Bugは、バグ修正に関連する793のPythonソースコードコミットのキュレートデータセットである。我々はHaPy-Bugを分析し、ファイルの目的、変更の種類、および絡み合った変更の分布を調べる。
参考スコア（独自算出の注目度）: 34.82692226532414
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We present HaPy-Bug, a curated dataset of 793 Python source code commits associated with bug fixes, with each line of code annotated by three domain experts. The annotations offer insights into the purpose of modified files, changes at the line level, and reviewers' confidence levels. We analyze HaPy-Bug to examine the distribution of file purposes, types of modifications, and tangled changes. Additionally, we explore its potential applications in bug tracking, the analysis of bug-fixing practices, and the development of repository analysis tools. HaPy-Bug serves as a valuable resource for advancing research in software maintenance and security.
Abstract（参考訳）: HaPy-Bugは、バグ修正に関連する793のPythonソースコードコミットのキュレートされたデータセットで、3つのドメインの専門家が注釈を付けた各行のコードを提示する。アノテーションは、修正されたファイルの目的、ラインレベルの変更、レビュアーの信頼レベルに関する洞察を提供する。我々はHaPy-Bugを分析し、ファイルの目的、変更の種類、および絡み合った変更の分布を調べる。さらに、バグトラッキング、バグ修正プラクティスの分析、リポジトリ分析ツールの開発における潜在的な応用について検討する。 HaPy-Bugは、ソフトウェアのメンテナンスとセキュリティの研究を進めるための貴重なリソースである。

関連論文リスト

GitBugs: Bug Reports for Duplicate Detection, Retrieval Augmented Generation, Triage, and More [0.0]
私たちはGitBugsを紹介します。9つのアクティブにメンテナンスされているオープンソースプロジェクトから15万以上のバグレポートを収集し、簡潔で最新のデータセットです。 GitBugsはGithub、Bugzilla、Jiraのイシュートラッカからのデータを集約し、分類タスクの標準化されたカテゴリフィールドを提供する。予報分析ノートや、重複率や解像度時間などの詳細なプロジェクトレベルの統計情報が含まれている。
論文参考訳（メタデータ） (2025-04-13T16:55:28Z)
The Impact Of Bug Localization Based on Crash Report Mining: A Developers' Perspective [7.952391285456257]
事故報告をグループ化し,バグコードを見つけるためのアプローチを18ヶ月にわたって毎週実施した経験を報告する。この調査で調査されたアプローチは、バギーファイルの大部分を正しく示唆していた。
論文参考訳（メタデータ） (2024-03-16T01:23:01Z)
MultiDimEr: a multi-dimensional bug analyzEr [5.318531077716712]
技術的負債を特定するために,バグレポートの次元を分類し,視覚化する。この証拠は、実践者や意思決定者に対して、改善努力を操縦するための議論的な基盤としてだけでなく、根本原因分析の出発点としても役立つ。
論文参考訳（メタデータ） (2024-02-16T16:00:42Z)
PreciseBugCollector: Extensible, Executable and Precise Bug-fix Collection [8.79879909193717]
正確な多言語バグ収集手法であるPreciseBugCollectorを紹介する。外部バグリポジトリでリポジトリをマップしてバグタイプ情報をトレースするバグトラッカと、プロジェクト固有のバグを生成するバグインジェクタの2つの新しいコンポーネントに基づいている。現在、PreciseBugCollectorは2968のオープンソースプロジェクトから抽出された1057818のバグを含んでいる。
論文参考訳（メタデータ） (2023-09-12T13:47:44Z)
RAP-Gen: Retrieval-Augmented Patch Generation with CodeT5 for Automatic Program Repair [75.40584530380589]
新たな検索型パッチ生成フレームワーク(RAP-Gen)を提案する。 RAP-Gen 以前のバグ修正ペアのリストから取得した関連する修正パターンを明示的に活用する。 RAP-GenをJavaScriptのTFixベンチマークとJavaのCode RefinementとDefects4Jベンチマークの2つのプログラミング言語で評価する。
論文参考訳（メタデータ） (2023-09-12T08:52:56Z)
What Happens When We Fuzz? Investigating OSS-Fuzz Bug History [0.9772968596463595]
我々は2022年3月12日までにOSS-Fuzzが公表した44,102件の問題を分析した。コードを含むバグの発生時期を推定するために,バグ貢献のコミットを特定し,検出から修正までのタイムラインを測定した。
論文参考訳（メタデータ） (2023-05-19T05:15:36Z)
Using Developer Discussions to Guide Fixing Bugs in Software [51.00904399653609]
我々は,タスク実行前に利用可能であり,また自然発生しているバグレポートの議論を,開発者による追加情報の必要性を回避して利用することを提案する。このような議論から派生したさまざまな自然言語コンテキストがバグ修正に役立ち、オラクルのバグ修正コミットに対応するコミットメッセージの使用よりもパフォーマンスの向上につながることを実証する。
論文参考訳（メタデータ） (2022-11-11T16:37:33Z)
DapStep: Deep Assignee Prediction for Stack Trace Error rePresentation [61.99379022383108]
本稿では,バグトリアージ問題を解決するための新しいディープラーニングモデルを提案する。モデルは、注目された双方向のリカレントニューラルネットワークと畳み込みニューラルネットワークに基づいている。ランキングの質を向上させるために,バージョン管理システムのアノテーションから追加情報を利用することを提案する。
論文参考訳（メタデータ） (2022-01-14T00:16:57Z)
Break-It-Fix-It: Unsupervised Learning for Program Repair [90.55497679266442]
我々は2つの重要なアイデアを持つ新しいトレーニング手法であるBreak-It-Fix-It (BIFI)を提案する。批判者は、実際の悪い入力でフィクスダーの出力をチェックし、トレーニングデータに良い(固定された)出力を追加する。これらのアイデアに基づいて、よりペア化されたデータを生成するために、ブレーカとフィクスチャを同時に使用しながら、繰り返し更新する。 BIFIは既存のメソッドより優れており、GitHub-Pythonで90.5%、DeepFixで71.7%の修正精度がある。
論文参考訳（メタデータ） (2021-06-11T20:31:04Z)
Self-Supervised Bug Detection and Repair [27.46717890823656]
本稿では,バグ検出と修復の自己教師型学習手法であるBugLabを紹介する。 BugLabのPython実装では、2374の実際のバグのテストデータセットのベースラインメソッドで最大30%改善されている。
論文参考訳（メタデータ） (2021-05-26T18:41:05Z)
D2A: A Dataset Built for AI-Based Vulnerability Detection Methods Using Differential Analysis [55.15995704119158]
静的解析ツールによって報告されたラベル問題に対する差分解析に基づくアプローチであるD2Aを提案する。 D2Aを使用して大きなラベル付きデータセットを生成し、脆弱性識別のためのモデルをトレーニングします。
論文参考訳（メタデータ） (2021-02-16T07:46:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。