論文の概要: InEx-Bug: A Human Annotated Dataset of Intrinsic and Extrinsic Bugs in the NPM Ecosystem
- arxiv url: http://arxiv.org/abs/2602.13400v1
- Date: Fri, 13 Feb 2026 19:03:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-17 14:17:28.017338
- Title: InEx-Bug: A Human Annotated Dataset of Intrinsic and Extrinsic Bugs in the NPM Ecosystem
- Title(参考訳): InEx-Bug:NPM生態系における内因性および外因性バグのヒトアノテーションデータセット
- Authors: Tanner Wright, Adams Chen, Gema Rodríguez-Pérez,
- Abstract要約: InEx-Bugは103 NPMリポジトリから377のGitHubイシューを手動でアノテートしたデータセットである。
データセットには、メンテナの参加、コードの変更、再開パターンといった、時間的および行動的な豊富なメタデータが含まれている。
分析によると、Intrinsicのバグは(中期8.9対10.2日)より早く解決され、より頻繁に(92%対78%)、また、Extrinsicのバグに比べてコードの変更が頻繁に(57%対28%)必要である。
- 参考スコア(独自算出の注目度): 0.764671395172401
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding the causes of software defects is essential for reliable software maintenance and ecosystem stability. However, existing bug datasets do not distinguish between issues originating within a project from those caused by external dependencies or environmental factors. In this paper we present InEx-Bug, a manually annotated dataset of 377 GitHub issues from 103 NPM repositories, categorizing issues as Intrinsic (internal defect), Extrinsic (dependency/environment issue), Not-a-Bug, or Unknown. Beyond labels, the dataset includes rich temporal and behavioral metadata such as maintainer participation, code changes, and reopening patterns. Analyses show Intrinsic bugs resolve faster (median 8.9 vs 10.2 days), are close more often (92% vs 78%), and require code changes more frequently (57% vs 28%) compared to Extrinsic bugs. While Extrinsic bugs exhibit higher reopen rates (12% vs 4%) and delayed recurrence (median 157 vs 87 days). The dataset provides a foundation for further studying Intrinsic and Extrinsic defects in the NPM ecosystem.
- Abstract(参考訳): ソフトウェアの欠陥の原因を理解することは、信頼性の高いソフトウェアのメンテナンスとエコシステムの安定性に不可欠です。
しかし、既存のバグデータセットは、プロジェクト内で発生した問題と外部の依存関係や環境要因によって引き起こされた問題とを区別しない。
本稿では,103 NPMリポジトリから377のGitHubイシューを手動でアノテートしたデータセットであるInEx-Bugについて紹介する。
ラベル以外にも、メンテナの参加、コードの変更、再開パターンといった、時間的および行動的な豊富なメタデータが含まれている。
分析によると、Intrinsicのバグは(中期8.9対10.2日)より早く解決され、より頻繁に(92%対78%)、また、Extrinsicのバグに比べてコードの変更が頻繁に(57%対28%)必要である。
寄生虫は12%対4%で再開率が高く、再発が遅れている(中期157対87日)。
このデータセットは、NPMエコシステムにおける内在的および外在的欠陥をさらに研究するための基盤を提供する。
関連論文リスト
- Analyzing the Availability of E-Mail Addresses for PyPI Libraries [89.21869606965578]
81.6%のライブラリには、少なくとも1つの有効な電子メールアドレスが含まれており、PyPIが主要なソースとなっている。
698,000以上の無効なエントリを識別します。
論文 参考訳(メタデータ) (2026-01-20T14:54:58Z) - BugPilot: Complex Bug Generation for Efficient Learning of SWE Skills [59.003563837981886]
高品質なバグは、次世代の言語モデルベースソフトウェアエンジニアリング(SWE)エージェントをトレーニングする鍵となる。
難易度および多種多様なバグを合成する新しい方法を提案する。
論文 参考訳(メタデータ) (2025-10-22T17:58:56Z) - Empirical Analysis of Temporal and Spatial Fault Characteristics in Multi-Fault Bug Repositories [45.208325853591475]
16のオープンソースJavaおよびPythonプロジェクトに存在する断層の時間的・空間的特性を実証分析する。
以上の結果から,これらのソフトウェアシステムにおける多くの障害は長寿命であり,ソフトウェアバージョンの大部分に複数の障害が存在することが示唆された。
論文 参考訳(メタデータ) (2025-08-12T11:55:16Z) - BugsRepo: A Comprehensive Curated Dataset of Bug Reports, Comments and Contributors Information from Bugzilla [0.0]
font Familypplselectfont BugsRepoはMozillaプロジェクトから派生した多面的データセットである。
バグレポートのメタデータとコメントのデータセットと,修正あるいはクローズされたバグレポート119,585の詳細な記録が含まれている。
第2に、フォントファミリpplselectfont BugsRepoは、Mozillaコミュニティメンバー19,351名からなるコントリビュータ情報データセットを備えている。
第3に、データセットは10,351の構造化バグレポートサブセットを提供する。
論文 参考訳(メタデータ) (2025-04-26T05:24:21Z) - Improved IR-based Bug Localization with Intelligent Relevance Feedback [2.9312156642007294]
ソフトウェアバグは、開発とメンテナンスにおいて重大な課題となり、実践者は、バグを扱うのに約50%の時間を費やします。
既存の多くのテクニックでは、バグレポートとソースコードの間のテキストおよび意味的関連性を使用して、報告されたバグをローカライズするために、Information Retrieval (IR)を採用している。
本稿では,バグレポートとコードの関連性を評価することによって,コンテキストギャップに対処する新たなバグローカライゼーション手法であるBRaInを提案する。
論文 参考訳(メタデータ) (2025-01-17T20:29:38Z) - SBEST: Spectrum-Based Fault Localization Without Fault-Triggering Tests [17.90798133817018]
本研究は, 事故報告から得られたスタックトレースを, スペクトルベース断層定位における故障トリガー試験のプロキシとして用いる可能性について検討した。
本稿では,スタックトレース情報とテストカバレッジデータを統合する新たな手法であるSBESTを提案する。
論文 参考訳(メタデータ) (2024-05-01T15:15:52Z) - What Happens When We Fuzz? Investigating OSS-Fuzz Bug History [0.9772968596463595]
我々は2022年3月12日までにOSS-Fuzzが公表した44,102件の問題を分析した。
コードを含むバグの発生時期を推定するために,バグ貢献のコミットを特定し,検出から修正までのタイムラインを測定した。
論文 参考訳(メタデータ) (2023-05-19T05:15:36Z) - Using Developer Discussions to Guide Fixing Bugs in Software [51.00904399653609]
我々は,タスク実行前に利用可能であり,また自然発生しているバグレポートの議論を,開発者による追加情報の必要性を回避して利用することを提案する。
このような議論から派生したさまざまな自然言語コンテキストがバグ修正に役立ち、オラクルのバグ修正コミットに対応するコミットメッセージの使用よりもパフォーマンスの向上につながることを実証する。
論文 参考訳(メタデータ) (2022-11-11T16:37:33Z) - S-DABT: Schedule and Dependency-Aware Bug Triage in Open-Source Bug
Tracking Systems [0.0]
手動のバグ修正のスケジューリングは、時間がかかり、面倒で、エラーを起こしやすい。
そこで我々は,S-DABT(Schedule and Dependency-aware Bug Triage)を提案する。
論文 参考訳(メタデータ) (2022-04-12T17:36:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。