論文の概要: Characterizing and Mitigating False-Positive Bug Reports in the Linux Kernel
- arxiv url: http://arxiv.org/abs/2605.07678v1
- Date: Fri, 08 May 2026 12:48:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:39.049837
- Title: Characterizing and Mitigating False-Positive Bug Reports in the Linux Kernel
- Title(参考訳): Linuxカーネルにおける偽陽性バグレポートの特性と緩和
- Authors: Jiashuo Tian, Dong Wang, Chen Yang, Haichi Wang, Zan Wang, Junjie Chen,
- Abstract要約: 本研究は,Linuxカーネルにおける偽陽性バグレポートの総合的研究である。
我々はBugzillaとSyzkallerから収集された1,509の真正のバグと497の偽陽性を含む2,006のバグレポートのデータセットを手作業で構築する。
検索強化世代(RAG)は、様々なプロンプト戦略の中で、91%のリコールと88%のF1スコアを達成した。
- 参考スコア(独自算出の注目度): 14.987479226824023
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: False-positive bug reports represent a significant yet underexplored challenge in the development and maintenance of the Linux kernel. They occur when correct system behavior is mistakenly flagged as a defect, consuming developer effort without leading to actual code improvements. Such reports can mislead developers, waste debugging resources, and delay the resolution of real bugs. In this paper, we present the first comprehensive empirical study of false-positive bug reports in the Linux kernel. We manually construct a dataset of 2,006 bug reports comprising 1,509 genuine bugs and 497 false positives collected from Bugzilla and Syzkaller. Our analysis indicates that false positives demand effort comparable to real bugs, often requiring extended discussions and non-trivial closure time. They occur in several components, especially File Systems and Drivers, mainly due to external dependencies and semantic misunderstandings. To address this challenge, we evaluate large language models (LLMs) for automated false-positive bug report mitigation. Among various prompting strategies, retrieval-augmented generation (RAG) performs best, achieving 91% recall and an F1 score of 88%. These findings highlight the non-negligible cost of false positive bug reports and show the promise of LLMs for more efficient false positive mitigation in the Linux kernel.
- Abstract(参考訳): 偽陽性のバグレポートは、Linuxカーネルの開発とメンテナンスにおいて、重要かつ未調査の課題であることを示している。
正確なシステム動作が欠陥として誤ってフラグ付けされ、実際のコード改善につながることなく、開発者の労力を消費する場合に発生する。
このようなレポートは開発者を誤解させ、デバッグリソースを無駄にし、実際のバグの解決を遅らせる可能性がある。
本稿では,Linuxカーネルにおける偽陽性バグレポートの総合的研究について紹介する。
我々はBugzillaとSyzkallerから収集された1,509の真正のバグと497の偽陽性を含む2,006のバグレポートのデータセットを手作業で構築する。
我々の分析によると、偽陽性は実際のバグに匹敵する努力を必要としており、しばしば議論の延長と非自明なクロージャ時間を必要としている。
これらは、主に外部の依存関係とセマンティックな誤解のために、いくつかのコンポーネント、特にファイルシステムとドライバで発生する。
この課題に対処するため、我々は、自動偽陽性バグレポート軽減のための大規模言語モデル(LLM)を評価した。
検索強化世代(RAG)は、様々なプロンプト戦略の中で、91%のリコールと88%のF1スコアを達成した。
これらの結果は、偽陽性バグレポートの無視できないコストを浮き彫りにし、Linuxカーネルのより効率的な偽陽性軽減のためのLCMの約束を示している。
関連論文リスト
- Automated Generation of High-Quality Bug Reports for Android Applications [15.222247601251015]
低品質のレポートは、開発者が欠陥を理解して再現する能力を妨げます。
この方法でバグレポートを生成する新しいアプローチであるBugScribeを構築し評価する。
我々は、BugScribeがオリジナルのレポートよりも高品質で精度の高いコンポーネントを生産していることを示す。
論文 参考訳(メタデータ) (2026-04-01T17:05:11Z) - Outrunning LLM Cutoffs: A Live Kernel Crash Resolution Benchmark for All [57.23434868678603]
Live-kBenchは、新たに発見されたカーネルバグのエージェントをスクラップし、評価するセルフ進化ベンチマークの評価フレームワークである。
kEnvは、カーネルのコンパイル、実行、フィードバックのためのエージェントに依存しないクラッシュ解決環境である。
kEnvを用いて3つの最先端エージェントをベンチマークし、最初の試行で74%のクラッシュを解決したことを示す。
論文 参考訳(メタデータ) (2026-02-02T19:06:15Z) - BugPilot: Complex Bug Generation for Efficient Learning of SWE Skills [59.003563837981886]
高品質なバグは、次世代の言語モデルベースソフトウェアエンジニアリング(SWE)エージェントをトレーニングする鍵となる。
難易度および多種多様なバグを合成する新しい方法を提案する。
論文 参考訳(メタデータ) (2025-10-22T17:58:56Z) - What Do They Fix? LLM-Aided Categorization of Security Patches for Critical Memory Bugs [46.325755802511026]
我々は、LLM(Large Language Model)と細調整された小言語モデルに基づく2つのアプローチを統合するデュアルメタルパイプラインであるLMを開発した。
LMは、OOBまたはUAFの脆弱性に対処する最近のLinuxカーネルのパッチ5,140のうち111つを、手作業による検証によって90の正の正が確認された。
論文 参考訳(メタデータ) (2025-09-26T18:06:36Z) - BugScope: Learn to Find Bugs Like Human [9.05553442116139]
BugScopeは、人間の監査人が代表例から新しいバグパターンを学習し、コード監査中にその知識を適用する方法をエミュレートする。
BugScopeが87.04%の精度を達成したことを示す。
Linuxカーネルを含む大規模なオープンソースシステムのさらなるテストにより、これまで不明だった141のバグが明らかになった。
論文 参考訳(メタデータ) (2025-07-21T14:34:01Z) - CrashFixer: A crash resolution agent for the Linux kernel [58.152358195983155]
この作業は、システムレベルのLinuxカーネルバグのベンチマークと、Linuxカーネルで実験を実行するプラットフォームを共有するkGymの上に構築されている。
CrashFixerはLinuxカーネルのバグに適応する最初のLCMベースのソフトウェア修復エージェントである。
論文 参考訳(メタデータ) (2025-04-29T04:18:51Z) - Auto-labelling of Bug Report using Natural Language Processing [0.0]
ルールとクエリベースのソリューションは、明確なランキングのない、潜在的な類似バグレポートの長いリストを推奨します。
本論文では,NLP手法の組み合わせによる解を提案する。
カスタムデータトランスフォーマー、ディープニューラルネットワーク、および非汎用機械学習メソッドを使用して、既存の同一バグレポートを検索する。
論文 参考訳(メタデータ) (2022-12-13T02:32:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。