論文の概要: Human-Machine Co-Boosted Bug Report Identification with Mutualistic Neural Active Learning
- arxiv url: http://arxiv.org/abs/2604.18862v1
- Date: Mon, 20 Apr 2026 21:37:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.508387
- Title: Human-Machine Co-Boosted Bug Report Identification with Mutualistic Neural Active Learning
- Title(参考訳): 相互学習型ニューラルアクティブ学習を用いたヒト・マシーン共生バグの報告
- Authors: Guoming Long, Shihai Wang, Hui Fang, Tao Chen,
- Abstract要約: Mutualistic Neural Active Learning (MNAL)は、GitHubリポジトリからバグレポートを自動化し、より効果的に識別するように設計されている。
MNALは、さまざまなプロジェクトにわたるレポートを学習し、一般化するニューラルネットワークモデルと、アクティブラーニングと組み合わせて、ニューラルアクティブラーニングを形成する。
我々は、SOTAアプローチ、ベースライン、および異なる変種に対する大規模なデータセットを用いてMNALを評価する。
- 参考スコア(独自算出の注目度): 7.1030108053685135
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Bug reports, encompassing a wide range of bug types, are crucial for maintaining software quality. However, the increasing complexity and volume of bug reports pose a significant challenge in sole manual identification and assignment to the appropriate teams for resolution, as dealing with all the reports is time-consuming and resource-intensive. In this paper, we introduce a cross-project framework, dubbed Mutualistic Neural Active Learning (MNAL), designed for automated and more effective identification of bug reports from GitHub repositories boosted by human-machine collaboration. MNAL utilizes a neural language model that learns and generalizes reports across different projects, coupled with active learning to form neural active learning. A distinctive feature of MNAL is the purposely crafted mutualistic relation between the machine learners (neural language model) and human labelers (developers) when enriching the knowledge learned. That is, the most informative human-labeled reports and their corresponding pseudo-labeled ones are used to update the model while those reports that need to be labeled by developers are more readable and identifiable, thereby enhancing the human-machine teaming therein. We evaluate MNAL using a large scale dataset against the SOTA approaches, baselines, and different variants. The results indicate that MNAL achieves up to 95.8% and 196.0% effort reduction in terms of readability and identifiability during human labeling, respectively, while resulting in a better performance in bug report identification. Additionally, our MNAL is model-agnostic since it is capable of improving the model performance with various underlying neural language models. To further verify the efficacy of our approach, we conducted a qualitative case study involving 10 human participants, who rate MNAL as being more effective while saving more time and monetary resources.
- Abstract(参考訳): 幅広いバグタイプを含むバグレポートは、ソフトウェア品質の維持に不可欠である。
しかしながら、複雑さとバグレポートの量の増加は、すべてのレポートを扱うのに時間がかかり、リソースが集中しているため、解決のために適切なチームに対して手動で識別と割り当てを行うことにおいて、大きな課題を引き起こします。
本稿では,MNAL(Mutualistic Neural Active Learning)と呼ばれるクロスプロジェクトフレームワークについて紹介する。
MNALは、さまざまなプロジェクトにわたるレポートを学習し、一般化するニューラルネットワークモデルと、アクティブラーニングと組み合わせて、ニューラルアクティブラーニングを形成する。
MNALの特徴は、学習した知識を豊かにする際、機械学習者(神経言語モデル)と人間ラベル者(開発者)との間の目的的に作られた相互主義的関係である。
つまり、最も情報に富んだ人間ラベル付レポートとそれに対応する擬似ラベル付レポートを使用してモデルを更新する一方で、開発者がラベル付けする必要があるレポートはより読みやすく識別可能であり、それによって人間と機械の連携が強化される。
我々は、SOTAアプローチ、ベースライン、および異なる変種に対する大規模なデータセットを用いてMNALを評価する。
その結果、MNALの可読性と識別性は95.8%と196.0%に向上し、バグレポートの識別性能は向上した。
さらに、MNALは、様々な基盤となるニューラルネットワークモデルでモデル性能を向上させることができるため、モデルに依存しない。
提案手法の有効性をさらに検証するため,MNALを有効と評価し,時間と金銭的資源を節約する10人の被験者を対象に,定性的なケーススタディを行った。
関連論文リスト
- Automated interictal epileptic spike detection from simple and noisy annotations in MEG data [0.4737912324017801]
脳磁図(MEG)はてんかん原性領域の局在を知らせる有効な検査である。
現在の自動化手法は臨床には適さない。
本研究では,MEG記録における間欠的スパイクの検出にディープラーニングモデルを用いることを実証する。
論文 参考訳(メタデータ) (2025-10-24T16:02:05Z) - Probing Multimodal Fusion in the Brain: The Dominance of Audiovisual Streams in Naturalistic Encoding [1.2233362977312945]
我々は,最先端視覚 (X-CLIP) と聴覚 (Whisper) 特徴抽出器を用いた脳符号化モデルを開発した。
分布内(ID)データと分布外(OOD)データの両方を厳格に評価する。
論文 参考訳(メタデータ) (2025-07-25T08:12:26Z) - DKE-Research at SemEval-2024 Task 2: Incorporating Data Augmentation with Generative Models and Biomedical Knowledge to Enhance Inference Robustness [27.14794371879541]
本稿では,生物医学的自然言語推論のためのモデルロバスト性向上のための新しいデータ拡張手法を提案する。
意味摂動とドメイン固有の語彙置換によって合成例を生成することにより,多様性の向上とショートカット学習の削減を図る。
マルチタスク学習とDeBERTaアーキテクチャを組み合わせることで,NLI4CT 2024ベンチマークで大幅な性能向上を実現した。
論文 参考訳(メタデータ) (2024-04-14T10:02:47Z) - Leveraging Pretrained Representations with Task-related Keywords for
Alzheimer's Disease Detection [69.53626024091076]
アルツハイマー病(AD)は高齢者に特に顕著である。
事前学習モデルの最近の進歩は、AD検出モデリングを低レベル特徴から高レベル表現にシフトさせる動機付けとなっている。
本稿では,高レベルの音響・言語的特徴から,より優れたAD関連手がかりを抽出する,いくつかの効率的な手法を提案する。
論文 参考訳(メタデータ) (2023-03-14T16:03:28Z) - Discover, Explanation, Improvement: An Automatic Slice Detection
Framework for Natural Language Processing [72.14557106085284]
スライス検出モデル(SDM)は、データポイントの低パフォーマンスなグループを自動的に識別する。
本稿では,NLPタスクの分類のための "Discover, Explain, improve (DEIM)" というベンチマークを提案する。
評価の結果,Edisaは情報的セマンティックな特徴を持つ誤り発生データポイントを正確に選択できることがわかった。
論文 参考訳(メタデータ) (2022-11-08T19:00:00Z) - An Empirical Investigation of Commonsense Self-Supervision with
Knowledge Graphs [67.23285413610243]
大規模知識グラフから抽出した情報に基づく自己監督は、言語モデルの一般化を改善することが示されている。
本研究では,言語モデルに適用可能な合成データを生成するための知識サンプリング戦略とサイズの影響について検討する。
論文 参考訳(メタデータ) (2022-05-21T19:49:04Z) - Distantly-Supervised Named Entity Recognition with Noise-Robust Learning
and Language Model Augmented Self-Training [66.80558875393565]
遠距離ラベル付きデータのみを用いて、名前付きエンティティ認識(NER)モデルを訓練する際の課題について検討する。
本稿では,新しい損失関数と雑音ラベル除去ステップからなるノイズロスバスト学習手法を提案する。
提案手法は,既存の遠隔教師付きNERモデルよりも優れた性能を実現する。
論文 参考訳(メタデータ) (2021-09-10T17:19:56Z) - Multimodal Gait Recognition for Neurodegenerative Diseases [38.06704951209703]
3つの神経変性疾患の歩容差を学習するための新しいハイブリッドモデルを提案する。
新しい相関メモリニューラルネットワークアーキテクチャは、時間的特徴を抽出するために設計されている。
いくつかの最先端技術と比較して,提案手法はより正確な分類結果を示す。
論文 参考訳(メタデータ) (2021-01-07T10:17:11Z) - Muti-view Mouse Social Behaviour Recognition with Deep Graphical Model [124.26611454540813]
マウスの社会的行動分析は神経変性疾患の治療効果を評価する貴重なツールである。
マウスの社会行動の豊かな記述を創出する可能性から、ネズミの観察にマルチビュービデオ記録を使用することは、ますます注目を集めている。
本稿では,ビュー固有のサブ構造とビュー共有サブ構造を協調的に学習する,新しい多視点潜在意識・動的識別モデルを提案する。
論文 参考訳(メタデータ) (2020-11-04T18:09:58Z) - Modeling Shared Responses in Neuroimaging Studies through MultiView ICA [94.31804763196116]
被験者の大規模なコホートを含むグループ研究は、脳機能組織に関する一般的な結論を引き出す上で重要である。
グループ研究のための新しい多視点独立成分分析モデルを提案し、各被験者のデータを共有独立音源と雑音の線形結合としてモデル化する。
まず、fMRIデータを用いて、被験者間の共通音源の同定における感度の向上を示す。
論文 参考訳(メタデータ) (2020-06-11T17:29:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。