論文の概要: Bug-Report-Driven Fault Localization: Industrial Benchmarking and Lesson Learned at ABB Robotics
- arxiv url: http://arxiv.org/abs/2604.25700v1
- Date: Tue, 28 Apr 2026 14:27:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-29 16:49:17.90291
- Title: Bug-Report-Driven Fault Localization: Industrial Benchmarking and Lesson Learned at ABB Robotics
- Title(参考訳): バグレポート駆動型フォールトローカライゼーション - ABB Roboticsで学んだ産業ベンチマークと教訓
- Authors: Pernilla Hall, Anton Ununger, Riccardo Rubei, Alessio Bucaioni,
- Abstract要約: 本研究は, バグレポートの自然言語コンテンツのみを用いて, 人工知能がフォールトローカライゼーションを支援できるかどうかを考察する。
テキスト情報に頼ることで、我々のアプローチではソース実行トレースや静的解析アーティファクトにアクセスする必要がなくなる。
我々は,過去のバグレポートをテキストベースの人工知能支援断層の局所化に体系的に活用できることを実証した。
- 参考スコア(独自算出の注目度): 1.8479315677380452
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Software quality assurance remains a major challenge in industrial environments, where large-scale and long-lived systems inevitably accumulate defects. Identifying the location of a fault is often time-consuming and costly, particularly during maintenance phases when developers must rely primarily on textual bug reports rather than complete runtime or code-level context. In this study, we investigated if artificial intelligence can support fault localization using only the natural-language content of bug reports. By relying only on textual information, our approach requires no access to source code, execution traces, or static analysis artifacts, making it directly deployable within existing industrial maintenance workflows. We framed fault localization as a supervised text classification problem and evaluated three traditional machine learning models (Logistic Regression, Support Vector Machine, and Random Forest) and two fine-tuned transformer-based language models (RoBERTa-Base and Distil-RoBERTa). Our evaluation used proprietary data from ABB Robotics in Sweden, comprising five years of resolved industrial bug reports, each linked to its verified code fix. This setting allowed us to assess model effectiveness under realistic industrial constraints. Our results showed that traditional models using term frequency-inverse document features consistently outperformed the fine-tuned language models on this dataset, while data augmentation improved Random Forest performance. These findings challenge the assumption that transformer-based models universally outperform classical approaches in industrial contexts with domain-specific data. We demonstrated that historical bug reports can be systematically used for text-based, artificial intelligence-assisted fault localization, providing a scalable, low-cost, and empirically grounded complement to common debugging practices in industry.
- Abstract(参考訳): ソフトウェアの品質保証は、大規模で長期のシステムが必然的に欠陥を蓄積する産業環境において、依然として大きな課題である。
特にメンテナンスフェーズでは、開発者は、完全なランタイムやコードレベルのコンテキストではなく、主にテキストによるバグレポートに頼らなければならない。
本研究では,バグレポートの自然言語コンテンツのみを用いて,人工知能が障害局所化を支援することができるかどうかを検討した。
当社のアプローチは、テキスト情報のみに依存するため、ソースコードや実行トレース、静的解析アーティファクトへのアクセスを必要としないため、既存の産業保守ワークフローに直接デプロイすることが可能です。
教師付きテキスト分類問題としてフォールトローカライゼーションを行い,従来の3つの機械学習モデル(ロジスティック回帰,サポートベクトルマシン,ランダムフォレスト)と2つの微調整トランスフォーマベース言語モデル(RoBERTa-Base,Distil-RoBERTa)を評価した。
評価では、スウェーデンのABB Roboticsの独自データを用いて、5年間の工業バグ報告を行い、それぞれが検証済みのコード修正と関連付けられている。
この設定により、現実的な工業的制約の下でモデルの有効性を評価することができる。
以上の結果から,従来の周波数-逆文書機能を用いたモデルは,このデータセット上での微調整言語モデルよりも優れており,データ拡張によりランダムフォレストの性能は向上した。
これらの知見は、トランスフォーマーモデルが産業的文脈における古典的アプローチをドメイン固有データで普遍的に上回っているという仮定に挑戦する。
我々は、過去のバグレポートをテキストベースの人工知能支援の障害ローカライゼーションに体系的に利用し、スケーラブルで低コストで経験的に基盤付けられた業界における一般的なデバッグプラクティスの補完を提供することを示した。
関連論文リスト
- FORGE: Fine-grained Multimodal Evaluation for Manufacturing Scenarios [58.34124792457706]
製造業セクターは、単純な認識から自律的な実行に移行するために、MLLM(Multimodal Large Language Models)をますます採用している。
進捗は、データの不足と、既存のデータセットにおけるきめ細かいドメインセマンティクスの欠如によって妨げられている。
まず、実世界の2D画像と3Dポイントクラウドを組み合わせて、微粒なドメインセマンティクスを付加した高品質なデータセットを構築します。
次に, 3 つの製造課題,すなわち, 構造面検査, 組立検査, 組立検証の18の最先端MLLMを評価し, 大幅な性能差を明らかにした。
論文 参考訳(メタデータ) (2026-04-08T12:23:27Z) - Operationalization of Machine Learning with Serverless Architecture: An Industrial Operationalization of Machine Learning with Serverless Architecture: An Industrial Implementation for Harmonized System Code Prediction [0.0]
本稿では、データ取り込み、トレーニング、デプロイメント、監視、再トレーニングからイベント駆動パイプラインとマネージドサービスまで、完全なMLライフサイクルをオーケストレーションするサーバレスMLOpsフレームワークを提案する。
本研究では,グローバル取引において税関当局が使用する標準化コードに,短い非構造化製品記述をマッピングするコンプライアンスクリティカルなタスクである,調和システム(HS)コード予測の産業的実装を通じて,実践的適用性を実証する。
私たちのソリューションは、複数のディープラーニングアーキテクチャを埋め込んだカスタムテキストを使用します。
論文 参考訳(メタデータ) (2026-02-19T05:59:55Z) - Towards Comprehensive Benchmarking Infrastructure for LLMs In Software Engineering [19.584762693453893]
BEHELMは、ソフトウェア・シナリオ仕様とマルチメトリック評価を一体化する総合的なベンチマーク基盤である。
私たちのゴールは、ソフトウェア工学におけるLLMの公平で現実的で将来的な評価を可能にしながら、ベンチマークを構築するのに必要なオーバーヘッドを減らすことです。
論文 参考訳(メタデータ) (2026-01-28T21:55:10Z) - Adapting Language Balance in Code-Switching Speech [60.296574524609575]
大規模な基礎モデルは、コードスイッチングテストケースといまだに苦労しています。
我々は、世代間のコンテキストバイアスを軽減するために、微分可能なサロゲートを使用します。
アラビア語と中国語による実験では、モデルの切り替え位置をより正確に予測できることが示されている。
論文 参考訳(メタデータ) (2025-10-21T15:23:55Z) - PB-IAD: Utilizing multimodal foundation models for semantic industrial anomaly detection in dynamic manufacturing environments [0.0]
本稿では, PB-IAD (Prompt-based Industrial Anomaly Detection) を提案する。
データ分散性、アジャイル適応性、ドメインユーザ中心性という、動的運用環境の3つの重要な要件に対処する。
PatchCoreのような異常検出のための最先端のメソッドにベンチマークされる。
論文 参考訳(メタデータ) (2025-08-20T07:53:13Z) - Beyond Academic Benchmarks: Critical Analysis and Best Practices for Visual Industrial Anomaly Detection [40.174488947319645]
製造における視覚検査の自動化には,異常検出(AD)が不可欠である。
本稿では,(1)実世界のデータセットの重要性を実証し,実際の生産データを用いたベンチマークを確立すること,(2)実践的応用に有用な指標を用いて,既存のSOTA手法を公平に比較すること,(3)学術と産業のギャップを埋めるための重要な課題と新たな視点を論じることで,この分野の最近の進歩を包括的に分析すること,の3つの主要な貢献を行う。
論文 参考訳(メタデータ) (2025-03-30T14:11:46Z) - BigIssue: A Realistic Bug Localization Benchmark [89.8240118116093]
BigIssueは、現実的なバグローカライゼーションのためのベンチマークである。
実際のJavaバグと合成Javaバグの多様性を備えた一般的なベンチマークを提供する。
われわれは,バグローカライゼーションの最先端技術として,APRの性能向上と,現代の開発サイクルへの適用性の向上を期待している。
論文 参考訳(メタデータ) (2022-07-21T20:17:53Z) - Technical Language Supervision for Intelligent Fault Diagnosis in
Process Industry [1.8574771508622119]
プロセス産業では,人的専門家を支援する自動故障診断手法による状態監視システムにより,メンテナンス効率,プロセス持続可能性,職場の安全が向上する。
インテリジェント障害診断(IFD)における大きな課題は、モデルのトレーニングと検証に必要なラベルの正確なデータセットを開発することである。
産業データセットにおける技術的言語アノテーションとしての、障害特性と重大性差別に関するドメイン固有知識。
これにより、産業データに基づくIFDシステムのための技術言語監視(TLS)ソリューションを開発する機会が生まれる。
論文 参考訳(メタデータ) (2021-12-11T18:59:40Z) - Anomaly Detection Based on Selection and Weighting in Latent Space [73.01328671569759]
SWADと呼ばれる新しい選択および重み付けに基づく異常検出フレームワークを提案する。
ベンチマークと実世界のデータセットによる実験は、SWADの有効性と優位性を示している。
論文 参考訳(メタデータ) (2021-03-08T10:56:38Z) - Robust and Transferable Anomaly Detection in Log Data using Pre-Trained
Language Models [59.04636530383049]
クラウドのような大規模コンピュータシステムにおける異常や障害は、多くのユーザに影響を与える。
システム情報の主要なトラブルシューティングソースとして,ログデータの異常検出のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-23T09:17:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。