論文の概要: An Empirical Study on Embodied Artificial Intelligence Robot (EAIR) Software Bugs
- arxiv url: http://arxiv.org/abs/2507.18267v1
- Date: Thu, 24 Jul 2025 10:11:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-25 15:10:43.411399
- Title: An Empirical Study on Embodied Artificial Intelligence Robot (EAIR) Software Bugs
- Title(参考訳): 人工人工知能ロボット(EAIR)ソフトウェアバグに関する実証的研究
- Authors: Zeqin Liao, Zibin Zheng, Peifan Reng, Henglong Liang, Zixu Gao, Zhixiang Chen, Wei Li, Yuhong Nan,
- Abstract要約: 80のEAIRシステムプロジェクトから収集した85のEAIRシステムバグについて,最初の系統的研究を行い,その症状,原因,モジュール分布について検討した。
我々の分析は、これらのバグを18の根本原因と15の異なる症状に分類し、13の病原体を同定する。
- 参考スコア(独自算出の注目度): 24.870244451120318
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Embodied Artificial Intelligence Robots (EAIR) is an emerging and rapidly evolving technological domain. Ensuring their program correctness is fundamental to their successful deployment. However, a general and in-depth understanding of EAIR system bugs remains lacking, which hinders the development of practices and techniques to tackle EAIR system bugs. To bridge this gap, we conducted the first systematic study of 885 EAIR system bugs collected from 80 EAIR system projects to investigate their symptoms, underlying causes, and module distribution. Our analysis takes considerable effort, which classifies these bugs into 18 underlying causes, 15 distinct symptoms, and identifies 13 affected modules. It reveals several new interesting findings and implications which help shed light on future research on tackling or repairing EAIR system bugs. First, among the 15 identified symptoms, our findings highlight 8 symptoms specific to EAIR systems, which is characterized by severe functional failures and potential physical hazards. Second, within the 18 underlying causes, we define 8 EAIR-specific causes, the majority of which stem from the intricate issues of AI- agent reasoning and decision making. Finally, to facilitate precise and efficient bug prediction, detection, and repair, we constructed a mapping between underlying causes and the modules in which they most frequently occur, which enables researchers to focus diagnostic efforts on the modules most susceptible to specific bug types.
- Abstract(参考訳): EAIR(Embodied Artificial Intelligence Robots)は、先進的かつ急速に進化する技術分野である。
プログラムの正確性を保証することは、デプロイメントの成功に不可欠です。
しかしながら、EAIRシステムバグに対する一般的な、そして深い理解は依然として欠如しており、EAIRシステムバグに取り組むためのプラクティスやテクニックの開発を妨げる。
このギャップを埋めるため,80のEAIRシステムプロジェクトから収集した885のEAIRシステムバグについて,その症状,根本原因,モジュール分布について調査した。
我々の分析は、これらのバグを18の根本原因と15の異なる症状に分類し、13の病原体を同定する。
EAIRシステムのバグへの対処や修復に関する今後の研究に光を当てるのに役立つ、いくつかの興味深い発見と意味を明らかにしている。
まず,15例中8例に,重度機能不全と潜在的な身体障害を主訴に当科を受診した。
第2に、AIエージェント推論と意思決定の複雑な問題に起因する8つのEAIR固有の原因を定義します。
最後に, バグ予測, 検出, 修復を容易にするため, 原因と発生頻度の高いモジュールをマッピングし, 特定のバグタイプに最も影響を受けやすいモジュールに, 診断作業を集中させることができるようにした。
関連論文リスト
- Hide and Seek with LLMs: An Adversarial Game for Sneaky Error Generation and Self-Improving Diagnosis [51.88592148135258]
本稿では,エラー生成と診断のための動的対向フレームワークであるHie and Seek Game (HSG)を提案する。
HSGには2つの敵対的役割がある: Sneakyは、微妙で偽りの推論エラーを発生させることで「隠す」ことと、それらを正確に検出するために「探す」診断である。
いくつかの数学推論タスクの実験では、HSGはエラー診断を著しく向上し、GPT-4oのようなベースラインよりも16.8%--31.4%高い精度を達成している。
論文 参考訳(メタデータ) (2025-08-05T12:45:21Z) - BugScope: Learn to Find Bugs Like Human [9.05553442116139]
BugScopeは、人間の監査人が代表例から新しいバグパターンを学習し、コード監査中にその知識を適用する方法をエミュレートする。
BugScopeが87.04%の精度を達成したことを示す。
Linuxカーネルを含む大規模なオープンソースシステムのさらなるテストにより、これまで不明だった141のバグが明らかになった。
論文 参考訳(メタデータ) (2025-07-21T14:34:01Z) - A Systematic Survey on Debugging Techniques for Machine Learning Systems [5.747738795689893]
機械学習(ML)ソフトウェアは、従来のソフトウェアと比較してユニークな課題を提起する。
MLシステムのテスト、診断、修復のための様々な方法が提案されている。
しかし、開発者のニーズを満たす重要な研究方向を示す全体像はまだ公開されていない。
論文 参考訳(メタデータ) (2025-03-05T03:57:20Z) - A Comprehensive Study of Bug-Fix Patterns in Autonomous Driving Systems [16.72158049599736]
自律運転システム(ADSe)におけるバグフィックスパターンの実証的研究について述べる。
我々は、ApolloとAutowareという2つの主要な自動運転プロジェクトのコミット履歴とバグレポートを、1,331のバグ修正から分析した。
本研究は,経路計画やデータフロー,構成管理など,いくつかの主要なバグフィックスパターンを明らかにする。
論文 参考訳(メタデータ) (2025-02-04T02:13:05Z) - Evaluation of OpenAI o1: Opportunities and Challenges of AGI [100.85218639544654]
o1-previewは目覚ましい能力を示し、しばしば人間レベルまたは優れたパフォーマンスを実現した。
このモデルは、様々な分野にわたる複雑な推論と知識の統合を必要とするタスクに優れていた。
総合的な結果は、人工知能への大きな進歩を示している。
論文 参考訳(メタデータ) (2024-09-27T06:57:00Z) - Visual Agents as Fast and Slow Thinkers [88.1404921693082]
本稿では、Fast and Slow Thinking機構を視覚エージェントに組み込んだFaSTを紹介する。
FaSTは、システム1/2モード間の動的選択にスイッチアダプタを使用する。
モデルの信頼性を調整し、新しいコンテキストデータを統合することで、不確実で目に見えないオブジェクトに取り組む。
論文 参考訳(メタデータ) (2024-08-16T17:44:02Z) - DISCOVERYWORLD: A Virtual Environment for Developing and Evaluating Automated Scientific Discovery Agents [49.74065769505137]
本研究では,新しい科学的発見の完全なサイクルを実行するエージェントの能力を開発し,ベンチマークする最初の仮想環境であるDiscoVERYWORLDを紹介する。
8つのトピックにまたがる120の異なる課題タスクが含まれており、3レベルの難易度といくつかのパラメトリックなバリエーションがある。
従来の環境においてよく機能する強力なベースラインエージェントが、ほとんどのdiscoVERYWORLDタスクに苦労していることがわかった。
論文 参考訳(メタデータ) (2024-06-10T20:08:44Z) - Progressing from Anomaly Detection to Automated Log Labeling and
Pioneering Root Cause Analysis [53.24804865821692]
本研究では、ログ異常の分類を導入し、ラベル付けの課題を軽減するために、自動ラベリングについて検討する。
この研究は、根本原因分析が異常検出に続く未来を予見し、異常の根本原因を解明する。
論文 参考訳(メタデータ) (2023-12-22T15:04:20Z) - Causal Disentanglement Hidden Markov Model for Fault Diagnosis [55.90917958154425]
本研究では, 軸受破壊機構の因果性を学ぶために, 因果解離隠れマルコフモデル (CDHM) を提案する。
具体的には、時系列データをフル活用し、振動信号を断層関連要因と断層関連要因に段階的に分解する。
アプリケーションの範囲を広げるために、学習された非絡み合った表現を他の作業環境に転送するために、教師なしのドメイン適応を採用する。
論文 参考訳(メタデータ) (2023-08-06T05:58:45Z) - Understanding the Issues, Their Causes and Solutions in Microservices
Systems: An Empirical Study [11.536360998310576]
技術的負債、継続的インテグレーション、例外処理、サービス実行、コミュニケーションは、システムにおいて最も重要な問題です。
特定された問題を修正するために適用可能な177種類のソリューションを見つけました。
論文 参考訳(メタデータ) (2023-02-03T18:08:03Z) - IM-IAD: Industrial Image Anomaly Detection Benchmark in Manufacturing [88.35145788575348]
画像異常検出(英: Image Anomaly Detection、IAD)は、産業用コンピュータビジョンの課題である。
統一IMベンチマークの欠如は、現実世界のアプリケーションにおけるIADメソッドの開発と利用を妨げる。
7つの主要なデータセットに19のアルゴリズムを含む包括的画像異常検出ベンチマーク(IM-IAD)を構築した。
論文 参考訳(メタデータ) (2023-01-31T01:24:45Z) - Adversarial Patch Generation for Automated Program Repair [0.0]
NEVERMOREは、バグと修正の敵対的な性質にインスパイアされた、新しい学習ベースのメカニズムである。
NEVERMOREはGenerative Adrial Networksアーキテクチャに基づいて構築されており、人為的な修正を忠実に模倣する修正を生成するために、歴史的なバグ修正を訓練している。
実世界の500のバグに対する実証的な評価は、NEVERMOREがバグ修正に有効であることを示し、調査対象のバグの21.2%が人間の修正にマッチする修復を生成する。
論文 参考訳(メタデータ) (2020-12-21T00:34:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。