論文の概要: IndustryAssetEQA: A Neurosymbolic Operational Intelligence System for Embodied Question Answering in Industrial Asset Maintenance
- arxiv url: http://arxiv.org/abs/2604.23446v1
- Date: Sat, 25 Apr 2026 21:11:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.352127
- Title: IndustryAssetEQA: A Neurosymbolic Operational Intelligence System for Embodied Question Answering in Industrial Asset Maintenance
- Title(参考訳): インダストリアルアセットEQA:産業アセットメンテナンスにおける身体的質問応答のためのニューロシンボリックオペレーショナルインテリジェンスシステム
- Authors: Chathurangi Shyalika, Dhaval Patel, Amit Sheth,
- Abstract要約: エピソードテレメトリ表現とフェールモード効果分析知識グラフ(FMEA-KG)を組み合わせたニューロシンボリックオペレーショナルインテリジェンスシステムであるIndustrialAssetEQAを提案する。
本研究では, 回転機械, ターボファンエンジン, 油圧システム, サイバー物理生産システムを含む4種類の産業資産について検討した。
IndustryAssetEQA は、構造的妥当性を最大 0.51 まで改善し、対実的精度を最大 0.47 まで改善し、説明的含意を 0.64 まで改善し、専門家評価の厳しい誇張を 28% から 2% に減らした。
- 参考スコア(独自算出の注目度): 2.4078554988694183
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Industrial maintenance environments increasingly rely on AI systems to assist operators in understanding asset behavior, diagnosing failures, and evaluating interventions. Although large language models (LLMs) enable fluent natural-language interaction, deployed maintenance assistants routinely produce generic explanations that are weakly grounded in telemetry, omit verifiable provenance, and offer no testable support for counterfactual or action-oriented reasoning that undermine trust in safety-critical settings. We present IndustryAssetEQA, a neurosymbolic operational intelligence system that combines episodic telemetry representations with a Failure Mode Effects Analysis Knowledge Graph (FMEA-KG) to enable Embodied Question Answering (EQA) over industrial assets. We evaluate on four datasets covering four industrial asset types, including rotating machinery, turbofan engines, hydraulic systems, and cyber-physical production systems. Compared to LLM-only baselines, IndustryAssetEQA improves structural validity by up to 0.51, counterfactual accuracy by up to 0.47, and explanation entailment by 0.64, while reducing severe expert-rated overclaims from 28% to 2% (approximately 93% reduction). Code, datasets, and the FMEA-KG are available at https://github.com/IBM/AssetOpsBench/tree/IndustryAssetEQA/IndustryAssetEQA.
- Abstract(参考訳): 産業保守環境は、オペレーターが資産の振る舞いを理解し、失敗を診断し、介入を評価するのを支援するためにAIシステムに依存している。
大規模言語モデル (LLMs) は、流線型自然言語の相互作用を可能にするが、デプロイされた保守アシスタントは、テレメトリに弱く根ざした一般的な説明を日常的に生成し、検証可能な証明を省略し、安全クリティカルな設定に対する信頼を損なう反事実的またはアクション指向の推論に対するテスト可能なサポートを提供しない。
本稿では,産業資産に対する身体的質問応答(EQA)を可能にするために,エピソードテレメトリ表現とFMEA-KG(Failure Mode Effects Analysis Knowledge Graph)を組み合わせたニューロシンボリック・オペレーショナルインテリジェンスシステムであるIndustrialAssetEQAを提案する。
本研究では, 回転機械, ターボファンエンジン, 油圧システム, サイバー物理生産システムを含む4種類の産業資産について検討した。
LLMのみのベースラインと比較して、IndustrialAssetEQAは構造的妥当性を最大0.51、反ファクト的精度を最大0.47、説明的含意を0.64改善し、専門家評価の過大評価を28%から2%に下げる(約93%)。
コード、データセット、FMEA-KGはhttps://github.com/IBM/AssetOpsBench/tree/IndustryAssetEQA/IndustryAssetEQAで入手できる。
関連論文リスト
- OccuBench: Evaluating AI Agents on Real-World Professional Tasks via Language Environment Simulation [57.505743202759646]
OccuBenchは10の業界カテゴリと65の専門ドメインにわたる100の現実のプロフェッショナルタスクシナリオをカバーするベンチマークである。
我々のマルチエージェント合成パイプラインは, 可溶性, 校正困難, 文書基底の多様性を保証した評価インスタンスを自動生成する。
論文 参考訳(メタデータ) (2026-04-13T00:27:32Z) - CLAIRE: Compressed Latent Autoencoder for Industrial Representation and Evaluation -- A Deep Learning Framework for Smart Manufacturing [51.56484100374058]
CLAIREは、教師なしの深層表現学習と、スマート製造システムにおけるインテリジェントな品質管理のための教師付き分類を統合したハイブリッドエンドツーエンド学習フレームワークである。
最適化されたディープオートエンコーダを使用して、生の入力をコンパクトな潜伏空間に変換し、不適切な特徴やノイズを抑えながら本質的なデータ構造を効果的にキャプチャする。
提案したフレームワークは、堅牢な障害検出のために、説明可能なAIと機能認識の正規化を統合する可能性を強調している。
論文 参考訳(メタデータ) (2026-03-06T15:11:58Z) - UAVBench: An Open Benchmark Dataset for Autonomous and Agentic AI UAV Systems via LLM-Generated Flight Scenarios [3.099103925863002]
UAVBenchは、大規模言語モデル(LLM)によって生成されたUAV飛行シナリオのオープンベンチマークベンチマークである。
UAVBench_MCQは,10の認知的・倫理的推論スタイルにまたがる5万の多重選択質問を含む推論指向の拡張である。
GPT-5, ChatGPT-4o, Gemini 2.5 Flash, DeepSeek V3, Q3wenwenB, ERNIE 4.5 300B を含む32 の最先端 LLM を評価し, 認識・政策推論において高い性能を示した。
論文 参考訳(メタデータ) (2025-11-14T12:51:48Z) - Knowledge Graph-Guided Multi-Agent Distillation for Reliable Industrial Question Answering with Datasets [1.0221654398821483]
産業質問応答システムは、汎用対話モデルよりも安全性と信頼性が要求される。
知識グラフ誘導型マルチエージェントシステム蒸留(KG-MASD)を提案する。
工業用QAデータセットの実験では、KG-MASDはベースラインの精度を2.4パーセントから20.1%改善している。
論文 参考訳(メタデータ) (2025-10-03T06:52:59Z) - A Comparative Study of Rule-Based and Data-Driven Approaches in Industrial Monitoring [2.320417845168326]
ルールベースのシステムは、高い解釈可能性、決定論的振る舞い、安定した環境における実装の容易さを提供する。
データ駆動システムは隠れた異常を検知し、予測保守と新しい条件への動的適応を可能にする。
本稿では、ルールベースの論理の透明性と機械学習の分析能力を組み合わせたハイブリッドソリューションを提案する。
論文 参考訳(メタデータ) (2025-09-19T10:31:59Z) - OmniEAR: Benchmarking Agent Reasoning in Embodied Tasks [52.87238755666243]
OmniEARは,言語モデルが身体的相互作用やツールの使用,マルチエージェントの協調にどう影響するかを評価するためのフレームワークである。
我々は、家庭と工業領域にまたがる1500のシナリオにおける連続的な物理的特性と複雑な空間的関係をモデル化する。
我々の体系的な評価は、モデルが制約から推論しなければならない場合、厳しい性能劣化を示す。
論文 参考訳(メタデータ) (2025-08-07T17:54:15Z) - CRMArena: Understanding the Capacity of LLM Agents to Perform Professional CRM Tasks in Realistic Environments [90.29937153770835]
CRMArenaは、プロフェッショナルな作業環境に根ざした現実的なタスクにおいて、AIエージェントを評価するために設計されたベンチマークである。
現状のLDMエージェントはReActプロンプトのタスクの40%以下で成功し,機能呼び出し能力でも55%以下であった。
この結果から,実環境に展開する関数呼び出しやルールフォローにおいて,エージェント機能の向上の必要性が示唆された。
論文 参考訳(メタデータ) (2024-11-04T17:30:51Z) - Sustainable Diffusion-based Incentive Mechanism for Generative AI-driven Digital Twins in Industrial Cyber-Physical Systems [65.22300383287904]
産業用サイバー物理システム(ICPS)は、現代の製造業と産業にとって不可欠なコンポーネントである。
製品ライフサイクルを通じてデータをデジタル化することにより、ICPSのDigital Twins(DT)は、現在の産業インフラからインテリジェントで適応的なインフラへの移行を可能にします。
GenAIはDTの構築と更新を推進し、予測精度を改善し、多様なスマート製造に備える。
論文 参考訳(メタデータ) (2024-08-02T10:47:10Z) - Enabling Efficient and Flexible Interpretability of Data-driven Anomaly Detection in Industrial Processes with AcME-AD [5.315104943095396]
本稿では,AcME-ADの産業応用について述べる。
AcME-ADはモデルに依存しない柔軟性を提供し、リアルタイム効率を優先する。
これらのテストは、産業環境におけるADと特徴に基づく根本原因分析に有用なツールとして、AcME-ADの可能性を実証している。
論文 参考訳(メタデータ) (2024-04-29T09:11:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。