論文の概要: Plan First, Judge Later, Run Better: A DMAIC-Inspired Agentic System for Industrial Anomaly Detection
- arxiv url: http://arxiv.org/abs/2606.04599v1
- Date: Wed, 03 Jun 2026 08:38:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 07:07:40.477223
- Title: Plan First, Judge Later, Run Better: A DMAIC-Inspired Agentic System for Industrial Anomaly Detection
- Title(参考訳): DMAICにインスパイアされた、産業用異常検知のためのエージェントシステム
- Authors: Yongzi Yu, Ao Li, Le Wang, Ziyue Li, Fugee Tsung, Yuxuan Liang, Man Li,
- Abstract要約: 本稿では, DMAIC-IAD (DMAIC-inspired Agentic Industrial Anomaly Detection) というマルチエージェントシステムを提案する。
DMAIC-IADは,適用対象のエージェントベースラインに対する平均検出性能を37.76%向上させる。
- 参考スコア(独自算出の注目度): 51.90293101535452
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language model (LLM) agents have shown promise in automating complex data-analysis workflows, but their reliable deployment remains challenging in high-stakes industrial scenarios. Industrial anomaly detection (IAD) is essential for manufacturing quality, safety, and efficiency, yet existing LLM-based IAD agents mainly focus on execution while under-exploiting strategy formulation. Consequently, they struggle to handle heterogeneous modalities in a unified and cost-effective manner. Inspired by the DMAIC quality-management framework, we propose DMAIC-IAD (DMAIC-inspired Agentic Industrial Anomaly Detection), a "Plan First, Judge Later" multi-agent system that aligns LLM agents with structured industrial problem-solving. DMAIC-IAD distills heterogeneous references into standardized operating procedures (SOPs) before strategy generation, and introduces a pre-trained execution-free judge model to rank candidate strategies without costly runtime trials. Extensive experiments across four modalities show that DMAIC-IAD improves average detection performance over applicable agentic baselines by 37.76%.
- Abstract(参考訳): 大規模言語モデル(LLM)エージェントは、複雑なデータ分析ワークフローを自動化することを約束している。
産業異常検出(IAD)は製造品質、安全性、効率に不可欠であるが、既存のLCMベースのIADエージェントは主に戦略定式化を過小評価しながら実行に焦点を当てている。
その結果、統一的で費用対効果のある方法で不均一なモダリティを扱うのに苦労する。
DMAICの品質管理フレームワークにインスパイアされたDMAIC-IAD (DMAIC-inspired Agentic Industrial Anomaly Detection, DMAIC-Inspired Agentic Industrial Anomaly Detection, DMAIC, Judge Later) は,LDMエージェントと構造化産業問題解決を連携させるマルチエージェントシステムである。
DMAIC-IADは、戦略生成に先立って、異種参照を標準化された操作手順(SOP)に蒸留し、事前訓練された実行自由判断モデルを導入し、コストのかかる実行試行なしに候補戦略をランク付けする。
4つのモードにわたる大規模な実験により、DMAIC-IADは適用可能なエージェントベースラインの平均検出性能を37.76%向上させることが示された。
関連論文リスト
- The Meta-Agent Challenge: Are Current Agents Capable of Autonomous Agent Development? [80.24951682268332]
本稿では,自律エージェント開発のためのフロンティアモデルのキャパシティをテストするための評価フレームワークであるMeta-Agent Challenge(MAC)を紹介する。
評価の整合性を確保するため、このフレームワークは報奨ハッキングに対する多層防御によって確保される。
メタエージェントは人間工学的な基本方針とほとんど一致せず、その一部はプロプライエタリなフロンティアモデルに支配されている。
論文 参考訳(メタデータ) (2026-06-03T04:58:17Z) - LiaisonAgent: An Multi-Agent Framework for Autonomous Risk Investigation and Governance [11.009578207207419]
LiaisonAgentは、技術的リスク検出とビジネスレベルのリスク管理のギャップを埋めるために設計された、自律的なマルチエージェントシステムである。
このシステムは、エンドツーエンドのツールコール成功率97.8%、リスク判定精度95%を達成する。
論文 参考訳(メタデータ) (2026-02-27T08:42:52Z) - ISD-Agent-Bench: A Comprehensive Benchmark for Evaluating LLM-based Instructional Design Agents [0.6181816879349377]
ISD-Agent-Benchは、Context Matrixフレームワークを介して生成される25,795のシナリオからなる包括的なベンチマークである。
我々は既存のIDDエージェントと、ADDIE、Dick & Carey、Rapid Prototyping ISDなどの古典的なIDD理論に基づく新しいエージェントを比較した。
1,017のテストシナリオの実験では、古典的なIDDフレームワークを現代的なReActスタイルの推論と統合することで、最高のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2026-02-11T08:11:31Z) - AEMA: Verifiable Evaluation Framework for Trustworthy and Controlled Agentic LLM Systems [0.28055179094637683]
AEMAは、人間の監視下で異種エージェントの多段階評価を計画し、実行し、集約する。
1つのLCM-as-a-Judgeと比較すると、AEMAはより安定性、人間のアライメント、そして説明責任のある自動化をサポートするトレース可能なレコードを実現している。
論文 参考訳(メタデータ) (2026-01-17T04:09:02Z) - R&D-Agent-Quant: A Multi-Agent Framework for Data-Centric Factors and Model Joint Optimization [23.21175715654347]
金融市場は、その高次元性、非定常性、持続的ボラティリティにより、資産返却予測に根本的な課題を提起する。
大規模言語モデルやマルチエージェントシステムの進歩にもかかわらず、現在の定量的研究パイプラインは、限定された自動化、弱い解釈可能性、ファクタマイニングやモデル革新といった重要なコンポーネント間の断片的な調整に悩まされている。
本稿では,量的ファイナンスのためのR&D-Agentを提案する。RD-Agent(Q)は,コーディネート・ファクターモデルによる量的戦略の完全な研究と開発を自動化するために設計された,最初のデータ中心型マルチエージェントフレームワークである。
論文 参考訳(メタデータ) (2025-05-21T06:20:56Z) - DS-Agent: Automated Data Science by Empowering Large Language Models with Case-Based Reasoning [56.887047551101574]
大規模言語モデル(LLM)エージェントとケースベース推論(CBR)を利用した新しいフレームワークであるDS-Agentを提案する。
開発段階では、DS-AgentはCBRフレームワークに従い、自動イテレーションパイプラインを構築する。
デプロイメントの段階では、DS-Agentは、シンプルなCBRパラダイムで低リソースのデプロイメントステージを実装し、LCMの基本能力に対する需要を大幅に削減する。
論文 参考訳(メタデータ) (2024-02-27T12:26:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。