論文の概要: Foundation-Model-Based Agents in Industrial Automation: Purposes, Capabilities, and Open Challenges
- arxiv url: http://arxiv.org/abs/2605.02592v1
- Date: Mon, 04 May 2026 13:44:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.309737
- Title: Foundation-Model-Based Agents in Industrial Automation: Purposes, Capabilities, and Open Challenges
- Title(参考訳): 産業自動化における基礎モデルに基づくエージェント--目的,能力,オープンチャレンジ
- Authors: Vincent Henkel, Felix Gehlhoff, David Kube, Asaad Almutareb, Luis Cruz, Bernd Hellingrath, Philip Koch, Christoph Legat, Florian Mohr, Michael Oberle, Felix Ocker, Thorsten Schoeler, Mario Thron, Nico Andre Töpfer, Lucas Vogt, Yuchen Xia,
- Abstract要約: 本研究は, ファウンデーションモデルに基づくエージェントシステムが産業的文脈でいかに成熟しているかを考察する。
PRISMA 2020ガイドラインに従い、系統的な文献調査を行う。
その結果、報告されたシステムは、主にプロトタイプおよび早期検証段階にあることがわかった。
- 参考スコア(独自算出の注目度): 2.887900271135997
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Foundation models, particularly large language models, are increasingly integrated into agent architectures for industrial tasks such as decision support, process monitoring, and engineering automation. Yet evidence on their purposes, capabilities, and limitations remains fragmented across domains. This work examines how mature foundation-model-based agent systems are in industrial contexts, how their functional profile differs from conventional agent systems, and which limitations persist. A systematic literature survey following the PRISMA 2020 guideline is presented, screening 2,341 publications and synthesising a corpus of 88 publications through a structured coding scheme. The results show that reported systems are predominantly at prototype and early validation stages (75.0% at TRL 4-6), with deployment-oriented evidence remaining rare (9.1%). Operational goals are most frequently positioned in user assistance, monitoring, and process optimisation, while conventional production-control purposes such as planning and scheduling are less prominent. Compared with an established baseline for industrial agent systems, the capability profile reveals substantial gains in human interaction (+37%) and dealing with uncertainty (+35%), but a pronounced deficit in negotiation (-39%). The most widely reported limitations concern lack of generalization, hallucination and output instability, data scarcity, and inference latency. A working definition of foundation-model-based industrial agents is also proposed, bridging conventional agent theory, automation-engineering standards, and the foundation-model paradigm.
- Abstract(参考訳): 基礎モデル、特に大きな言語モデルは、意思決定支援、プロセス監視、エンジニアリング自動化といった産業タスクのためのエージェントアーキテクチャにますます統合されている。
しかし、それらの目的、能力、限界に関する証拠は、ドメイン間で断片化されている。
本研究は, 基礎モデルに基づくエージェントシステムが産業的文脈においてどのように成熟しているか, 機能的特徴が従来のエージェントシステムとどのように異なるのか, どの制限が持続するかを考察する。
PRISMA 2020のガイドラインに従う体系的な文献調査が行われ、2,341の出版物をスクリーニングし、構造化された符号化方式により88の出版物のコーパスを合成する。
その結果、報告されたシステムは、主にプロトタイプおよび早期検証段階(TRL 4-6で75.0%)にあり、展開指向の証拠は稀(9.1%)であることがわかった。
運用目標は、ユーザアシスト、監視、プロセス最適化において最も頻繁に位置づけられるが、計画やスケジューリングといった従来の生産制御の目的はあまり目立たない。
産業エージェントシステムの確立されたベースラインと比較すると、人的相互作用(+37%)と不確実性(+35%)が著しく向上するが、交渉の赤字(-39%)は顕著である。
最も広く報告されている制限は、一般化、幻覚と出力不安定、データの不足、推論遅延の欠如である。
基礎モデルに基づく産業エージェントの作業的定義も提案され、従来のエージェント理論、自動化工学標準、基礎モデルパラダイムがブリッジされている。
関連論文リスト
- FORGE: Fine-grained Multimodal Evaluation for Manufacturing Scenarios [58.34124792457706]
製造業セクターは、単純な認識から自律的な実行に移行するために、MLLM(Multimodal Large Language Models)をますます採用している。
進捗は、データの不足と、既存のデータセットにおけるきめ細かいドメインセマンティクスの欠如によって妨げられている。
まず、実世界の2D画像と3Dポイントクラウドを組み合わせて、微粒なドメインセマンティクスを付加した高品質なデータセットを構築します。
次に, 3 つの製造課題,すなわち, 構造面検査, 組立検査, 組立検証の18の最先端MLLMを評価し, 大幅な性能差を明らかにした。
論文 参考訳(メタデータ) (2026-04-08T12:23:27Z) - IACDM: Interactive Adversarial Convergence Development Methodology -- A Structured Framework for AI-Assisted Software Development [0.0]
この記事では、障害は構造的な原因 – 検証のギャップ – を共有している、と論じる。
我々は,外部検証エージェントによる検証ギャップに対処するために,構造化された8フェーズフレームワークであるIACDMを提案する。
論文 参考訳(メタデータ) (2026-03-31T09:48:09Z) - Agent Skill Framework: Perspectives on the Potential of Small Language Models in Industrial Environments [14.079091139464175]
この研究は、エージェントスキルプロセスの形式的な数学的定義を導入し、その後、様々な大きさの言語モデルの体系的な評価を行った。
その結果、小型モデルは信頼性の高いスキル選択に苦しむ一方で、中程度のサイズのSLM(約12B~30B)はエージェントスキルアプローチから大きく恩恵を受けることがわかった。
論文 参考訳(メタデータ) (2026-02-18T17:52:17Z) - Towards a Science of Scaling Agent Systems [79.64446272302287]
エージェント評価の定義を定式化し,エージェント量,コーディネーション構造,モデル,タスク特性の相互作用として,スケーリング法則を特徴付ける。
協調指標を用いて予測モデルを導出し,R2=0をクロスバリデーションし,未知のタスク領域の予測を可能にする。
ツールコーディネーショントレードオフ: 固定的な計算予算の下では, ツールヘビータスクはマルチエージェントのオーバーヘッドから不均衡に悩まされ, 2) 能力飽和: 調整が減少または負のリターンを, 単一エージェントのベースラインが45%を超えると達成できる。
論文 参考訳(メタデータ) (2025-12-09T06:52:21Z) - PublicAgent: Multi-Agent Design Principles From an LLM-Based Open Data Analysis Framework [5.863391019411233]
大規模言語モデルは個々のタスクを約束するが、エンドツーエンドの分析は基本的な制限を露呈する。
PublicAgentは、意図の明確化、データセット発見、分析、レポートのための特殊なエージェントへの分解を通じて、これらの制限に対処するマルチエージェントフレームワークである。
論文 参考訳(メタデータ) (2025-11-04T21:48:11Z) - A Survey of Data Agents: Emerging Paradigm or Overstated Hype? [66.1526688475023]
現在「データエージェント」は用語的曖昧さと不整合性に悩まされている。
この調査では、データエージェントのための最初の体系的な階層型分類を紹介した。
プロアクティブな生成データエージェントの出現を想定する、先見的なロードマップで締めくくります。
論文 参考訳(メタデータ) (2025-10-27T17:54:07Z) - Scaling Agents via Continual Pre-training [80.97989245493326]
我々は,エージェント連続事前学習(Agentic CPT)を深層研究エージェント訓練パイプラインに組み込んで,強力なエージェント基礎モデルを構築することを提案する。
我々は,AgentFounder-30Bを10のベンチマークで評価し,強力なツール使用能力を保ちながら最先端のパフォーマンスを実現した。
論文 参考訳(メタデータ) (2025-09-16T17:57:19Z) - PB-IAD: Utilizing multimodal foundation models for semantic industrial anomaly detection in dynamic manufacturing environments [0.0]
本稿では, PB-IAD (Prompt-based Industrial Anomaly Detection) を提案する。
データ分散性、アジャイル適応性、ドメインユーザ中心性という、動的運用環境の3つの重要な要件に対処する。
PatchCoreのような異常検出のための最先端のメソッドにベンチマークされる。
論文 参考訳(メタデータ) (2025-08-20T07:53:13Z) - OmniEAR: Benchmarking Agent Reasoning in Embodied Tasks [52.87238755666243]
OmniEARは,言語モデルが身体的相互作用やツールの使用,マルチエージェントの協調にどう影響するかを評価するためのフレームワークである。
我々は、家庭と工業領域にまたがる1500のシナリオにおける連続的な物理的特性と複雑な空間的関係をモデル化する。
我々の体系的な評価は、モデルが制約から推論しなければならない場合、厳しい性能劣化を示す。
論文 参考訳(メタデータ) (2025-08-07T17:54:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。