論文の概要: Robotic Foundation Models for Industrial Control: A Comprehensive Survey and Readiness Assessment Framework
- arxiv url: http://arxiv.org/abs/2603.06749v1
- Date: Fri, 06 Mar 2026 11:23:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:13.020067
- Title: Robotic Foundation Models for Industrial Control: A Comprehensive Survey and Readiness Assessment Framework
- Title(参考訳): 産業制御のためのロボット基礎モデル:包括的調査と準備性評価フレームワーク
- Authors: David Kube, Simon Hadwiger, Tobias Meisen,
- Abstract要約: 本調査では,RCMのランドスケープと解析について,具体的な意味から概説する。
我々は、産業展開の視点を11の相互依存的な意味に合成する。
我々は,48,276の基準値による324個の操作可能なRAMを評価した。
- 参考スコア(独自算出の注目度): 8.463273762997398
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Robotic foundation models (RFMs) are emerging as a promising route towards flexible, instruction- and demonstration-driven robot control, however, a critical investigation of their industrial applicability is still lacking. This survey gives an extensive overview over the RFM-landscape and analyses, driven by concrete implications, how industrial domains and use cases shape the requirements of RFMs, with particular focus on collaborative robot platforms, heterogeneous sensing and actuation, edge-computing constraints, and safety-critical operation. We synthesise industrial deployment perspectives into eleven interdependent implications and operationalise them into an assessment framework comprising a catalogue of 149 concrete criteria, spanning both model capabilities and ecosystem requirements. Using this framework, we evaluate 324 manipulation-capable RFMs via 48,276 criterion-level decisions obtained via a conservative LLM-assisted evaluation pipeline, validated against expert judgements. The results indicate that industrial maturity is limited and uneven: even the highest-rated models satisfy only a fraction of criteria and typically exhibit narrow implication-specific peaks rather than integrated coverage. We conclude that progress towards industry-grade RFMs depends less on isolated benchmark successes than on systematic incorporation of safety, real-time feasibility, robust perception, interaction, and cost-effective system integration into auditable deployment stacks.
- Abstract(参考訳): ロボットファウンデーションモデル(RFM)は、柔軟な、命令駆動、そしてデモ駆動のロボット制御への有望なルートとして浮上しているが、その産業応用性に関する批判的な研究はいまだに欠けている。
本調査は,RCMのランドスケープと分析,具体的な意味,産業領域とユースケースがRAMの要件をどのように形成するか,特に協調ロボットプラットフォーム,異種感触,エッジコンピューティングの制約,安全クリティカルな操作に焦点をあてて概観する。
我々は、産業展開の視点を11の相互依存的含意に合成し、149の具体的な基準のカタログからなるアセスメントフレームワークに運用し、モデル能力とエコシステム要求の両方にまたがる。
この枠組みを用いて,保守的なLCM支援評価パイプラインを用いて得られた48,276の基準値による324個の操作可能なRAMを評価し,専門家の判断に対して検証した。
その結果, 産業の成熟度は限定的かつ不均一であることが示唆された。最高評価モデルでさえ, 基準のごく一部しか満たされておらず, 一般的には, 統合されたカバレッジではなく, 限定的な含意的なピークを示す。
業界グレードのRAMへの進歩は、安全性、リアルタイム実現性、堅牢な認識、インタラクション、コスト効率の高いシステム統合を監査可能なデプロイメントスタックに体系的に組み込むことよりも、独立したベンチマークの成功にかかっていると結論付けている。
関連論文リスト
- Benchmarking Agents in Insurance Underwriting Environments [0.9728664856449597]
既存のベンチマークは、コードのようなオープンドメインを過度に強調し、狭い精度のメトリクスを使い、真の複雑さを欠いている。
我々は、ドメインエキスパートとの密接なコラボレーションのために設計された、専門家優先のマルチターン保険書記ベンチマークUNDERWRITEを提案する。
論文 参考訳(メタデータ) (2026-01-31T02:12:11Z) - A Comprehensive Evaluation of LLM Reasoning: From Single-Model to Multi-Agent Paradigms [20.241519889633285]
大規模言語モデル(LLM)は、推論パラダイムが重要な役割を果たす推論システムとして、ますます多くデプロイされている。
我々は、直接単モデル生成、CoT拡張単モデル推論、代表MASなど、推論パラダイムを包括的かつ統一的に評価する。
MIMeBenchは、2つの基本的な未探索セマンティック機能をターゲットにした新しいオープンエンドベンチマークである。
論文 参考訳(メタデータ) (2026-01-19T17:23:45Z) - Can AI Generate more Comprehensive Test Scenarios? Review on Automated Driving Systems Test Scenario Generation Methods [19.39586739934126]
本総説では,20152025年の調査を通じて,31の初等研究と10のサーベイを体系的に分析した。
従来のアプローチは専門家の知識、オントロジー、自然主義的な運転または事故データに依存しているが、最近の開発では、多種多様な安全クリティカルなシナリオを合成するために、大きな言語モデル、敵ネットワーク、拡散モデル、強化学習フレームワークなどの生成モデルを利用している。
論文 参考訳(メタデータ) (2025-12-17T13:14:15Z) - How Good are Foundation Models in Step-by-Step Embodied Reasoning? [79.15268080287505]
身体的エージェントは、安全で空間的に整合性があり、文脈に根ざした決定をしなければならない。
大規模マルチモーダルモデルの最近の進歩は、視覚的理解と言語生成において有望な能力を示している。
私たちのベンチマークには、10のタスクと8のエボディメントにまたがる詳細なステップバイステップ推論を備えた1.1k以上のサンプルが含まれています。
論文 参考訳(メタデータ) (2025-09-18T17:56:30Z) - PB-IAD: Utilizing multimodal foundation models for semantic industrial anomaly detection in dynamic manufacturing environments [0.0]
本稿では, PB-IAD (Prompt-based Industrial Anomaly Detection) を提案する。
データ分散性、アジャイル適応性、ドメインユーザ中心性という、動的運用環境の3つの重要な要件に対処する。
PatchCoreのような異常検出のための最先端のメソッドにベンチマークされる。
論文 参考訳(メタデータ) (2025-08-20T07:53:13Z) - IndustryEQA: Pushing the Frontiers of Embodied Question Answering in Industrial Scenarios [46.421243185923814]
既存のEmbodied Question Answering (EQA)ベンチマークは主に家庭環境に焦点を当てている。
安全クリティカルな倉庫シナリオにおけるエンボディエージェント能力を評価するための最初のベンチマークであるIndustrialEQAを紹介する。
このベンチマークには、機器の安全性、人間の安全性、オブジェクト認識、属性認識、時間的理解、空間的理解の6つのカテゴリをカバーする豊富なアノテーションが含まれている。
論文 参考訳(メタデータ) (2025-05-27T02:36:17Z) - RAGEval: Scenario Specific RAG Evaluation Dataset Generation Framework [66.93260816493553]
本稿では,様々なシナリオにまたがってRAGシステムを評価するためのフレームワークであるRAGvalを紹介する。
事実の正確性に焦点をあてて,完全性,幻覚,不適切性の3つの新しい指標を提案する。
実験結果から, RAGEvalは, 生成した試料の明瞭度, 安全性, 適合性, 豊かさにおいて, ゼロショット法とワンショット法より優れていた。
論文 参考訳(メタデータ) (2024-08-02T13:35:11Z) - When Demonstrations Meet Generative World Models: A Maximum Likelihood
Framework for Offline Inverse Reinforcement Learning [62.00672284480755]
本稿では, 専門家エージェントから, 一定の有限個の実演において観測された動作を過小評価する報酬と環境力学の構造を復元することを目的とする。
タスクを実行するための正確な専門知識モデルは、臨床的意思決定や自律運転のような安全に敏感な応用に応用できる。
論文 参考訳(メタデータ) (2023-02-15T04:14:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。