論文の概要: A Step Toward World Models: A Survey on Robotic Manipulation
- arxiv url: http://arxiv.org/abs/2511.02097v1
- Date: Fri, 31 Oct 2025 00:57:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 18:47:05.695302
- Title: A Step Toward World Models: A Survey on Robotic Manipulation
- Title(参考訳): 世界モデルへの一歩:ロボットマニピュレーションに関する調査
- Authors: Peng-Fei Zhang, Ying Cheng, Xiaofan Sun, Shijie Wang, Lei Zhu, Heng Tao Shen,
- Abstract要約: 本稿では,ロボット操作の手法のレビューを通じて,世界モデルのコア機能を示すアプローチについて考察する。
我々は、認識、予測、制御にまたがる役割を分析し、主要な課題と解決策を特定し、現実世界のモデルが持つべきコアコンポーネント、能力、機能を抽出する。
- 参考スコア(独自算出の注目度): 58.71002253909234
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Autonomous agents are increasingly expected to operate in complex, dynamic, and uncertain environments, performing tasks such as manipulation, navigation, and decision-making. Achieving these capabilities requires agents to understand the underlying mechanisms and dynamics of the world, moving beyond purely reactive control or simple replication of observed states. This motivates the development of world models as internal representations that encode environmental states, capture dynamics, and enable prediction, planning, and reasoning. Despite growing interest, the definition, scope, architectures, and essential capabilities of world models remain ambiguous. In this survey, rather than directly imposing a fixed definition and limiting our scope to methods explicitly labeled as world models, we examine approaches that exhibit the core capabilities of world models through a review of methods in robotic manipulation. We analyze their roles across perception, prediction, and control, identify key challenges and solutions, and distill the core components, capabilities, and functions that a real world model should possess. Building on this analysis, we aim to outline a roadmap for developing generalizable and practical world models for robotics.
- Abstract(参考訳): 自律エージェントは、複雑な、動的、不確実な環境で運用され、操作、ナビゲーション、意思決定などのタスクを実行することがますます期待されている。
これらの能力を達成するためには、エージェントは世界の基盤となるメカニズムやダイナミクスを理解し、純粋に反応性のある制御や観察された状態の単純な複製を超えていく必要がある。
これは、環境状態を符号化し、ダイナミクスを捉え、予測、計画、推論を可能にする内部表現として世界モデルの開発を動機付けている。
関心が高まっているにもかかわらず、世界モデルの定義、スコープ、アーキテクチャ、本質的な能力はあいまいである。
本調査では, 固定定義を直接適用し, 世界モデルとして明示的にラベル付けされた手法に範囲を限定するのではなく, ロボット操作における手法の見直しを通じて, 世界モデルの中核的能力を示すアプローチを検討する。
我々は、認識、予測、制御にまたがる役割を分析し、主要な課題と解決策を特定し、現実世界のモデルが持つべきコアコンポーネント、能力、機能を抽出する。
そこで本研究では,ロボット工学の汎用的,実用的な世界モデル開発のためのロードマップを概説する。
関連論文リスト
- Edge General Intelligence Through World Models and Agentic AI: Fundamentals, Solutions, and Challenges [87.02855999212817]
エッジ・ジェネラル・インテリジェンス(エッジ・ジェネラル・インテリジェンス、Edge General Intelligence、EGI)は、分散エージェントが自律的に知覚、理性、行動する能力を持つエッジ・コンピューティングの変革的進化を表す。
世界モデルは、将来の軌跡を予測するだけでなく、積極的に想像するプロアクティブな内部シミュレーターとして機能し、不確実性の理由を定め、予見で多段階のアクションを計画する。
この調査は、世界モデルがどのようにエージェント人工知能(AI)システムをエッジで強化できるかを包括的に分析することで、ギャップを埋める。
論文 参考訳(メタデータ) (2025-08-13T07:29:40Z) - AI in a vat: Fundamental limits of efficient world modelling for agent sandboxing and interpretability [84.52205243353761]
最近の研究は、世界モデルを使用して、AIエージェントをデプロイ前にテストできる制御された仮想環境を生成することを提案する。
評価対象のAIエージェントに非依存な世界モデルを簡単にする方法を検討する。
論文 参考訳(メタデータ) (2025-04-06T20:35:44Z) - Exploring the Interplay Between Video Generation and World Models in Autonomous Driving: A Survey [61.39993881402787]
世界モデルとビデオ生成は、自動運転の領域において重要な技術である。
本稿では,この2つの技術の関係について検討する。
映像生成モデルと世界モデルとの相互作用を分析することにより,重要な課題と今後の研究方向性を明らかにする。
論文 参考訳(メタデータ) (2024-11-05T08:58:35Z) - Is Sora a World Simulator? A Comprehensive Survey on General World Models and Beyond [90.63687738298125]
一般世界モデルは、人工知能(AGI)の実現への決定的な道のりを表現している
本調査では,世界モデルの最新動向を包括的に調査する。
我々は,世界モデルの課題と限界について検討し,今後の方向性について考察する。
論文 参考訳(メタデータ) (2024-05-06T14:37:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。