Fugu-MT 論文翻訳(概要): A Step Toward World Models: A Survey on Robotic Manipulation

論文の概要: A Step Toward World Models: A Survey on Robotic Manipulation

arxiv url: http://arxiv.org/abs/2511.02097v1
Date: Fri, 31 Oct 2025 00:57:24 GMT
ステータス: 翻訳完了
システム内更新日: 2025-11-05 18:47:05.695302
Title: A Step Toward World Models: A Survey on Robotic Manipulation
Title（参考訳）: 世界モデルへの一歩:ロボットマニピュレーションに関する調査
Authors: Peng-Fei Zhang, Ying Cheng, Xiaofan Sun, Shijie Wang, Lei Zhu, Heng Tao Shen,
Abstract要約: 本稿では,ロボット操作の手法のレビューを通じて,世界モデルのコア機能を示すアプローチについて考察する。我々は、認識、予測、制御にまたがる役割を分析し、主要な課題と解決策を特定し、現実世界のモデルが持つべきコアコンポーネント、能力、機能を抽出する。
参考スコア（独自算出の注目度）: 58.71002253909234
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Autonomous agents are increasingly expected to operate in complex, dynamic, and uncertain environments, performing tasks such as manipulation, navigation, and decision-making. Achieving these capabilities requires agents to understand the underlying mechanisms and dynamics of the world, moving beyond purely reactive control or simple replication of observed states. This motivates the development of world models as internal representations that encode environmental states, capture dynamics, and enable prediction, planning, and reasoning. Despite growing interest, the definition, scope, architectures, and essential capabilities of world models remain ambiguous. In this survey, rather than directly imposing a fixed definition and limiting our scope to methods explicitly labeled as world models, we examine approaches that exhibit the core capabilities of world models through a review of methods in robotic manipulation. We analyze their roles across perception, prediction, and control, identify key challenges and solutions, and distill the core components, capabilities, and functions that a real world model should possess. Building on this analysis, we aim to outline a roadmap for developing generalizable and practical world models for robotics.
Abstract（参考訳）: 自律エージェントは、複雑な、動的、不確実な環境で運用され、操作、ナビゲーション、意思決定などのタスクを実行することがますます期待されている。これらの能力を達成するためには、エージェントは世界の基盤となるメカニズムやダイナミクスを理解し、純粋に反応性のある制御や観察された状態の単純な複製を超えていく必要がある。これは、環境状態を符号化し、ダイナミクスを捉え、予測、計画、推論を可能にする内部表現として世界モデルの開発を動機付けている。関心が高まっているにもかかわらず、世界モデルの定義、スコープ、アーキテクチャ、本質的な能力はあいまいである。本調査では, 固定定義を直接適用し, 世界モデルとして明示的にラベル付けされた手法に範囲を限定するのではなく, ロボット操作における手法の見直しを通じて, 世界モデルの中核的能力を示すアプローチを検討する。我々は、認識、予測、制御にまたがる役割を分析し、主要な課題と解決策を特定し、現実世界のモデルが持つべきコアコンポーネント、能力、機能を抽出する。そこで本研究では,ロボット工学の汎用的,実用的な世界モデル開発のためのロードマップを概説する。

関連論文リスト

Research on World Models Is Not Merely Injecting World Knowledge into Specific Tasks [43.59401259468559]
我々は、ロバストな世界モデルは、能力の緩やかな集まりではなく、相互作用、知覚、象徴的推論、空間的表現を一体的に組み込んだ規範的な枠組みであるべきだと主張する。この研究は、未来の研究を世界のより一般的で堅牢で原則化されたモデルへと導くことを目的としている。
論文参考訳（メタデータ） (2026-02-02T04:42:44Z)
SmallWorlds: Assessing Dynamics Understanding of World Models in Isolated Environments [15.243547292947397]
我々はSmallWorld Benchmarkを紹介した。これは、分離された、正確に制御された動的条件下での世界モデル能力を評価するために設計されたテストベッドである。我々は、Recurrent State Space Model、Transformer、Diffusion Model、Neural ODEなどの代表的アーキテクチャ上で、完全に観測可能な状態空間で包括的な実験を行う。実験結果から, これらのモデルが環境構造を効果的に把握し, ロールアウトによる予測がいかに悪化するかが明らかになった。
論文参考訳（メタデータ） (2025-11-28T18:56:02Z)
Edge General Intelligence Through World Models and Agentic AI: Fundamentals, Solutions, and Challenges [87.02855999212817]
エッジ・ジェネラル・インテリジェンス(エッジ・ジェネラル・インテリジェンス、Edge General Intelligence、EGI)は、分散エージェントが自律的に知覚、理性、行動する能力を持つエッジ・コンピューティングの変革的進化を表す。世界モデルは、将来の軌跡を予測するだけでなく、積極的に想像するプロアクティブな内部シミュレーターとして機能し、不確実性の理由を定め、予見で多段階のアクションを計画する。この調査は、世界モデルがどのようにエージェント人工知能(AI)システムをエッジで強化できるかを包括的に分析することで、ギャップを埋める。
論文参考訳（メタデータ） (2025-08-13T07:29:40Z)
AI in a vat: Fundamental limits of efficient world modelling for agent sandboxing and interpretability [84.52205243353761]
最近の研究は、世界モデルを使用して、AIエージェントをデプロイ前にテストできる制御された仮想環境を生成することを提案する。評価対象のAIエージェントに非依存な世界モデルを簡単にする方法を検討する。
論文参考訳（メタデータ） (2025-04-06T20:35:44Z)
A Survey of World Models for Autonomous Driving [55.520179689933904]
自律運転の最近の進歩は、堅牢な世界モデリングの進歩によって推進されている。世界モデルは、マルチセンサーデータ、セマンティックキュー、時間ダイナミクスを統合する駆動環境の高忠実度表現を提供する。今後の研究は、自己指導型表現学習、マルチモーダル融合、高度なシミュレーションにおける重要な課題に対処する必要がある。
論文参考訳（メタデータ） (2025-01-20T04:00:02Z)
Exploring the Interplay Between Video Generation and World Models in Autonomous Driving: A Survey [61.39993881402787]
世界モデルとビデオ生成は、自動運転の領域において重要な技術である。本稿では,この2つの技術の関係について検討する。映像生成モデルと世界モデルとの相互作用を分析することにより,重要な課題と今後の研究方向性を明らかにする。
論文参考訳（メタデータ） (2024-11-05T08:58:35Z)
Is Sora a World Simulator? A Comprehensive Survey on General World Models and Beyond [90.63687738298125]
一般世界モデルは、人工知能(AGI)の実現への決定的な道のりを表現している本調査では,世界モデルの最新動向を包括的に調査する。我々は,世界モデルの課題と限界について検討し,今後の方向性について考察する。
論文参考訳（メタデータ） (2024-05-06T14:37:07Z)
A Survey on Robotics with Foundation Models: toward Embodied AI [30.999414445286757]
近年のコンピュータビジョン,自然言語処理,マルチモーダリティ学習の進歩は,基礎モデルが特定のタスクに対して超人的能力を持つことを示している。この調査は、ロボット工学の基礎モデルの包括的で最新の概要を提供し、自律的な操作に焦点を当て、高レベルの計画と低レベルの制御を包含することを目的としている。
論文参考訳（メタデータ） (2024-02-04T07:55:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。