Fugu-MT 論文翻訳(概要): iCORPP: Interleaved Commonsense Reasoning and Probabilistic Planning on Robots

論文の概要: iCORPP: Interleaved Commonsense Reasoning and Probabilistic Planning on Robots

arxiv url: http://arxiv.org/abs/2004.08672v2
Date: Sun, 1 Oct 2023 00:56:27 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-03 21:49:24.769595
Title: iCORPP: Interleaved Commonsense Reasoning and Probabilistic Planning on Robots
Title（参考訳）: iCORPP:ロボットのインターリーブ・コモンセンス推論と確率計画
Authors: Shiqi Zhang, Piyush Khandelwal, Peter Stone
Abstract要約: 我々はiCORPPと呼ばれる新しいアルゴリズムを提案し、現在の世界状態を同時に推定し、世界ダイナミクスの推論を行い、タスク指向のコントローラを構築する。結果は、競合するベースラインと比較して、スケーラビリティ、効率、適応性が大幅に改善されたことを示している。
参考スコア（独自算出の注目度）: 46.13039152809055
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Robot sequential decision-making in the real world is a challenge because it requires the robots to simultaneously reason about the current world state and dynamics, while planning actions to accomplish complex tasks. On the one hand, declarative languages and reasoning algorithms well support representing and reasoning with commonsense knowledge. But these algorithms are not good at planning actions toward maximizing cumulative reward over a long, unspecified horizon. On the other hand, probabilistic planning frameworks, such as Markov decision processes (MDPs) and partially observable MDPs (POMDPs), well support planning to achieve long-term goals under uncertainty. But they are ill-equipped to represent or reason about knowledge that is not directly related to actions. In this article, we present a novel algorithm, called iCORPP, to simultaneously estimate the current world state, reason about world dynamics, and construct task-oriented controllers. In this process, robot decision-making problems are decomposed into two interdependent (smaller) subproblems that focus on reasoning to "understand the world" and planning to "achieve the goal" respectively. Contextual knowledge is represented in the reasoning component, which makes the planning component epistemic and enables active information gathering. The developed algorithm has been implemented and evaluated both in simulation and on real robots using everyday service tasks, such as indoor navigation, dialog management, and object delivery. Results show significant improvements in scalability, efficiency, and adaptiveness, compared to competitive baselines including handcrafted action policies.
Abstract（参考訳）: ロボットは、複雑なタスクを遂行するために行動計画しながら、現在の世界の状況とダイナミクスを同時に推論する必要があるため、現実の世界でのシーケンシャルな意思決定は難しい。一方、宣言型言語と推論アルゴリズムは、常識的知識による表現と推論をうまくサポートしている。しかし、これらのアルゴリズムは、長期にわたる未定の地平線上で累積報酬を最大化するための行動計画には向いていない。一方,マルコフ決定プロセス (MDPs) や部分観測可能なMDP (POMDPs) などの確率的計画フレームワークは,不確実性の下で長期的目標を達成するための計画を支援する。しかし、それらは行動に直接関連しない知識を表現または推論する能力に欠ける。本稿では,現在の世界状態を推定し,世界ダイナミクスを推論し,タスク指向コントローラを構築するための新しいアルゴリズム icorpp を提案する。このプロセスでは、ロボットの意思決定問題は、2つの相互依存(より小さい)サブプロブレムに分解され、それぞれ「世界を理解」する推論と「目標を達成する」計画に焦点が当てられる。コンテキスト知識は推論コンポーネントで表現され、計画コンポーネントが認識され、アクティブな情報収集を可能にする。開発したアルゴリズムは,屋内ナビゲーションやダイアログ管理,オブジェクト配信といった日常的なサービスタスクを使用して,シミュレーションと実ロボットの両方で実装,評価されている。その結果,手作りアクションポリシを含む競合ベースラインと比較して,スケーラビリティ,効率,適応性が著しく向上した。

関連論文リスト

POrTAL: Plan-Orchestrated Tree Assembly for Lookahead [1.5636956410112013]
Plan-Orchestrated Tree Assembly for Lookahead (POrTAL)は軽量で確率的な計画アルゴリズムである。ステップ数でこれらのベースラインを上回ったソリューションに、POrTALが迅速に到達できることを示します。
論文参考訳（メタデータ） (2025-12-02T03:11:28Z)
Robobench: A Comprehensive Evaluation Benchmark for Multimodal Large Language Models as Embodied Brain [62.01012517796797]
動的で非構造的な環境で知覚、理性、行動できるロボットを構築することは、依然として中核的な課題である。システム2は高レベルの推論を処理し、システム1は低レベルの制御を実行する。本稿では,マルチモーダル大言語モデル(MLLM)を具体的脳として体系的に評価するベンチマークであるRoboBenchを紹介する。
論文参考訳（メタデータ） (2025-10-20T17:59:03Z)
Efficient Robotic Policy Learning via Latent Space Backward Planning [17.770562202624962]
現行のロボット計画手法は、しばしば、全画素の詳細を持つ多フレーム画像の予測に頼っている。本稿では,その課題を最終目標とするLBP(Latent Space Backward Planning scheme)を提案する。 LBPは既存の細粒度・前方計画法よりも優れた性能を示し,SOTA性能を実現している。
論文参考訳（メタデータ） (2025-05-11T06:13:51Z)
REMAC: Self-Reflective and Self-Evolving Multi-Agent Collaboration for Long-Horizon Robot Manipulation [57.628771707989166]
本稿では,ReMACと呼ばれる適応型マルチエージェント計画フレームワークを提案する。 ReMACには2つの重要なモジュールが組み込まれており、ループ内で事前条件と後条件チェックを実行し、進捗と計画の洗練を評価する。
論文参考訳（メタデータ） (2025-03-28T03:51:40Z)
Inductive Learning of Robot Task Knowledge from Raw Data and Online Expert Feedback [3.10979520014442]
ロボットの自律性の向上は、特に人間とロボットの相互作用シナリオにおいて、信頼と社会的受容の課題を引き起こす。これはロボット認知能力の解釈可能な実装を必要としており、おそらくはタスク仕様の定義のための論理としての形式的手法に基づいている。本稿では,タスク仕様を抽出するノイズの多い例から,帰納的論理プログラミングに基づくオフラインアルゴリズムを提案する。
論文参考訳（メタデータ） (2025-01-13T17:25:46Z)
Autonomous Behavior Planning For Humanoid Loco-manipulation Through Grounded Language Model [6.9268843428933025]
大規模言語モデル(LLM)は、意味情報の理解と処理のための強力な計画と推論能力を示している。本稿では,ロボットが与えられたテキストによる指示の下で,自律的に動作や低レベル実行を計画できる新しい言語モデルベースのフレームワークを提案する。
論文参考訳（メタデータ） (2024-08-15T17:33:32Z)
Learning Logic Specifications for Policy Guidance in POMDPs: an Inductive Logic Programming Approach [57.788675205519986]
我々は任意の解法によって生成されるPOMDP実行から高品質なトレースを学習する。我々は、データと時間効率のIndu Logic Programming(ILP)を利用して、解釈可能な信念に基づくポリシー仕様を生成する。 ASP(Answer Set Programming)で表現された学習は、ニューラルネットワークよりも優れた性能を示し、より少ない計算時間で最適な手作りタスクに類似していることを示す。
論文参考訳（メタデータ） (2024-02-29T15:36:01Z)
Learning adaptive planning representations with natural language guidance [90.24449752926866]
本稿では,タスク固有の計画表現を自動構築するフレームワークであるAdaについて述べる。 Adaは、プランナー互換の高レベルアクション抽象化と、特定の計画タスク領域に適応した低レベルコントローラのライブラリを対話的に学習する。
論文参考訳（メタデータ） (2023-12-13T23:35:31Z)
CoPAL: Corrective Planning of Robot Actions with Large Language Models [8.209152055117283]
本稿では,認知レベル間のシームレスな相互作用を編成し,推論,計画,動作生成を包含するシステムアーキテクチャを提案する。中心となるのは、生成した計画における物理的に基底的、論理的、セマンティックなエラーを処理する、新しいリプラン戦略である。
論文参考訳（メタデータ） (2023-10-11T07:39:42Z)
AI planning in the imagination: High-level planning on learned abstract search spaces [68.75684174531962]
我々は,エージェントが訓練中に学習する抽象的な検索空間において,エージェントが計画することを可能にする,PiZeroと呼ばれる新しい手法を提案する。本研究では,旅行セールスマン問題,ソコバン問題,2048年,施設立地問題,パックマン問題など,複数の分野で評価を行った。
論文参考訳（メタデータ） (2023-08-16T22:47:16Z)
Achieving mouse-level strategic evasion performance using real-time computational planning [59.60094442546867]
計画とは、脳が想像し、予測可能な未来を成立させる特別な能力である。我々は,動物の生態が空間計画の価値をどのように支配するかという研究に基づいて,より効率的な生物学的に着想を得た計画アルゴリズムであるTLPPOを開発した。 TLPPOを用いたリアルタイムエージェントの性能とライブマウスの性能を比較し,ロボット捕食者を避けることを課題とする。
論文参考訳（メタデータ） (2022-11-04T18:34:36Z)
Robot Task Planning and Situation Handling in Open Worlds [10.077350377962482]
本稿では,オープンワールドなタスク計画と状況処理のための新しいアルゴリズムを提案する。 COWPはタスク指向の常識でロボットの行動知識を動的に増強する。このバージョンはAutonomous Robotsに掲載されている。
論文参考訳（メタデータ） (2022-10-04T00:21:00Z)
SABER: Data-Driven Motion Planner for Autonomously Navigating Heterogeneous Robots [112.2491765424719]
我々は、データ駆動型アプローチを用いて、異種ロボットチームをグローバルな目標に向けてナビゲートする、エンドツーエンドのオンラインモーションプランニングフレームワークを提案する。モデル予測制御(SMPC)を用いて,ロボット力学を満たす制御入力を計算し,障害物回避時の不確実性を考慮した。リカレントニューラルネットワークは、SMPC有限時間地平線解における将来の状態の不確かさを素早く推定するために用いられる。ディープQ学習エージェントがハイレベルパスプランナーとして機能し、SMPCにロボットを望ましいグローバルな目標に向けて移動させる目標位置を提供する。
論文参考訳（メタデータ） (2021-08-03T02:56:21Z)
Knowledge-Based Hierarchical POMDPs for Task Planning [0.34998703934432684]
タスクプランニングの主な目標は、エージェントを初期状態から目標状態へと移動させる一連のアクションを構築することです。ロボット工学では、アクションは通常いくつかの可能な結果があり、センサーがエラーで測定を行う傾向があるため、これは特に困難です。本稿では,情報のモジュール化と再利用を促進するロボットとその環境に関する知識を符号化する手法を提案する。
論文参考訳（メタデータ） (2021-03-19T05:45:05Z)
Attention-Based Planning with Active Perception [21.35365462532568]
本稿では,マルコフ決定過程における注意の計算モデルと注意に基づく確率的計画法を提案する。異なる注意モードを切り替えることで、ロボットはタスク関連情報を積極的に認識し、ほぼ最適のタスク性能を達成しつつ、情報取得と処理のコストを削減する。
論文参考訳（メタデータ） (2020-11-30T19:07:28Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。