論文の概要: iCORPP: Interleaved Commonsense Reasoning and Probabilistic Planning on
Robots
- arxiv url: http://arxiv.org/abs/2004.08672v2
- Date: Sun, 1 Oct 2023 00:56:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-03 21:49:24.769595
- Title: iCORPP: Interleaved Commonsense Reasoning and Probabilistic Planning on
Robots
- Title(参考訳): iCORPP:ロボットのインターリーブ・コモンセンス推論と確率計画
- Authors: Shiqi Zhang, Piyush Khandelwal, Peter Stone
- Abstract要約: 我々はiCORPPと呼ばれる新しいアルゴリズムを提案し、現在の世界状態を同時に推定し、世界ダイナミクスの推論を行い、タスク指向のコントローラを構築する。
結果は、競合するベースラインと比較して、スケーラビリティ、効率、適応性が大幅に改善されたことを示している。
- 参考スコア(独自算出の注目度): 46.13039152809055
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robot sequential decision-making in the real world is a challenge because it
requires the robots to simultaneously reason about the current world state and
dynamics, while planning actions to accomplish complex tasks. On the one hand,
declarative languages and reasoning algorithms well support representing and
reasoning with commonsense knowledge. But these algorithms are not good at
planning actions toward maximizing cumulative reward over a long, unspecified
horizon. On the other hand, probabilistic planning frameworks, such as Markov
decision processes (MDPs) and partially observable MDPs (POMDPs), well support
planning to achieve long-term goals under uncertainty. But they are
ill-equipped to represent or reason about knowledge that is not directly
related to actions.
In this article, we present a novel algorithm, called iCORPP, to
simultaneously estimate the current world state, reason about world dynamics,
and construct task-oriented controllers. In this process, robot decision-making
problems are decomposed into two interdependent (smaller) subproblems that
focus on reasoning to "understand the world" and planning to "achieve the goal"
respectively. Contextual knowledge is represented in the reasoning component,
which makes the planning component epistemic and enables active information
gathering. The developed algorithm has been implemented and evaluated both in
simulation and on real robots using everyday service tasks, such as indoor
navigation, dialog management, and object delivery. Results show significant
improvements in scalability, efficiency, and adaptiveness, compared to
competitive baselines including handcrafted action policies.
- Abstract(参考訳): ロボットは、複雑なタスクを遂行するために行動計画しながら、現在の世界の状況とダイナミクスを同時に推論する必要があるため、現実の世界でのシーケンシャルな意思決定は難しい。
一方、宣言型言語と推論アルゴリズムは、常識的知識による表現と推論をうまくサポートしている。
しかし、これらのアルゴリズムは、長期にわたる未定の地平線上で累積報酬を最大化するための行動計画には向いていない。
一方,マルコフ決定プロセス (MDPs) や部分観測可能なMDP (POMDPs) などの確率的計画フレームワークは,不確実性の下で長期的目標を達成するための計画を支援する。
しかし、それらは行動に直接関連しない知識を表現または推論する能力に欠ける。
本稿では,現在の世界状態を推定し,世界ダイナミクスを推論し,タスク指向コントローラを構築するための新しいアルゴリズム icorpp を提案する。
このプロセスでは、ロボットの意思決定問題は、2つの相互依存(より小さい)サブプロブレムに分解され、それぞれ「世界を理解」する推論と「目標を達成する」計画に焦点が当てられる。
コンテキスト知識は推論コンポーネントで表現され、計画コンポーネントが認識され、アクティブな情報収集を可能にする。
開発したアルゴリズムは,屋内ナビゲーションやダイアログ管理,オブジェクト配信といった日常的なサービスタスクを使用して,シミュレーションと実ロボットの両方で実装,評価されている。
その結果,手作りアクションポリシを含む競合ベースラインと比較して,スケーラビリティ,効率,適応性が著しく向上した。
関連論文リスト
- Learning Logic Specifications for Policy Guidance in POMDPs: an
Inductive Logic Programming Approach [57.788675205519986]
我々は任意の解法によって生成されるPOMDP実行から高品質なトレースを学習する。
我々は、データと時間効率のIndu Logic Programming(ILP)を利用して、解釈可能な信念に基づくポリシー仕様を生成する。
ASP(Answer Set Programming)で表現された学習は、ニューラルネットワークよりも優れた性能を示し、より少ない計算時間で最適な手作りタスクに類似していることを示す。
論文 参考訳(メタデータ) (2024-02-29T15:36:01Z) - Learning adaptive planning representations with natural language
guidance [90.24449752926866]
本稿では,タスク固有の計画表現を自動構築するフレームワークであるAdaについて述べる。
Adaは、プランナー互換の高レベルアクション抽象化と、特定の計画タスク領域に適応した低レベルコントローラのライブラリを対話的に学習する。
論文 参考訳(メタデータ) (2023-12-13T23:35:31Z) - CoPAL: Corrective Planning of Robot Actions with Large Language Models [8.209152055117283]
本稿では,認知レベル間のシームレスな相互作用を編成し,推論,計画,動作生成を包含するシステムアーキテクチャを提案する。
中心となるのは、生成した計画における物理的に基底的、論理的、セマンティックなエラーを処理する、新しいリプラン戦略である。
論文 参考訳(メタデータ) (2023-10-11T07:39:42Z) - AI planning in the imagination: High-level planning on learned abstract
search spaces [68.75684174531962]
我々は,エージェントが訓練中に学習する抽象的な検索空間において,エージェントが計画することを可能にする,PiZeroと呼ばれる新しい手法を提案する。
本研究では,旅行セールスマン問題,ソコバン問題,2048年,施設立地問題,パックマン問題など,複数の分野で評価を行った。
論文 参考訳(メタデータ) (2023-08-16T22:47:16Z) - Logic programming for deliberative robotic task planning [2.610470075814367]
本稿では,タスク計画問題への論理プログラミングの適用の最近の進歩について調査する。
我々は、ドメイン表現の表現性、計算効率、ソフトウェア実装に基づいて、異なるプランナーとその特定のロボットアプリケーションに対する適合性を解析する。
論文 参考訳(メタデータ) (2023-01-18T14:11:55Z) - Achieving mouse-level strategic evasion performance using real-time
computational planning [59.60094442546867]
計画とは、脳が想像し、予測可能な未来を成立させる特別な能力である。
我々は,動物の生態が空間計画の価値をどのように支配するかという研究に基づいて,より効率的な生物学的に着想を得た計画アルゴリズムであるTLPPOを開発した。
TLPPOを用いたリアルタイムエージェントの性能とライブマウスの性能を比較し,ロボット捕食者を避けることを課題とする。
論文 参考訳(メタデータ) (2022-11-04T18:34:36Z) - Robot Task Planning and Situation Handling in Open Worlds [17.812483295011212]
本稿では,オープンワールドなタスク計画と状況処理のための新しいアルゴリズム(COWP)を提案する。
COWPはタスク指向の常識でロボットの行動知識を動的に増強する。
当社のアプローチは,サービスタスクの成功率に関する文献から,競争ベースラインを著しく上回ります。
論文 参考訳(メタデータ) (2022-10-04T00:21:00Z) - SABER: Data-Driven Motion Planner for Autonomously Navigating
Heterogeneous Robots [112.2491765424719]
我々は、データ駆動型アプローチを用いて、異種ロボットチームをグローバルな目標に向けてナビゲートする、エンドツーエンドのオンラインモーションプランニングフレームワークを提案する。
モデル予測制御(SMPC)を用いて,ロボット力学を満たす制御入力を計算し,障害物回避時の不確実性を考慮した。
リカレントニューラルネットワークは、SMPC有限時間地平線解における将来の状態の不確かさを素早く推定するために用いられる。
ディープQ学習エージェントがハイレベルパスプランナーとして機能し、SMPCにロボットを望ましいグローバルな目標に向けて移動させる目標位置を提供する。
論文 参考訳(メタデータ) (2021-08-03T02:56:21Z) - Knowledge-Based Hierarchical POMDPs for Task Planning [0.34998703934432684]
タスクプランニングの主な目標は、エージェントを初期状態から目標状態へと移動させる一連のアクションを構築することです。
ロボット工学では、アクションは通常いくつかの可能な結果があり、センサーがエラーで測定を行う傾向があるため、これは特に困難です。
本稿では,情報のモジュール化と再利用を促進するロボットとその環境に関する知識を符号化する手法を提案する。
論文 参考訳(メタデータ) (2021-03-19T05:45:05Z) - Attention-Based Planning with Active Perception [21.35365462532568]
本稿では,マルコフ決定過程における注意の計算モデルと注意に基づく確率的計画法を提案する。
異なる注意モードを切り替えることで、ロボットはタスク関連情報を積極的に認識し、ほぼ最適のタスク性能を達成しつつ、情報取得と処理のコストを削減する。
論文 参考訳(メタデータ) (2020-11-30T19:07:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。