論文の概要: PushWorld: A benchmark for manipulation planning with tools and movable
obstacles
- arxiv url: http://arxiv.org/abs/2301.10289v1
- Date: Tue, 24 Jan 2023 20:20:17 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-26 16:34:27.845448
- Title: PushWorld: A benchmark for manipulation planning with tools and movable
obstacles
- Title(参考訳): PushWorld: ツールと可動障害による計画操作のためのベンチマーク
- Authors: Ken Kansky, Skanda Vaidyanath, Scott Swingle, Xinghua Lou, Miguel
Lazaro-Gredilla, Dileep George
- Abstract要約: PDDLおよびOpenAI Gym環境で200以上のPushWorldパズルのベンチマークを提供する。
このベンチマークを用いて,最先端の古典的計画と強化学習アルゴリズムを評価する。
最高のプランナーより35倍速いが、人間レベルのパフォーマンスには及ばない。
- 参考スコア(独自算出の注目度): 2.675382835523639
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While recent advances in artificial intelligence have achieved human-level
performance in environments like Starcraft and Go, many physical reasoning
tasks remain challenging for modern algorithms. To date, few algorithms have
been evaluated on physical tasks that involve manipulating objects when movable
obstacles are present and when tools must be used to perform the manipulation.
To promote research on such tasks, we introduce PushWorld, an environment with
simplistic physics that requires manipulation planning with both movable
obstacles and tools. We provide a benchmark of more than 200 PushWorld puzzles
in PDDL and in an OpenAI Gym environment. We evaluate state-of-the-art
classical planning and reinforcement learning algorithms on this benchmark, and
we find that these baseline results are below human-level performance. We then
provide a new classical planning heuristic that solves the most puzzles among
the baselines, and although it is 35 times faster than the best baseline
planner, it remains below human-level performance.
- Abstract(参考訳): 人工知能の最近の進歩は、StarcraftやGoのような環境で人間レベルのパフォーマンスを達成したが、現代のアルゴリズムでは、多くの物理的推論タスクが難しいままである。
これまでに、可動障害物が存在する場合や操作にツールを使用する場合など、物体を操作する物理的タスクにおいて、アルゴリズムが評価されている例はほとんどない。
このようなタスクの研究を促進するために,移動障害物とツールの操作計画を必要とする簡易な物理環境であるPushWorldを紹介した。
我々はpddlおよびopenaiジム環境で200以上のpushworldパズルのベンチマークを提供する。
本ベンチマークでは,最先端の古典的計画と強化学習アルゴリズムを評価し,その基礎的結果が人間レベルの性能以下であることが判明した。
そして、ベースライン間の最も多くのパズルを解決する、新しい古典的な計画ヒューリスティックを提供し、最高のベースラインプランナーよりも35倍高速ですが、人間レベルのパフォーマンスを保ちます。
関連論文リスト
- A Human-Centered Approach for Improving Supervised Learning [0.44378250612683995]
本稿では、パフォーマンス、時間、リソースの制約のバランスをとる方法を示す。
この研究のもう1つの目標は、人間中心のアプローチを用いて、エンサンブルスをより説明しやすく、理解しやすくすることである。
論文 参考訳(メタデータ) (2024-10-14T10:27:14Z) - Underwater Object Detection in the Era of Artificial Intelligence: Current, Challenge, and Future [119.88454942558485]
水中物体検出(UOD)は、水中の画像やビデオ中の物体を識別し、ローカライズすることを目的としている。
近年、人工知能(AI)に基づく手法、特に深層学習法は、UODにおいて有望な性能を示している。
論文 参考訳(メタデータ) (2024-10-08T00:25:33Z) - PhyPlan: Compositional and Adaptive Physical Task Reasoning with
Physics-Informed Skill Networks for Robot Manipulators [5.680235630702706]
物理推論の既存の方法は、実世界固有の複雑さと不確実性に苦しむデータハングリーである。
本稿では,物理インフォームドニューラルネットワーク(PINN)と修正モンテカルロ木探索(MCTS)を組み合わせた物理インフォームド計画フレームワークであるPhyPlanについて述べる。
論文 参考訳(メタデータ) (2024-02-24T08:51:03Z) - AI planning in the imagination: High-level planning on learned abstract
search spaces [68.75684174531962]
我々は,エージェントが訓練中に学習する抽象的な検索空間において,エージェントが計画することを可能にする,PiZeroと呼ばれる新しい手法を提案する。
本研究では,旅行セールスマン問題,ソコバン問題,2048年,施設立地問題,パックマン問題など,複数の分野で評価を行った。
論文 参考訳(メタデータ) (2023-08-16T22:47:16Z) - Efficient Learning of High Level Plans from Play [57.29562823883257]
本稿では,移動計画と深いRLを橋渡しするロボット学習のフレームワークであるELF-Pについて紹介する。
ELF-Pは、複数の現実的な操作タスクよりも、関連するベースラインよりもはるかに優れたサンプル効率を有することを示す。
論文 参考訳(メタデータ) (2023-03-16T20:09:47Z) - Hierarchical Imitation Learning with Vector Quantized Models [77.67190661002691]
我々は,専門家の軌跡におけるサブゴールの同定に強化学習を用いることを提案する。
同定されたサブゴールに対するベクトル量子化生成モデルを構築し,サブゴールレベルの計画を行う。
実験では、このアルゴリズムは複雑な長い水平決定問題の解法に優れ、最先端のアルゴリズムよりも優れている。
論文 参考訳(メタデータ) (2023-01-30T15:04:39Z) - Achieving mouse-level strategic evasion performance using real-time
computational planning [59.60094442546867]
計画とは、脳が想像し、予測可能な未来を成立させる特別な能力である。
我々は,動物の生態が空間計画の価値をどのように支配するかという研究に基づいて,より効率的な生物学的に着想を得た計画アルゴリズムであるTLPPOを開発した。
TLPPOを用いたリアルタイムエージェントの性能とライブマウスの性能を比較し,ロボット捕食者を避けることを課題とする。
論文 参考訳(メタデータ) (2022-11-04T18:34:36Z) - NeRP: Neural Rearrangement Planning for Unknown Objects [49.191284597526]
我々は,多段階のニューラルオブジェクト再構成計画のためのディープラーニングに基づくアプローチであるNeRP(Neural Rearrangement Planning)を提案する。
NeRPは、シミュレーションデータに基づいてトレーニングされ、現実世界に一般化される、これまで見たことのないオブジェクトで動作する。
論文 参考訳(メタデータ) (2021-06-02T17:56:27Z) - SoftGym: Benchmarking Deep Reinforcement Learning for Deformable Object
Manipulation [15.477950393687836]
我々は、変形可能なオブジェクトを操作するためのオープンソースのシミュレーションベンチマークであるSoftGymを紹介する。
我々はこれらの課題に対して様々なアルゴリズムを評価し、強化学習アルゴリズムの課題を強調した。
論文 参考訳(メタデータ) (2020-11-14T03:46:59Z) - Human-like Planning for Reaching in Cluttered Environments [11.55532557594561]
人間は、散らかった環境でオブジェクトに手を伸ばすのに驚くほど適しています。
我々は、人間の高度な操作計画を特定し、これらのスキルをロボットプランナーに転送する。
人間のようなプランナーは、最先端の標準軌道最適化アルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2020-02-28T14:28:50Z) - Leveraging Rationales to Improve Human Task Performance [15.785125079811902]
計算システムの性能が人間のユーザを上回ることを考えれば、人間のパフォーマンスを改善するために説明可能なAI能力を活用することができるだろうか?
本稿では,ユーティリティベースの計算手法の合理性を自動生成するRationale-Generating Algorithmを紹介する。
以上の結果から,本手法は人事性能の統計的改善につながる有理性を生み出すことが示唆された。
論文 参考訳(メタデータ) (2020-02-11T04:51:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。