論文の概要: ReorientBot: Learning Object Reorientation for Specific-Posed Placement
- arxiv url: http://arxiv.org/abs/2202.11092v1
- Date: Tue, 22 Feb 2022 18:46:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-23 15:05:53.112723
- Title: ReorientBot: Learning Object Reorientation for Specific-Posed Placement
- Title(参考訳): reorientbot: 特定の配置に対する学習オブジェクトのリオリエンテーション
- Authors: Kentaro Wada, Stephen James, Andrew J. Davison
- Abstract要約: 本稿では,1)RGB-Dカメラを用いたポーズ推定とボリューム再構成を併用した視覚的シーン理解システムReorientBotを提案する。
シミュレーションと実世界の両方でYCBオブジェクトを用いて評価し,全体の93%の成功,81%の成功率の改善,22%の実行時間の改善を実現した。
- 参考スコア(独自算出の注目度): 19.502587411252946
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robots need the capability of placing objects in arbitrary, specific poses to
rearrange the world and achieve various valuable tasks. Object reorientation
plays a crucial role in this as objects may not initially be oriented such that
the robot can grasp and then immediately place them in a specific goal pose. In
this work, we present a vision-based manipulation system, ReorientBot, which
consists of 1) visual scene understanding with pose estimation and volumetric
reconstruction using an onboard RGB-D camera; 2) learned waypoint selection for
successful and efficient motion generation for reorientation; 3) traditional
motion planning to generate a collision-free trajectory from the selected
waypoints. We evaluate our method using the YCB objects in both simulation and
the real world, achieving 93% overall success, 81% improvement in success rate,
and 22% improvement in execution time compared to a heuristic approach. We
demonstrate extended multi-object rearrangement showing the general capability
of the system.
- Abstract(参考訳): ロボットは、オブジェクトを任意の特定のポーズに配置し、世界を再構成し、さまざまな価値のあるタスクを達成する能力が必要です。
オブジェクトの向き付けは、当初、ロボットが把握し、すぐに特定のゴールポーズに配置できるように、オブジェクトを指向しないために重要な役割を果たす。
本研究では,視覚に基づく操作システムであるReorientBotについて述べる。
1)RGB-Dカメラを用いたポーズ推定とボリューム再構成による視覚的シーン理解
2) リオリエンテーションのための成功かつ効率的なモーション生成のための学習されたウェイポイント選択
3) 従来の運動計画では, 選択した方向から無衝突軌道を生成する。
シミュレーションと実世界の両方でYCBオブジェクトを用いて本手法の評価を行い, 総合的な成功率93%, 成功率81%, ヒューリスティックアプローチ22%, 実行時間22%を達成した。
システムの汎用性を示す拡張多目的再構成を示す。
関連論文リスト
- Stimulating Imagination: Towards General-purpose Object Rearrangement [2.0885207827639785]
汎用オブジェクト配置は、インテリジェントロボットの基本的な能力である。
我々はこの課題を達成するためにSPORTというフレームワークを提案する。
Sportは、物理的に現実的な結果を保証するために拡散に基づく3Dポーズ推定器を学習する。
シミュレーションと実世界の実験により、汎用オブジェクト再構成を実現するためのアプローチの可能性を示す。
論文 参考訳(メタデータ) (2024-08-03T03:53:05Z) - Simultaneous Map and Object Reconstruction [66.66729715211642]
本稿では,LiDARから大規模都市景観を動的に再現する手法を提案する。
我々は、最近の新しいビュー合成法から着想を得て、大域的な最適化として再構築問題を提起する。
連続動作の慎重なモデリングにより, 回転するLiDARセンサの回転シャッター効果を補うことができる。
論文 参考訳(メタデータ) (2024-06-19T23:53:31Z) - Semantic Object-level Modeling for Robust Visual Camera Relocalization [14.998133272060695]
本稿では,オブジェクトの楕円形表現のためのオブジェクトレベルの自動ボクセルモデリング手法を提案する。
これらのモジュールはすべて、視覚的SLAMシステムに完全に介在している。
論文 参考訳(メタデータ) (2024-02-10T13:39:44Z) - Localizing Active Objects from Egocentric Vision with Symbolic World
Knowledge [62.981429762309226]
タスクの指示をエゴセントリックな視点から積極的に下す能力は、AIエージェントがタスクを達成したり、人間をバーチャルに支援する上で不可欠である。
本稿では,現在進行中のオブジェクトの役割を学習し,指示から正確に抽出することで,アクティブなオブジェクトをローカライズするフレーズグラウンドモデルの性能を向上させることを提案する。
Ego4DおよびEpic-Kitchensデータセットに関するフレームワークの評価を行った。
論文 参考訳(メタデータ) (2023-10-23T16:14:05Z) - Navigating to Objects Specified by Images [86.9672766351891]
シミュレーションと実世界の両方でタスクを実行できるシステムを提案する。
我々のモジュラー手法は探索,ゴールインスタンスの再識別,ゴールローカライゼーション,ローカルナビゲーションのサブタスクを解決する。
HM3D InstanceImageNavベンチマークでは、このシステムはベースラインのエンドツーエンドのRLポリシー7xと最先端のImageNavモデル2.3xを上回っている。
論文 参考訳(メタデータ) (2023-04-03T17:58:00Z) - A Simple Approach for Visual Rearrangement: 3D Mapping and Semantic
Search [71.14527779661181]
視覚的な部屋の配置は、視覚的な入力のみに基づいてオブジェクトを並べ替えるエージェントの能力を評価する。
本稿では,(1)どのオブジェクトを並べ替える必要があるかを探索し,マッピングし,(2)タスクが完了するまで各オブジェクトを並べ替える,という方法を提案する。
論文 参考訳(メタデータ) (2022-06-21T02:33:57Z) - Object Manipulation via Visual Target Localization [64.05939029132394]
オブジェクトを操作するための訓練エージェントは、多くの課題を提起します。
本研究では,対象物体を探索する環境を探索し,位置が特定されると3次元座標を計算し,対象物が見えない場合でも3次元位置を推定する手法を提案する。
評価の結果,同じ感覚スイートにアクセス可能なモデルに比べて,成功率が3倍に向上したことが示された。
論文 参考訳(メタデータ) (2022-03-15T17:59:01Z) - A Critical Analysis of Image-based Camera Pose Estimation Techniques [18.566761146552537]
カメラのローカライゼーションは、自律運転、ロボットナビゲーション、拡張現実(AR)など、多くのコンピュータビジョン分野に恩恵をもたらす可能性がある
本調査では,まず,異なるサブタスクに応じて,カメラのローカライゼーションポーズの特定の適用領域と評価指標を紹介する。
論文 参考訳(メタデータ) (2022-01-15T09:57:45Z) - Locally Aware Piecewise Transformation Fields for 3D Human Mesh
Registration [67.69257782645789]
本論文では,3次元変換ベクトルを学習し,提案空間内の任意のクエリ点をリザーブ空間内の対応する位置にマップする部分変換場を提案する。
パラメトリックモデルにネットワークのポーズを合わせることで、特に極端なポーズにおいて、より優れた登録品質が得られることを示す。
論文 参考訳(メタデータ) (2021-04-16T15:16:09Z) - Distributed Reinforcement Learning of Targeted Grasping with Active
Vision for Mobile Manipulators [4.317864702902075]
移動体マニピュレータのための最初のRLベースのシステムを提案する。これは、(a)対象対象物に対する目標把握の一般化を実現し、(b)隠蔽対象物による乱れたシーンの複雑な把握戦略を学習し、(c)可動式手首カメラでアクティブなビジョンを実行し、オブジェクトの発見をより良くする。
シミュレーション環境でシステムのトレーニングと評価を行い,性能向上,動作解析,実環境への移動といった重要なコンポーネントを特定した。
論文 参考訳(メタデータ) (2020-07-16T02:47:48Z) - MoreFusion: Multi-object Reasoning for 6D Pose Estimation from
Volumetric Fusion [19.034317851914725]
本稿では,複数の既知の物体の接触と隠蔽の正確なポーズを,リアルタイムな多視点視から推定するシステムを提案する。
提案手法は,1枚のRGB-Dビューからの3Dオブジェクトのポーズ提案を行い,カメラが移動すると,複数のビューからのポーズ推定と非パラメトリック占有情報を蓄積する。
提案手法の精度とロバスト性を2つのオブジェクトデータセット(YCB-Video)で実験的に検証する。
論文 参考訳(メタデータ) (2020-04-09T02:29:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。