論文の概要: Orienting Novel 3D Objects Using Self-Supervised Learning of Rotation
Transforms
- arxiv url: http://arxiv.org/abs/2105.14246v1
- Date: Sat, 29 May 2021 08:22:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-05 19:20:59.350003
- Title: Orienting Novel 3D Objects Using Self-Supervised Learning of Rotation
Transforms
- Title(参考訳): 回転変換の自己教師付き学習による新しい3次元物体の配向
- Authors: Shivin Devgon, Jeffrey Ichnowski, Ashwin Balakrishna, Harry Zhang, Ken
Goldberg
- Abstract要約: オブジェクト指向は、多くのパッキングやアセンブリタスクの自動化において重要なコンポーネントである。
我々は、四元数でパラメータ化された3次元回転を推定するために、ディープニューラルネットワークを訓練する。
次に、2つの深度画像間の推定回転に基づいて、トレーニングされたネットワークを比例制御器で再配置する。
- 参考スコア(独自算出の注目度): 22.91890127146324
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Orienting objects is a critical component in the automation of many packing
and assembly tasks. We present an algorithm to orient novel objects given a
depth image of the object in its current and desired orientation. We formulate
a self-supervised objective for this problem and train a deep neural network to
estimate the 3D rotation as parameterized by a quaternion, between these
current and desired depth images. We then use the trained network in a
proportional controller to re-orient objects based on the estimated rotation
between the two depth images. Results suggest that in simulation we can rotate
unseen objects with unknown geometries by up to 30{\deg} with a median angle
error of 1.47{\deg} over 100 random initial/desired orientations each for 22
novel objects. Experiments on physical objects suggest that the controller can
achieve a median angle error of 4.2{\deg} over 10 random initial/desired
orientations each for 5 objects.
- Abstract(参考訳): オブジェクト指向は、多くのパッキングやアセンブリタスクの自動化において重要なコンポーネントである。
対象物の現在および所望の方向の深度画像が与えられた新規物体を指向するアルゴリズムを提案する。
本研究では,この問題に対する自己教師付き目標を定式化し,現在と所望の深さ画像の間で,四元数でパラメータ化された3次元回転を推定する深層ニューラルネットワークを訓練する。
次に、2つの深度画像間の推定回転に基づいて、トレーニングされたネットワークを比例制御器で再配置する。
その結果, シミュレーションでは, 22個の新規物体に対して, 1.47{\deg} の中央角誤差で, 最大30{\deg} の未発見物体を回転させることができることがわかった。
物理オブジェクトに関する実験により、コントローラは5つのオブジェクトに対して10個のランダムな初期/期待方向に対して4.2{\deg}の中央角誤差を達成できることが示唆された。
関連論文リスト
- OrientedFormer: An End-to-End Transformer-Based Oriented Object Detector in Remote Sensing Images [26.37802649901314]
リモートセンシング画像におけるオブジェクト指向物体検出は、複数方向のオブジェクトが分散しているため、難しい課題である。
これらの問題に対処する3つの専用モジュールからなるエンドツーエンドのトランスフォーマベース指向オブジェクト検出器を提案する。
従来のエンドツーエンド検出器と比較して、OrientedFormerはDIOR-RとDOTA-v1.0でそれぞれ1.16および1.21 AP$_50$を獲得し、トレーニングエポックを3$times$から1$times$に下げる。
論文 参考訳(メタデータ) (2024-09-29T10:36:33Z) - Uncertainty-aware Active Learning of NeRF-based Object Models for Robot Manipulators using Visual and Re-orientation Actions [8.059133373836913]
本稿では,ロボットが対象物の完全な3次元モデルを高速に学習し,不慣れな方向で操作できるアプローチを提案する。
我々は、部分的に構築されたNeRFモデルのアンサンブルを用いて、モデルの不確実性を定量化し、次の動作を決定する。
提案手法は, 部分的NeRFモデルにより対象物をいつ, どのように把握し, 再指向するかを判断し, 相互作用中に導入された不整合を補正するために, 対象のポーズを再推定する。
論文 参考訳(メタデータ) (2024-04-02T10:15:06Z) - LocaliseBot: Multi-view 3D object localisation with differentiable
rendering for robot grasping [9.690844449175948]
オブジェクトのポーズ推定に重点を置いています。
このアプローチは,オブジェクトの複数ビュー,それらの視点におけるカメラのパラメータ,オブジェクトの3次元CADモデルという3つの情報に依存している。
推定対象のポーズが99.65%の精度で真理把握候補を把握できることが示される。
論文 参考訳(メタデータ) (2023-11-14T14:27:53Z) - RelPose++: Recovering 6D Poses from Sparse-view Observations [66.6922660401558]
スパースビュー画像集合(2-8画像)から6次元カメラポーズを推定する作業に対処する。
我々は,画像対上の相対回転よりも分布を推定するネットワークを学習するRelPoseフレームワークを構築した。
最終システムは,先行技術よりも6次元ポーズ予測を大幅に改善する。
論文 参考訳(メタデータ) (2023-05-08T17:59:58Z) - Adaptive Rotated Convolution for Rotated Object Detection [96.94590550217718]
本稿では、回転物体検出問題に対処するために、適応回転変換(ARC)モジュールを提案する。
ARCモジュールでは、コンボリューションカーネルが適応的に回転し、異なる画像に異なる向きのオブジェクト特徴を抽出する。
提案手法は,81.77%mAPのDOTAデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-03-14T11:53:12Z) - Multi-Projection Fusion and Refinement Network for Salient Object
Detection in 360{\deg} Omnidirectional Image [141.10227079090419]
我々は,360度全方位画像中の有向物体を検出するために,MPFR-Net(Multi-Projection Fusion and Refinement Network)を提案する。
MPFR-Netは、等角射影像と対応する4つの立方体展開像を入力として使用する。
2つの全方位データセットの実験結果から,提案手法は定性的かつ定量的に,最先端の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2022-12-23T14:50:40Z) - RSDet++: Point-based Modulated Loss for More Accurate Rotated Object
Detection [53.57176614020894]
我々は、回転感度誤差(RSE)として、5パラメータと8パラメータの回転物体検出法の両方における損失の不連続性を分類する。
問題を軽減するために新しい変調された回転損失を導入し、回転感度検出ネットワーク(RSDet)を提案する。
10ピクセル未満のオブジェクトに対する本手法の精度をさらに向上するため,新しいRSDet++を提案する。
論文 参考訳(メタデータ) (2021-09-24T11:57:53Z) - Oriented Object Detection in Aerial Images Based on Area Ratio of
Parallelogram [0.0]
回転物体検出は空中画像において難しい課題である。
既存の回帰に基づく回転検出器は不連続境界の問題に悩まされる。
上記の課題に対処するためのシンプルな効果的な枠組みを提案する。
論文 参考訳(メタデータ) (2021-09-21T14:13:36Z) - Category-Level Metric Scale Object Shape and Pose Estimation [73.92460712829188]
本稿では,測度スケールの形状と1枚のRGB画像からのポーズを共同で推定するフレームワークを提案する。
カテゴリーレベルのオブジェクトのポーズと形状を評価するために,合成と実世界の両方のデータセット上で本手法の有効性を検証した。
論文 参考訳(メタデータ) (2021-09-01T12:16:46Z) - Robust 6D Object Pose Estimation by Learning RGB-D Features [59.580366107770764]
本稿では、この局所最適問題を解くために、回転回帰のための離散連続的な新しい定式化を提案する。
我々はSO(3)の回転アンカーを均一にサンプリングし、各アンカーから目標への制約付き偏差を予測し、最適な予測を選択するための不確実性スコアを出力する。
LINEMOD と YCB-Video の2つのベンチマーク実験により,提案手法が最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2020-02-29T06:24:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。