論文の概要: PFRL: Pose-Free Reinforcement Learning for 6D Pose Estimation
- arxiv url: http://arxiv.org/abs/2102.12096v1
- Date: Wed, 24 Feb 2021 06:49:41 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-25 13:31:41.871282
- Title: PFRL: Pose-Free Reinforcement Learning for 6D Pose Estimation
- Title(参考訳): PFRL:6次元ポース推定のためのポースフリー強化学習
- Authors: Jianzhun Shao, Yuhang Jiang, Gu Wang, Zhigang Li, Xiangyang Ji
- Abstract要約: マルコフ決定過程として6次元ポーズ補正を定式化する。
2次元画像アノテーションのみを弱い教師付き6次元ポーズ情報として強化学習アプローチを課す。
LINEMODおよびT-LESSデータセットの実験は、当社のPose-Freeアプローチが最先端のパフォーマンスを達成できることを示しています。
- 参考スコア(独自算出の注目度): 38.07629829885753
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 6D pose estimation from a single RGB image is a challenging and vital task in
computer vision. The current mainstream deep model methods resort to 2D images
annotated with real-world ground-truth 6D object poses, whose collection is
fairly cumbersome and expensive, even unavailable in many cases. In this work,
to get rid of the burden of 6D annotations, we formulate the 6D pose refinement
as a Markov Decision Process and impose on the reinforcement learning approach
with only 2D image annotations as weakly-supervised 6D pose information, via a
delicate reward definition and a composite reinforced optimization method for
efficient and effective policy training. Experiments on LINEMOD and T-LESS
datasets demonstrate that our Pose-Free approach is able to achieve
state-of-the-art performance compared with the methods without using real-world
ground-truth 6D pose labels.
- Abstract(参考訳): 単一のRGB画像からの6Dポーズ推定は、コンピュータビジョンにおいて困難で重要な課題である。
現在の主流のディープモデルメソッドは、2Dイメージに現実世界の地上トラス6Dオブジェクトポーズをアノテートし、そのコレクションはかなり面倒で高価で、多くの場合は利用できません。
本研究では,6Dアノテーションの負担を解消するため,マルコフ決定プロセスとして6Dポーズの改良を策定し,効率的かつ効果的なポリシトレーニングのための繊細な報酬定義と複合強化最適化法を用いて,弱監督6Dポーズ情報として2D画像アノテーションのみを用いた強化学習手法を提案する。
LINEMOD と T-LESS データセットの実験により,実世界の6D ポーズラベルを使わずに,我々の Pose-Free アプローチが最先端のパフォーマンスを達成できることが実証された。
関連論文リスト
- Pseudo Flow Consistency for Self-Supervised 6D Object Pose Estimation [14.469317161361202]
補助情報なしで純粋なRGB画像で訓練できる6次元オブジェクトポーズ推定法を提案する。
提案手法を3つの挑戦的データセット上で評価し,最先端の自己管理手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-08-19T13:52:18Z) - Imitrob: Imitation Learning Dataset for Training and Evaluating 6D
Object Pose Estimators [20.611000416051546]
本稿では,標準RGBカメラで捉えたタスクデモにおける手持ちツールの6次元ポーズ推定のためのトレーニングと評価のためのデータセットを提案する。
このデータセットには、9つの異なるツールと12の操作タスクのイメージシーケンスが含まれており、2つのカメラ視点、4人の被写体、そして左右手である。
論文 参考訳(メタデータ) (2022-09-16T14:43:46Z) - Knowledge Distillation for 6D Pose Estimation by Keypoint Distribution
Alignment [77.70208382044355]
6次元ポーズ推定のための最初の知識蒸留法を提案する。
我々は,コンパクトな学生ネットワークを観察し,正確な2次元キーポイント位置の予測に苦慮する。
いくつかのベンチマーク実験により, 蒸留法が得られた結果が得られた。
論文 参考訳(メタデータ) (2022-05-30T10:17:17Z) - Coupled Iterative Refinement for 6D Multi-Object Pose Estimation [64.7198752089041]
既知の3DオブジェクトのセットとRGBまたはRGB-Dの入力画像から、各オブジェクトの6Dポーズを検出して推定する。
我々のアプローチは、ポーズと対応を緊密に結合した方法で反復的に洗練し、アウトレーヤを動的に除去して精度を向上させる。
論文 参考訳(メタデータ) (2022-04-26T18:00:08Z) - OVE6D: Object Viewpoint Encoding for Depth-based 6D Object Pose
Estimation [12.773040823634908]
単一深度画像と対象物マスクからモデルに基づく6次元オブジェクトのポーズ推定を行うために,OVE6Dと呼ばれる普遍的なフレームワークを提案する。
われわれのモデルはShapeNetから生成された純粋に合成されたデータを用いて訓練されており、既存のほとんどの方法とは異なり、微調整なしで新しい現実世界のオブジェクトをうまく一般化する。
OVE6Dは、現実世界のトレーニングデータを用いて、個々のオブジェクトやデータセットに特化して訓練された、現代の深層学習に基づくポーズ推定手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-03-02T12:51:33Z) - SO-Pose: Exploiting Self-Occlusion for Direct 6D Pose Estimation [98.83762558394345]
SO-Poseは、オブジェクトの6自由度(6DoF)をすべて、単一のRGBイメージから散らばった環境でポーズさせるフレームワークである。
本稿では,3次元オブジェクトの2層表現を確立するために,自己閉塞に関する新たな推論を導入する。
対応性,自己閉塞性,6次元ポーズを整列する層間合成により,精度とロバスト性をさらに向上させることができる。
論文 参考訳(メタデータ) (2021-08-18T19:49:29Z) - Single Shot 6D Object Pose Estimation [11.37625512264302]
深度画像に基づく剛体物体の6次元オブジェクトポーズ推定のための新しい単一ショット手法を提案する。
完全な畳み込みニューラルネットワークを用い、3次元入力データを空間的に離散化し、ポーズ推定を回帰タスクとみなす。
GPU上の65fpsでは、Object Pose Network(OP-Net)は非常に高速で、エンドツーエンドに最適化され、画像内の複数のオブジェクトの6Dポーズを同時に推定する。
論文 参考訳(メタデータ) (2020-04-27T11:59:11Z) - Self6D: Self-Supervised Monocular 6D Object Pose Estimation [114.18496727590481]
自己教師付き学習による単眼6次元ポーズ推定のアイデアを提案する。
ニューラルレンダリングの最近の進歩を活用して、注釈のない実RGB-Dデータのモデルをさらに自己監督する。
論文 参考訳(メタデータ) (2020-04-14T13:16:36Z) - CPS++: Improving Class-level 6D Pose and Shape Estimation From Monocular
Images With Self-Supervised Learning [74.53664270194643]
現代のモノクロ6Dポーズ推定手法は、少数のオブジェクトインスタンスにしか対応できない。
そこで本研究では,計量形状検索と組み合わせて,クラスレベルのモノクル6次元ポーズ推定手法を提案する。
1枚のRGB画像から正確な6Dポーズとメートル法形状を抽出できることを実験的に実証した。
論文 参考訳(メタデータ) (2020-03-12T15:28:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。