論文の概要: ACR-Pose: Adversarial Canonical Representation Reconstruction Network
for Category Level 6D Object Pose Estimation
- arxiv url: http://arxiv.org/abs/2111.10524v1
- Date: Sat, 20 Nov 2021 06:15:30 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-23 14:13:48.380086
- Title: ACR-Pose: Adversarial Canonical Representation Reconstruction Network
for Category Level 6D Object Pose Estimation
- Title(参考訳): ACR-Pose:カテゴリーレベル6Dオブジェクトポス推定のための逆正準表現再構成ネットワーク
- Authors: Zhaoxin Fan, Zhengbo Song, Jian Xu, Zhicheng Wang, Kejian Wu, Hongyan
Liu, and Jun He
- Abstract要約: 本稿では,ACR-Pose という新しい適応表現再構成ネットワークを提案する。
ACR-Poseはリコンストラクタとディスクリミネータで構成される。
判別器は、レコンストラクタを誘導して現実的な標準表現を生成する。
- 参考スコア(独自算出の注目度): 5.194583138800689
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, category-level 6D object pose estimation has achieved significant
improvements with the development of reconstructing canonical 3D
representations. However, the reconstruction quality of existing methods is
still far from excellent. In this paper, we propose a novel Adversarial
Canonical Representation Reconstruction Network named ACR-Pose. ACR-Pose
consists of a Reconstructor and a Discriminator. The Reconstructor is primarily
composed of two novel sub-modules: Pose-Irrelevant Module (PIM) and Relational
Reconstruction Module (RRM). PIM tends to learn canonical-related features to
make the Reconstructor insensitive to rotation and translation, while RRM
explores essential relational information between different input modalities to
generate high-quality features. Subsequently, a Discriminator is employed to
guide the Reconstructor to generate realistic canonical representations. The
Reconstructor and the Discriminator learn to optimize through adversarial
training. Experimental results on the prevalent NOCS-CAMERA and NOCS-REAL
datasets demonstrate that our method achieves state-of-the-art performance.
- Abstract(参考訳): 近年,正準3次元表現の再構築により,カテゴリーレベルの6次元物体ポーズ推定が大幅に改善されている。
しかし、既存の方法の復元の質は、まだそれほど良くない。
本稿では,ACR-Pose という新しい逆正準表現再構成ネットワークを提案する。
ACR-Poseはリコンストラクタとディスクリミネータで構成される。
Reconstructorは主に2つの新しいサブモジュールで構成されている: Pose-Irrelevant Module (PIM) と Relational Reconstruction Module (RRM) である。
PIMはレコンストラクタを回転や翻訳に敏感にするために標準的特徴を学習する傾向があり、RRMは異なる入力モード間の重要な関係情報を探索して高品質な特徴を生成する。
その後、判別器を用いて再構成者を誘導し、現実的な正準表現を生成する。
リコンストラクタと判別器は、敵の訓練を通じて最適化を学ぶ。
代表的なNOCS-CAMERAとNOCS-REALデータセットの実験結果から,本手法が最先端の性能を実現することを示す。
関連論文リスト
- Rethinking Dual-Domain Undersampled MRI reconstruction: domain-specific
design from the perspective of the receptive field [21.81705484892258]
二重ドメイン再構築のためのドメイン固有モジュールを提案する。
我々は、MRI再構成の異なる規則の下で、SoTA法DuDoRNetを翻訳することで、モジュールを評価する。
我々のモデルであるDuDoRNet+は、競合するディープラーニング手法よりも大幅に改善されている。
論文 参考訳(メタデータ) (2023-03-19T09:15:50Z) - Bridging Component Learning with Degradation Modelling for Blind Image
Super-Resolution [69.11604249813304]
視覚障害者のためのコンポーネント分解・協調最適化ネットワーク(CDCN)を提案する。
CDCNは入力LR画像を特徴空間の構造と詳細成分に分解する。
本稿では,HR画像の細部と構造復元過程を協調的に監督する,劣化駆動型学習戦略を提案する。
論文 参考訳(メタデータ) (2022-12-03T14:53:56Z) - Learning Detail-Structure Alternative Optimization for Blind
Super-Resolution [69.11604249813304]
そこで我々は,ブラインドSRに先立ってカーネルを曖昧にすることなく,再帰的な詳細構造代替最適化を実現する,有効かつカーネルフリーなネットワークDSSRを提案する。
DSSRでは、細部構造変調モジュール(DSMM)が構築され、画像の詳細と構造の相互作用と協調を利用する。
本手法は既存の手法に対して最先端の手法を実現する。
論文 参考訳(メタデータ) (2022-12-03T14:44:17Z) - RRSR:Reciprocal Reference-based Image Super-Resolution with Progressive
Feature Alignment and Selection [66.08293086254851]
本稿では,RefSRネットワークの学習を強化するための相互学習フレームワークを提案する。
新たに提案したモジュールは,マルチスケールの特徴空間に参照入力画像をアライメントし,参照認識機能の選択を行う。
我々は,最近のRefSRモデルが相互学習パラダイムによって一貫した改善が可能であることを実証的に示す。
論文 参考訳(メタデータ) (2022-11-08T12:39:35Z) - ReconFormer: Accelerated MRI Reconstruction Using Recurrent Transformer [60.27951773998535]
本稿では,MRI再構成のためのリカレントトランスモデルである textbfReconFormer を提案する。
高度にアンダーサンプリングされたk空間データから高純度磁気共鳴像を反復的に再構成することができる。
パラメータ効率が向上し,最先端手法よりも大幅に向上したことを示す。
論文 参考訳(メタデータ) (2022-01-23T21:58:19Z) - Sparse-View CT Reconstruction using Recurrent Stacked Back Projection [3.91278924473622]
Recurrent Stacked Back Projection (RSBP) と呼ばれる直接再構成手法を導入する。
RSBPは、反復的な畳み込みLSTMネットワークへの入力として、個々のビューの逐次的に取得されたバックプロジェクションを使用する。
本研究では,FBP画像の処理後処理と基本MBIRの処理後処理において,計算コストがMBIRよりも低くなることを実証する。
論文 参考訳(メタデータ) (2021-12-09T15:44:35Z) - PR-RRN: Pairwise-Regularized Residual-Recursive Networks for Non-rigid
Structure-from-Motion [58.75694870260649]
PR-RRNは、非剛性構造移動のための新しいニューラルネットワークベースの手法である。
再建をさらに規則化するための2つの新しいペアワイズ正規化を提案する。
提案手法は,CMU MOCAPとPASCAL3D+データセットの最先端性能を実現する。
論文 参考訳(メタデータ) (2021-08-17T08:39:02Z) - Over-and-Under Complete Convolutional RNN for MRI Reconstruction [57.95363471940937]
MR画像再構成のための最近のディープラーニングに基づく手法は、通常、汎用的なオートエンコーダアーキテクチャを利用する。
OUCR(Over-and-Under Complete Convolu?tional Recurrent Neural Network)を提案する。
提案手法は, トレーニング可能なパラメータの少ない圧縮されたセンシングと, 一般的なディープラーニングに基づく手法に対して, 大幅な改善を実現する。
論文 参考訳(メタデータ) (2021-06-16T15:56:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。