Fugu-MT 論文翻訳(概要): TransPose: A Transformer-based 6D Object Pose Estimation Network with Depth Refinement

論文の概要: TransPose: A Transformer-based 6D Object Pose Estimation Network with Depth Refinement

arxiv url: http://arxiv.org/abs/2307.05561v1
Date: Sun, 9 Jul 2023 17:33:13 GMT
ステータス: 翻訳完了
システム内更新日: 2023-07-13 16:16:18.624535
Title: TransPose: A Transformer-based 6D Object Pose Estimation Network with Depth Refinement
Title（参考訳）: TransPose:深度補正機能を備えたトランスフォーマーベースの6Dオブジェクトポス推定ネットワーク
Authors: Mahmoud Abdulsalam and Nabil Aouf
Abstract要約: 深度修正モジュールを用いた改良型トランスフォーマーベースの6次元ポーズ推定法であるTransPoseを提案する。アーキテクチャはRGB画像のみを入力として取り込むが、深度や熱画像などの追加の補正は行わない。次に、予測された中心、6Dポーズ、および6Dポーズの精度を向上するために、新しい深度補正モジュールが使用される。
参考スコア（独自算出の注目度）: 5.482532589225552
License: http://creativecommons.org/licenses/by/4.0/
Abstract: As demand for robotics manipulation application increases, accurate vision-based 6D pose estimation becomes essential for autonomous operations. Convolutional Neural Networks (CNNs) based approaches for pose estimation have been previously introduced. However, the quest for better performance still persists especially for accurate robotics manipulation. This quest extends to the Agri-robotics domain. In this paper, we propose TransPose, an improved Transformer-based 6D pose estimation with a depth refinement module. The architecture takes in only an RGB image as input with no additional supplementing modalities such as depth or thermal images. The architecture encompasses an innovative lighter depth estimation network that estimates depth from an RGB image using feature pyramid with an up-sampling method. A transformer-based detection network with additional prediction heads is proposed to directly regress the object's centre and predict the 6D pose of the target. A novel depth refinement module is then used alongside the predicted centers, 6D poses and depth patches to refine the accuracy of the estimated 6D pose. We extensively compared our results with other state-of-the-art methods and analysed our results for fruit-picking applications. The results we achieved show that our proposed technique outperforms the other methods available in the literature.
Abstract（参考訳）: ロボット操作アプリケーションへの需要が増加するにつれて、正確な視覚に基づく6dポーズ推定が自律運転に必須となる。畳み込みニューラルネットワーク(CNN)に基づくポーズ推定手法が以前にも紹介されている。しかし、特に正確なロボティクス操作では、パフォーマンス向上の追求は引き続き続いている。この探求はアグリ・ロボティクス領域にまで及ぶ。本稿では,奥行き補正モジュールを用いたトランストランスベース6次元ポーズ推定法であるtransposeを提案する。アーキテクチャはRGB画像のみを入力として取り込むが、深度や熱画像などの追加の補正は行わない。このアーキテクチャは、アップサンプリング方式で特徴ピラミッドを用いてRGB画像から深度を推定する革新的な光深度推定ネットワークを含んでいる。対象物の中心を直接後退させ,対象物の6次元姿勢を予測するために,追加予測ヘッドを備えたトランスベース検出ネットワークを提案する。次に、予測された中心、6Dポーズ、および6Dポーズの精度を向上するために、新しい深度補正モジュールが使用される。その結果を最先端の他の手法と比較し,果実摘みの応用について分析した。その結果,提案手法は文献で利用可能な他の手法よりも優れていることがわかった。

関連論文リスト

Any6D: Model-free 6D Pose Estimation of Novel Objects [76.30057578269668]
我々は,6次元オブジェクトのポーズ推定のためのモデルフリーフレームワークであるAny6Dを紹介する。新たなシーンでは、未知の物体の6Dポーズと大きさを推定するために、1枚のRGB-Dアンカー画像しか必要としない。提案手法を5つの挑戦的データセットで評価する。
論文参考訳（メタデータ） (2025-03-24T13:46:21Z)
Active 6D Pose Estimation for Textureless Objects using Multi-View RGB Frames [10.859307261818362]
RBG画像からテクスチャレス物体の6次元ポーズを推定することはロボティクスにおいて重要な問題である。 RGB画像のみを用いてテクスチャレス物体の6次元ポーズを推定するための包括的能動的知覚フレームワークを提案する。
論文参考訳（メタデータ） (2025-03-05T18:28:32Z)
RDPN6D: Residual-based Dense Point-wise Network for 6Dof Object Pose Estimation Based on RGB-D Images [13.051302134031808]
単一のRGB-D画像を用いてオブジェクトの6DoFポーズを計算する新しい手法を提案する。オブジェクトのポーズを直接予測する既存の手法や、ポーズ回復のためのスパースキーポイントに依存する既存の手法とは異なり、我々のアプローチは密度の高い対応を使ってこの課題に対処する。
論文参考訳（メタデータ） (2024-05-14T10:10:45Z)
YOLOPose V2: Understanding and Improving Transformer-based 6D Pose Estimation [36.067414358144816]
YOLOPoseはトランスフォーマーベースの多目的6Dポーズ推定法である。キーポイントから向きを予測するために,学習可能な向き推定モジュールを用いる。提案手法はリアルタイムアプリケーションに適した手法であり,最先端の手法に匹敵する結果が得られる。
論文参考訳（メタデータ） (2023-07-21T12:53:54Z)
PoET: Pose Estimation Transformer for Single-View, Multi-Object 6D Pose Estimation [6.860183454947986]
本稿では、RGB画像を入力とし、画像内の各オブジェクトに対する6Dポーズを予測するトランスフォーマーベースのアプローチを提案する。画像のほかに、深度マップや3Dオブジェクトモデルなどの追加情報も不要です。挑戦的なYCB-Vデータセットに対するRGBのみのアプローチの最先端結果を得る。
論文参考訳（メタデータ） (2022-11-25T14:07:14Z)
Unseen Object 6D Pose Estimation: A Benchmark and Baselines [62.8809734237213]
本稿では,新しい物体の6次元ポーズ推定をアルゴリズムで行えるようにするための新しいタスクを提案する。実画像と合成画像の両方でデータセットを収集し、テストセットで最大48個の未確認オブジェクトを収集する。エンド・ツー・エンドの3D対応ネットワークをトレーニングすることにより、未確認物体と部分ビューRGBD画像との対応点を高精度かつ効率的に見つけることができる。
論文参考訳（メタデータ） (2022-06-23T16:29:53Z)
DeepRM: Deep Recurrent Matching for 6D Pose Refinement [77.34726150561087]
DeepRMは、6Dポーズ改善のための新しいリカレントネットワークアーキテクチャである。アーキテクチャにはLSTMユニットが組み込まれ、各改善ステップを通じて情報を伝達する。 DeepRMは、2つの広く受け入れられている課題データセットで最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2022-05-28T16:18:08Z)
Coupled Iterative Refinement for 6D Multi-Object Pose Estimation [64.7198752089041]
既知の3DオブジェクトのセットとRGBまたはRGB-Dの入力画像から、各オブジェクトの6Dポーズを検出して推定する。我々のアプローチは、ポーズと対応を緊密に結合した方法で反復的に洗練し、アウトレーヤを動的に除去して精度を向上させる。
論文参考訳（メタデータ） (2022-04-26T18:00:08Z)
FS6D: Few-Shot 6D Pose Estimation of Novel Objects [116.34922994123973]
6Dオブジェクトポーズ推定ネットワークは、多数のオブジェクトインスタンスにスケールする能力に制限がある。本研究では,未知の物体の6次元ポーズを,余分な訓練を伴わずにいくつかの支援ビューで推定する。
論文参考訳（メタデータ） (2022-03-28T10:31:29Z)
T6D-Direct: Transformers for Multi-Object 6D Pose Direct Regression [40.90172673391803]
T6D-Directは、DreTR上に構築され、6次元多目的ポーズ直接推定を行うトランスフォーマーベースのリアルタイム単一ステージ直接法である。提案手法は最も高速な推定時間を実現し,ポーズ推定精度は最先端の手法に匹敵する。
論文参考訳（メタデータ） (2021-09-22T18:13:33Z)
GDRNPP: A Geometry-guided and Fully Learning-based Object Pose Estimator [51.89441403642665]
剛体物体の6次元ポーズ推定はコンピュータビジョンにおける長年の課題である。近年、ディープラーニングの出現は、信頼できる6Dポーズを予測するための畳み込みニューラルネットワーク(CNN)の可能性を明らかにしている。本稿では,完全学習型オブジェクトポーズ推定器を提案する。
論文参考訳（メタデータ） (2021-02-24T09:11:31Z)
Spatial Attention Improves Iterative 6D Object Pose Estimation [52.365075652976735]
本稿では,RGB画像を用いた6次元ポーズ推定の改良手法を提案する。私たちの主な洞察力は、最初のポーズ推定の後、オブジェクトの異なる空間的特徴に注意を払うことが重要です。実験により,このアプローチが空間的特徴に順応することを学び,被写体の一部を無視することを学び,データセット間でのポーズ推定を改善することを実証した。
論文参考訳（メタデータ） (2021-01-05T17:18:52Z)
PrimA6D: Rotational Primitive Reconstruction for Enhanced and Robust 6D Pose Estimation [11.873744190924599]
本稿では,1つの画像を入力として,回転プリミティブに基づく6次元オブジェクトポーズ推定を提案する。変分オートエンコーダ(VAE)を利用して、基礎となるプリミティブとその関連するキーポイントを学習する。公開データセットに対して評価すると,LINEMOD,Occlusion LINEMOD,およびY誘発データセットよりも顕著な改善が得られた。
論文参考訳（メタデータ） (2020-06-14T03:55:42Z)
Self6D: Self-Supervised Monocular 6D Object Pose Estimation [114.18496727590481]
自己教師付き学習による単眼6次元ポーズ推定のアイデアを提案する。ニューラルレンダリングの最近の進歩を活用して、注釈のない実RGB-Dデータのモデルをさらに自己監督する。
論文参考訳（メタデータ） (2020-04-14T13:16:36Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。