論文の概要: ConvPoseCNN2: Prediction and Refinement of Dense 6D Object Poses
- arxiv url: http://arxiv.org/abs/2205.11124v1
- Date: Mon, 23 May 2022 08:32:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-25 10:42:57.171727
- Title: ConvPoseCNN2: Prediction and Refinement of Dense 6D Object Poses
- Title(参考訳): ConvPoseCNN2:Dense 6D Object Posesの予測と再定義
- Authors: Arul Selvam Periyasamy, Catherine Capellen, Max Schwarz, and Sven
Behnke
- Abstract要約: 本稿では,オブジェクトの翻訳と向きを密に予測するPoseCNN法の完全畳み込み拡張を提案する。
これは、方向予測の空間分解能を改善するなど、いくつかの利点がある。
提案手法は,YCB-Videoデータセットにおいて,PoseCNNと同じ精度で実現可能であることを示す。
- 参考スコア(独自算出の注目度): 23.348510362258402
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Object pose estimation is a key perceptual capability in robotics. We propose
a fully-convolutional extension of the PoseCNN method, which densely predicts
object translations and orientations. This has several advantages such as
improving the spatial resolution of the orientation predictions -- useful in
highly-cluttered arrangements, significant reduction in parameters by avoiding
full connectivity, and fast inference. We propose and discuss several
aggregation methods for dense orientation predictions that can be applied as a
post-processing step, such as averaging and clustering techniques. We
demonstrate that our method achieves the same accuracy as PoseCNN on the
challenging YCB-Video dataset and provide a detailed ablation study of several
variants of our method. Finally, we demonstrate that the model can be further
improved by inserting an iterative refinement module into the middle of the
network, which enforces consistency of the prediction.
- Abstract(参考訳): オブジェクトのポーズ推定はロボット工学における重要な知覚能力である。
本稿では,オブジェクトの翻訳と向きを密に予測するPoseCNN法の完全畳み込み拡張を提案する。
これには、高度に散らばった配置に有用な方向予測の空間解像度の改善、完全な接続を避けることでパラメータの大幅な削減、高速推論など、いくつかの利点がある。
平均化やクラスタリングなど,処理後のステップとして適用可能な高密度配向予測のためのいくつかのアグリゲーション手法を提案し,議論する。
提案手法は,YCB-Videoデータセット上でPoseCNNと同じ精度を達成し,提案手法のいくつかの変種について詳細なアブレーション研究を行う。
最後に,ネットワークの中央に反復改良モジュールを挿入することで,予測の一貫性を強制することで,モデルをさらに改善できることを実証する。
関連論文リスト
- Distributional Reduction: Unifying Dimensionality Reduction and
Clustering with Gromov-Wasserstein Projection [50.51460159104604]
教師なし学習は、潜在的に大きな高次元データセットの基盤構造を捉えることを目的としている。
伝統的に、これは次元還元法を用いて解釈可能な空間にデータを投影したり、意味のあるクラスタにポイントを整理する。
私たちは新しい視点 – 流通の視点 – を提供しています。
我々はクラスタリングと次元還元を分散還元と呼ばれる単一のフレームワークに統合する。
論文 参考訳(メタデータ) (2024-02-03T19:00:19Z) - A positive feedback method based on F-measure value for Salient Object
Detection [1.9249287163937976]
本稿では,SODに対するF値に基づく正のフィードバック手法を提案する。
提案手法は,画像を検出して既存のモデルに入力し,それぞれの予測マップを取得する。
5つの公開データセットに対する実験結果から,提案手法の正のフィードバックは,5つの評価指標において最新の12の手法よりも優れていた。
論文 参考訳(メタデータ) (2023-04-28T04:05:13Z) - TransPoser: Transformer as an Optimizer for Joint Object Shape and Pose
Estimation [25.395619346823715]
連続観察されたRGB-D画像から剛体物体の形状と姿勢の結合推定法を提案する。
本稿では、カメラの視点と視線方向が与えられた物体の深度画像を直接出力するニューラルネットワークであるDeep Directional Distance Function(DeepDDF)を紹介する。
結合推定自体をTransPoserと呼ぶTransformerとして定式化する。
論文 参考訳(メタデータ) (2023-03-23T17:46:54Z) - Efficient Graph Neural Network Inference at Large Scale [54.89457550773165]
グラフニューラルネットワーク(GNN)は、幅広いアプリケーションで優れた性能を示している。
既存のスケーラブルなGNNは、線形伝搬を利用して特徴を前処理し、トレーニングと推論の手順を高速化する。
本稿では,そのトポロジ情報に基づいて各ノードに対してパーソナライズされた伝搬順序を生成する適応的伝搬順序法を提案する。
論文 参考訳(メタデータ) (2022-11-01T14:38:18Z) - Deep-Ensemble-Based Uncertainty Quantification in Spatiotemporal Graph
Neural Networks for Traffic Forecasting [2.088376060651494]
本稿では,短期交通予測のための最先端手法である拡散畳み込みリカレントニューラルネットワーク(DCRNN)に注目した。
我々はDCRNNの不確実性を定量化するスケーラブルなディープアンサンブル手法を開発した。
我々の汎用的かつスケーラブルなアプローチは、現在最先端のベイズ的手法や、多くの一般的な頻繁な手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-04-04T16:10:55Z) - Generalizing Interactive Backpropagating Refinement for Dense Prediction [0.0]
本稿では,G-BRSレイヤの集合を導入し,グローバル・ローカライズド・リファインメントとローカライズド・リファインメントの両立を可能にした。
提案手法は,数クリックで既存の事前訓練された最先端モデルの性能を向上する。
論文 参考訳(メタデータ) (2021-12-21T03:52:08Z) - Bayesian Graph Contrastive Learning [55.36652660268726]
本稿では,ランダムな拡張がエンコーダにつながることを示すグラフコントラスト学習手法の新たな視点を提案する。
提案手法は,各ノードを決定論的ベクトルに埋め込む既存の手法とは対照的に,各ノードを潜在空間の分布で表現する。
いくつかのベンチマークデータセットにおける既存の最先端手法と比較して,性能が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2021-12-15T01:45:32Z) - Dynamic Iterative Refinement for Efficient 3D Hand Pose Estimation [87.54604263202941]
本稿では,従来の推定値の修正に部分的レイヤを反復的に活用する,小さなディープニューラルネットワークを提案する。
学習したゲーティング基準を用いて、ウェイトシェアリングループから抜け出すかどうかを判断し、モデルにサンプルごとの適応を可能にする。
提案手法は,広く使用されているベンチマークの精度と効率の両面から,最先端の2D/3Dハンドポーズ推定手法より一貫して優れている。
論文 参考訳(メタデータ) (2021-11-11T23:31:34Z) - Occlusion-Robust Object Pose Estimation with Holistic Representation [42.27081423489484]
State-of-the-art(SOTA)オブジェクトのポーズ推定器は2段階のアプローチを取る。
我々は,新しいブロック・アンド・ブラックアウトバッチ拡張技術を開発した。
また,総合的なポーズ表現学習を促進するためのマルチ精度監視アーキテクチャも開発している。
論文 参考訳(メタデータ) (2021-10-22T08:00:26Z) - PDC-Net+: Enhanced Probabilistic Dense Correspondence Network [161.76275845530964]
高度確率密度対応ネットワーク(PDC-Net+)は、精度の高い高密度対応を推定できる。
我々は、堅牢で一般化可能な不確実性予測に適したアーキテクチャと強化されたトレーニング戦略を開発する。
提案手法は,複数の挑戦的幾何マッチングと光学的フローデータセットに対して,最先端の結果を得る。
論文 参考訳(メタデータ) (2021-09-28T17:56:41Z) - Robust 6D Object Pose Estimation by Learning RGB-D Features [59.580366107770764]
本稿では、この局所最適問題を解くために、回転回帰のための離散連続的な新しい定式化を提案する。
我々はSO(3)の回転アンカーを均一にサンプリングし、各アンカーから目標への制約付き偏差を予測し、最適な予測を選択するための不確実性スコアを出力する。
LINEMOD と YCB-Video の2つのベンチマーク実験により,提案手法が最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2020-02-29T06:24:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。