Fugu-MT 論文翻訳(概要): Exploiting Point-Wise Attention in 6D Object Pose Estimation Based on Bidirectional Prediction

論文の概要: Exploiting Point-Wise Attention in 6D Object Pose Estimation Based on Bidirectional Prediction

arxiv url: http://arxiv.org/abs/2308.08518v1
Date: Wed, 16 Aug 2023 17:13:45 GMT
ステータス: 翻訳完了
システム内更新日: 2023-08-17 12:25:27.859417
Title: Exploiting Point-Wise Attention in 6D Object Pose Estimation Based on Bidirectional Prediction
Title（参考訳）: 双方向予測に基づく6次元物体ポーズ推定における視点注意の活用
Authors: Yuhao Yang, Jun Wu, Guangjian Zhang and Rong Xiong
Abstract要約: 本稿では,ポイントワイズ対応機構を備えた双方向対応予測ネットワークを提案する。私たちの重要な洞察は、各モデルポイントとシーンポイントの相関が、ポイントペアマッチの学習に不可欠な情報を提供するということです。提案手法は,同じ評価基準下での他の最先端手法よりも優れた性能を実現する。
参考スコア（独自算出の注目度）: 22.115584205326694
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Traditional geometric registration based estimation methods only exploit the CAD model implicitly, which leads to their dependence on observation quality and deficiency to occlusion.To address the problem,the paper proposes a bidirectional correspondence prediction network with a point-wise attention-aware mechanism. This network not only requires the model points to predict the correspondence but also explicitly models the geometric similarities between observations and the model prior.} Our key insight is that the correlations between each model point and scene point provide essential information for learning point-pair matches. To further tackle the correlation noises brought by feature distribution divergence, we design a simple but effective pseudo-siamese network to improve feature homogeneity.Experimental results on the public datasets of LineMOD, YCB-Video, and Occ-LineMOD show that the proposed method achieves better performance than other state-of-the-art methods under the same evaluation criteria. Its robustness in estimating poses is greatly improved, especially in an environment with severe occlusions.
Abstract（参考訳）: 従来の幾何的登録に基づく推定手法はCADモデルのみを暗黙的に利用し,観察品質や排他的欠陥への依存を招き,この問題に対処するために,点認識機構を備えた双方向対応予測ネットワークを提案する。このネットワークは、対応を予測するためにモデルポイントを必要とするだけでなく、観測と先行モデルの幾何学的類似性を明示的にモデル化する。重要な洞察は、各モデルポイントとシーンポイントの相関が、ポイントペアマッチの学習に不可欠な情報を提供するということです。特徴分布のばらつきによる相関ノイズにさらに対処するため,LineMOD,YCB-Video,Occ-LineMODの公開データセットにおける実験結果から,提案手法が他の最先端手法よりも高い性能を実現することを示す。ポーズ推定におけるロバスト性は,特に重症咬合環境において著しく改善されている。

関連論文リスト

A Multi-Level Similarity Approach for Single-View Object Grasping: Matching, Planning, and Fine-Tuning [17.162675084829242]
一つの視点から3つの重要なステップを通して、未知の物体をしっかりと把握する手法を提案する。本稿では, 意味的, 幾何学的, 次元的特徴を統合し, 包括的評価を行う多層類似性マッチングフレームワークを提案する。さらに,大規模言語モデルの導入,半指向境界ボックスの導入,平面検出に基づく新たなポイントクラウド登録手法の開発などを行い,単一ビュー条件下でのマッチング精度の向上を図る。
論文参考訳（メタデータ） (2025-07-16T06:07:57Z)
Joint angle model based learning to refine kinematic human pose estimation [8.6527127612359]
現在のヒトのポーズ推定(HPE)は、キーポイント認識における時折エラーとキーポイント軌跡におけるランダムな変動に悩まされる。本稿では,関節角度に基づくモデリングにより,難易度を克服する手法を提案する。双方向リカレントネットワークは、確立されたHRNetの推定を洗練するための後処理モジュールとして設計されている。
論文参考訳（メタデータ） (2025-07-15T08:16:39Z)
Improving Out-of-Distribution Detection via Dynamic Covariance Calibration [12.001290283557466]
アウト・オブ・ディストリビューション(OOD)検出は、AIシステムの信頼性に不可欠である。我々は, 従来の形状を動的に調整することにより, 分散されていない試料の影響を補正することができると論じる。提案手法は, 各種モデル間のOOD検出を著しく向上させる。
論文参考訳（メタデータ） (2025-06-11T05:05:26Z)
Latent Semantic Consensus For Deterministic Geometric Model Fitting [109.44565542031384]
我々はLSC(Latent Semantic Consensus)と呼ばれる効果的な方法を提案する。 LSCは、モデルフィッティング問題をデータポイントとモデル仮説に基づく2つの潜在意味空間に定式化する。 LSCは、一般的な多構造モデルフィッティングのために、数ミリ秒以内で一貫した、信頼性の高いソリューションを提供することができる。
論文参考訳（メタデータ） (2024-03-11T05:35:38Z)
COSE: A Consistency-Sensitivity Metric for Saliency on Image Classification [21.3855970055692]
本稿では,画像分類タスクにおいて,視覚の先行値を用いてサリエンシ手法の性能を評価する指標について述べる。しかし,ほとんどの手法では,畳み込みモデルよりもトランスフォーマーモデルの方がよく説明できる。
論文参考訳（メタデータ） (2023-09-20T01:06:44Z)
A Model for Multi-View Residual Covariances based on Perspective Deformation [88.21738020902411]
マルチビューSfM, オードメトリ, SLAMセットアップにおける視覚的残差の共分散モデルの導出を行う。我々は、合成データと実データを用いてモデルを検証し、それを光度および特徴量に基づくバンドル調整に統合する。
論文参考訳（メタデータ） (2022-02-01T21:21:56Z)
Distributional Depth-Based Estimation of Object Articulation Models [21.046351215949525]
本研究では,奥行き画像から直接,調音モデルパラメータの分布を効率よく学習する手法を提案する。私たちのコアコントリビューションには、剛体変換に対する分布の新しい表現が含まれています。本稿では,カテゴリに依存しない調音モデル推定を行う新しい深層学習手法DUST-netを提案する。
論文参考訳（メタデータ） (2021-08-12T17:44:51Z)
Instance-Level Relative Saliency Ranking with Graph Reasoning [126.09138829920627]
そこで本研究では,有意な事例を分割し,相対的有意な有意なランク順序を推定するための統一モデルを提案する。また、サラレンシーランキングブランチを効果的にトレーニングするために、新しい損失関数も提案されている。実験の結果,提案手法は従来の手法よりも有効であることがわかった。
論文参考訳（メタデータ） (2021-07-08T13:10:42Z)
From Canonical Correlation Analysis to Self-supervised Graph Neural Networks [99.44881722969046]
本稿では,グラフデータを用いた自己教師付き表現学習のための概念的単純かつ効果的なモデルを提案する。古典的カノニカル相関解析にインスパイアされた,革新的な特徴レベルの目的を最適化する。提案手法は、7つの公開グラフデータセット上で競合的に動作する。
論文参考訳（メタデータ） (2021-06-23T15:55:47Z)
GELATO: Geometrically Enriched Latent Model for Offline Reinforcement Learning [54.291331971813364]
オフライン強化学習アプローチは、近近法と不確実性認識法に分けられる。本研究では,この2つを潜在変動モデルに組み合わせることのメリットを実証する。提案したメトリクスは、分布サンプルのアウトの品質と、データ内のサンプルの不一致の両方を測定します。
論文参考訳（メタデータ） (2021-02-22T19:42:40Z)
A Detailed Look At CNN-based Approaches In Facial Landmark Detection [5.774786149181392]
CNNベースのアプローチは回帰とヒートマップのアプローチに分けられる。本稿では,CNNに基づくアプローチの両面について検討し,その利点と欠点を一般化し,ヒートマップアプローチのバリエーションを導入する。包括的評価を行い,提案モデルが全テストデータセットにおいて,他のモデルよりも優れていることを示す。
論文参考訳（メタデータ） (2020-05-08T16:17:42Z)
Deep Semantic Matching with Foreground Detection and Cycle-Consistency [103.22976097225457]
深層ネットワークに基づく弱い教師付きセマンティックマッチングに対処する。本研究では,背景乱れの影響を抑えるために,前景領域を明示的に推定する。複数の画像にまたがって予測変換を強制し、幾何的に可視かつ一貫したサイクル一貫性の損失を発生させる。
論文参考訳（メタデータ） (2020-03-31T22:38:09Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。