論文の概要: A Structure-Aware Method for Direct Pose Estimation
- arxiv url: http://arxiv.org/abs/2012.12360v1
- Date: Tue, 22 Dec 2020 21:19:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-26 07:27:51.745003
- Title: A Structure-Aware Method for Direct Pose Estimation
- Title(参考訳): 直接ポーズ推定のための構造認識法
- Authors: Hunter Blanton, Scott Workman, Nathan Jacobs
- Abstract要約: 単一の画像からカメラポーズを推定することは、コンピュータビジョンにおける基本的な問題です。
この課題を解決するための既存の方法は、2つのカテゴリに分類されます。
構造的手法からインスピレーションを得て、明示的な3D制約をネットワークに組み込む直接手法を提案する。
- 参考スコア(独自算出の注目度): 35.928109902933656
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Estimating camera pose from a single image is a fundamental problem in
computer vision. Existing methods for solving this task fall into two distinct
categories, which we refer to as direct and indirect. Direct methods, such as
PoseNet, regress pose from the image as a fixed function, for example using a
feed-forward convolutional network. Such methods are desirable because they are
deterministic and run in constant time. Indirect methods for pose regression
are often non-deterministic, with various external dependencies such as image
retrieval and hypothesis sampling. We propose a direct method that takes
inspiration from structure-based approaches to incorporate explicit 3D
constraints into the network. Our approach maintains the desirable qualities of
other direct methods while achieving much lower error in general.
- Abstract(参考訳): 単一の画像からカメラのポーズを推定することは、コンピュータビジョンの基本的な問題である。
この課題を解決するための既存の手法は、直接的および間接的な2つのカテゴリに分類される。
posenetのような直接メソッドでは、例えばフィードフォワード畳み込みネットワークを使用して、イメージからレグレッシブポーズを固定関数として設定する。
このような方法は決定論的であり、一定の時間で実行されるため望ましい。
ポーズ回帰の間接的手法はしばしば非決定論的であり、画像検索や仮説サンプリングなど様々な外部依存関係がある。
ネットワークに明示的な3D制約を組み込むために,構造に基づくアプローチから着想を得た直接手法を提案する。
提案手法は他の直接法の望ましい性質を維持しつつ,より低い誤差を一般に達成する。
関連論文リスト
- ADen: Adaptive Density Representations for Sparse-view Camera Pose Estimation [17.097170273209333]
画像からカメラのポーズを復元することは、3Dコンピュータビジョンの基本課題である。
最近のデータ駆動型アプローチは、6DoFカメラのポーズを後退させたり、回転を確率分布として定式化したりすることで、カメラのポーズを直接出力することを目指している。
本稿では, ジェネレータと識別器を用いて2つのフレームワークを統合することを提案する。
論文 参考訳(メタデータ) (2024-08-16T22:45:46Z) - Towards Black-Box Membership Inference Attack for Diffusion Models [20.23161244284985]
本稿では,イメージ・ツー・イメージ・バラツキAPIのみを用いた新たなメンバシップ推論攻撃手法を提案する。
私たちのアプローチでは、サンプルがトレーニングセットの一部であったかどうかを分類することができます。
実験結果は従来手法より一貫して優れていた。
論文 参考訳(メタデータ) (2024-05-25T12:47:58Z) - Backpropagation-free Network for 3D Test-time Adaptation [42.469853469556966]
テスト時間適応(TTA)法は、計算的に重く、メモリ集約的なバックプロパゲーションに基づくアプローチを適用する傾向がある。
本稿では,TTAのバックプロパゲーションフリーアプローチを3次元データの特定の場合に適用する手法を提案する。
論文 参考訳(メタデータ) (2024-03-27T10:50:24Z) - FAR: Flexible, Accurate and Robust 6DoF Relative Camera Pose Estimation [30.710296843150832]
画像間の相対的なカメラのポーズを推定することは、コンピュータビジョンにおいて中心的な問題となっている。
私たちのアプローチは、正確かつ堅牢な結果をもたらします。
包括的解析は設計選択をサポートし,提案手法が様々な特徴抽出器や対応推定器に柔軟に適用可能であることを示す。
論文 参考訳(メタデータ) (2024-03-05T18:59:51Z) - Poseur: Direct Human Pose Regression with Transformers [119.79232258661995]
単一画像からの2次元人間のポーズ推定に対する直接回帰に基づくアプローチを提案する。
私たちのフレームワークはエンドツーエンドの差別化が可能で、キーポイント間の依存関係を自然に活用することを学びます。
我々のアプローチは、最も優れたヒートマップベースのポーズ推定手法と比較して好意的に機能する最初の回帰ベースのアプローチである。
論文 参考訳(メタデータ) (2022-01-19T04:31:57Z) - Reassessing the Limitations of CNN Methods for Camera Pose Regression [27.86655424544118]
本稿では,カメラのポーズを直接画像から復元できるモデルを提案する。
まず、レグレッションメソッドがまだ最先端にある理由を分析し、新しいアプローチでパフォーマンスギャップを埋める。
論文 参考訳(メタデータ) (2021-08-16T17:55:26Z) - GDR-Net: Geometry-Guided Direct Regression Network for Monocular 6D
Object Pose Estimation [71.83992173720311]
単一のRGB画像からの6次元ポーズ推定はコンピュータビジョンの基本課題である。
GDR-Net(Geometry-Guided Direct Regression Network)を用いて6Dポーズをエンドツーエンドで学習する。
提案手法は, LM, LM-O, YCB-Vデータセットの最先端手法よりも優れている。
論文 参考訳(メタデータ) (2021-02-24T09:11:31Z) - Pose Guided Person Image Generation with Hidden p-Norm Regression [113.41144529452663]
ポーズ誘導者画像生成タスクを解くための新しいアプローチを提案する。
提案手法では,各アイデンティティに対するポーズ不変特徴行列を推定し,対象ポーズに条件づけられたターゲットの出現を予測できる。
提案手法は, 上記すべての変種シナリオにおいて, 競合性能を示す。
論文 参考訳(メタデータ) (2021-02-19T17:03:54Z) - I Like to Move It: 6D Pose Estimation as an Action Decision Process [53.63776807432945]
オブジェクトのポーズ推定は、ロボットビジョンとARの不可欠な部分である。
以前の6Dポーズ検索パイプラインは、問題を回帰タスクとして扱うか、または、ポーズ空間を識別して分類する。
我々はこのパラダイムを変更し、初期ポーズを段階的に離散的に更新するアクション決定プロセスとして問題を再構築する。
ニューラルネットワークが推定すると、単一のRGBイメージから反復的に移動し、許容できる最終ポーズを決定する。
論文 参考訳(メタデータ) (2020-09-26T20:05:42Z) - Deep Variational Network Toward Blind Image Restoration [60.45350399661175]
ブラインド画像復元はコンピュータビジョンでは一般的だが難しい問題である。
両利点を両立させることを目的として,新しいブラインド画像復元手法を提案する。
画像デノイングと超解像という2つの典型的なブラインド赤外線タスクの実験により,提案手法が現状よりも優れた性能を達成できることが実証された。
論文 参考訳(メタデータ) (2020-08-25T03:30:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。