論文の概要: Adversarial Transfer of Pose Estimation Regression
- arxiv url: http://arxiv.org/abs/2006.11658v2
- Date: Mon, 23 Nov 2020 13:45:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-18 22:29:11.558288
- Title: Adversarial Transfer of Pose Estimation Regression
- Title(参考訳): ポーズ推定回帰の逆移動
- Authors: Boris Chidlovskii, Assem Sadek
- Abstract要約: 本研究では,シーン不変の画像表現を学習するための深層適応ネットワークを開発し,モデル転送のための表現を生成する。
我々は、Cambridge Landmarksと7Sceneの2つの公開データセット上でネットワークを評価し、いくつかのベースラインよりもその優位性を実証し、アート手法の状況と比較した。
- 参考スコア(独自算出の注目度): 11.117357750374035
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We address the problem of camera pose estimation in visual localization.
Current regression-based methods for pose estimation are trained and evaluated
scene-wise. They depend on the coordinate frame of the training dataset and
show a low generalization across scenes and datasets. We identify the dataset
shift an important barrier to generalization and consider transfer learning as
an alternative way towards a better reuse of pose estimation models. We revise
domain adaptation techniques for classification and extend them to camera pose
estimation, which is a multi-regression task. We develop a deep adaptation
network for learning scene-invariant image representations and use adversarial
learning to generate such representations for model transfer. We enrich the
network with self-supervised learning and use the adaptability theory to
validate the existence of scene-invariant representation of images in two given
scenes. We evaluate our network on two public datasets, Cambridge Landmarks and
7Scene, demonstrate its superiority over several baselines and compare to the
state of the art methods.
- Abstract(参考訳): 視覚的位置推定におけるカメラポーズ推定の問題に対処する。
ポーズ推定のための現在の回帰に基づく手法を訓練し、シーンワイズで評価する。
トレーニングデータセットの座標フレームに依存し、シーンやデータセット間の一般化が低いことを示す。
我々は、データセットシフトを一般化の重要な障壁とみなし、移動学習をポーズ推定モデルのより良い再利用に向けた代替手段とみなす。
分類のためのドメイン適応手法を改訂し、マルチ回帰タスクであるカメラポーズ推定に拡張する。
本研究では,シーン不変画像表現を学習する深層適応ネットワークを開発し,逆学習を用いてモデル転送のための表現を生成する。
ネットワークを自己教師付き学習で強化し,適応性理論を用いて2つのシーンにおける画像のシーン不変表現の存在を検証する。
我々は、Cambridge Landmarksと7Sceneの2つの公開データセット上でネットワークを評価し、いくつかのベースラインよりもその優位性を実証し、アート手法の状況と比較した。
関連論文リスト
- Reinforcing Pre-trained Models Using Counterfactual Images [54.26310919385808]
本稿では,言語誘導型生成対実画像を用いた分類モデル強化のための新しいフレームワークを提案する。
逆ファクト画像データセットを用いてモデルをテストすることにより、モデルの弱点を同定する。
我々は、分類モデルを微調整し強化するために、デファクトイメージを拡張データセットとして採用する。
論文 参考訳(メタデータ) (2024-06-19T08:07:14Z) - Bilevel Fast Scene Adaptation for Low-Light Image Enhancement [50.639332885989255]
低照度シーンにおける画像の強調は、コンピュータビジョンにおいて難しいが、広く懸念されている課題である。
主な障害は、異なるシーンにまたがる分散の相違によるモデリングの混乱にある。
上述の潜在対応をモデル化するための双レベルパラダイムを導入する。
エンコーダのシーン非関連な一般化を多様なシーンにもたらすために、双方向学習フレームワークを構築した。
論文 参考訳(メタデータ) (2023-06-02T08:16:21Z) - ImPosIng: Implicit Pose Encoding for Efficient Camera Pose Estimation [2.6808541153140077]
暗黙の詩。
(ImPosing)はイメージとカメラのポーズを2つの別々のニューラルネットワークで共通の潜在表現に埋め込む。
階層的な方法で潜在空間を通して候補を評価することにより、カメラの位置と向きを直接回帰するのではなく、洗練する。
論文 参考訳(メタデータ) (2022-05-05T13:33:25Z) - Continual Learning for Image-Based Camera Localization [14.47046413243358]
連続学習環境における視覚的局所化の問題について検討する。
以上の結果から,非定常データも分類領域と同様,深層ネットワークにおいて視覚的局所化のための破滅的な忘れを生じさせることが示された。
本稿では,バッファリングプロセスにおける既存のサンプリング戦略を視覚的ローカライゼーションの問題に適応させる,カバレッジスコア(Buff-CS)に基づく新しいサンプリング手法を提案する。
論文 参考訳(メタデータ) (2021-08-20T11:18:05Z) - Transfer Learning for Pose Estimation of Illustrated Characters [37.04208600867858]
図示された文字領域のポーズ推定器は、補助的なコンテンツ作成タスクに貴重な事前情報を提供する。
ドメイン固有のソースモデルとタスク固有のソースモデルの両方から効率的に転送学習することで、ドメインギャップを橋渡しします。
ポーズ誘導図形検索の新たな課題を解決するために,得られた最先端キャラクタのポーズ推定手法を適用した。
論文 参考訳(メタデータ) (2021-08-04T02:37:28Z) - Object-aware Contrastive Learning for Debiased Scene Representation [74.30741492814327]
オブジェクトを自己教師型でローカライズする,オブジェクト認識型コントラスト学習フレームワークを開発した。
また、コントラCAM、オブジェクト認識型乱作、背景混合に基づく2つのデータ拡張を導入し、コントラスト型自己教師型学習における文脈バイアスと背景バイアスを低減した。
論文 参考訳(メタデータ) (2021-07-30T19:24:07Z) - Visual Camera Re-Localization Using Graph Neural Networks and Relative
Pose Supervision [31.947525258453584]
視覚再局在化とは、単一の画像を入力として、予め記録された環境に対してカメラの位置と向きを推定する手段である。
提案手法は特別な仮定をほとんど行わず,訓練やテストでは極めて軽量である。
標準の屋内(7-Scenes)と屋外(Cambridge Landmarks)のカメラ再ローカリゼーションベンチマークに対するアプローチの有効性を検証する。
論文 参考訳(メタデータ) (2021-04-06T14:29:03Z) - FixMyPose: Pose Correctional Captioning and Retrieval [67.20888060019028]
本稿では,自動ポーズ修正システムに対応する新しいキャプションデータセットfixmyposeを提案する。
我々は「現在の」ポーズを「ターゲット」ポーズのように見えるように修正する記述を収集する。
MLバイアスを避けるため、さまざまな階層を持つキャラクタ間のバランスを維持します。
論文 参考訳(メタデータ) (2021-04-04T21:45:44Z) - End-to-end learning of keypoint detection and matching for relative pose
estimation [1.8352113484137624]
2つの画像間の相対的なポーズを推定する新しい手法を提案する。
キーポイント検出,説明抽出,マッチング,ロバストなポーズ推定を共同で学習する。
本研究では,既知のポーズを持つ画像データベース内でのクエリ画像の視覚的局在化の手法を示す。
論文 参考訳(メタデータ) (2021-04-02T15:16:17Z) - Instance Localization for Self-supervised Detection Pretraining [68.24102560821623]
インスタンスローカリゼーションと呼ばれる,新たな自己監視型プリテキストタスクを提案する。
境界ボックスを事前学習に組み込むことで、より優れたタスクアライメントとアーキテクチャアライメントが促進されることを示す。
実験結果から, オブジェクト検出のための最先端の転送学習結果が得られた。
論文 参考訳(メタデータ) (2021-02-16T17:58:57Z) - Distilling Localization for Self-Supervised Representation Learning [82.79808902674282]
コントラスト学習は教師なし表現学習に革命をもたらした。
現在のコントラストモデルでは、前景オブジェクトのローカライズには効果がない。
本稿では,背景変化を学習するためのデータ駆動型手法を提案する。
論文 参考訳(メタデータ) (2020-04-14T16:29:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。