論文の概要: Motion Basis Learning for Unsupervised Deep Homography Estimation with
Subspace Projection
- arxiv url: http://arxiv.org/abs/2103.15346v1
- Date: Mon, 29 Mar 2021 05:51:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-30 14:57:29.113150
- Title: Motion Basis Learning for Unsupervised Deep Homography Estimation with
Subspace Projection
- Title(参考訳): 部分空間投影を用いた教師なし深部ホログラフィー推定のための動作基底学習
- Authors: Nianjin Ye, Chuan Wang, Haoqiang Fan, Shuaicheng Liu
- Abstract要約: 本稿では,教師なし深層ホモグラフィ推定のための新しいフレームワークを提案する。
本手法は,ホモグラフィベンチマークデータセットにおける最先端技術よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 27.68752841842823
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we introduce a new framework for unsupervised deep homography
estimation. Our contributions are 3 folds. First, unlike previous methods that
regress 4 offsets for a homography, we propose a homography flow
representation, which can be estimated by a weighted sum of 8 pre-defined
homography flow bases. Second, considering a homography contains 8
Degree-of-Freedoms (DOFs) that is much less than the rank of the network
features, we propose a Low Rank Representation (LRR) block that reduces the
feature rank, so that features corresponding to the dominant motions are
retained while others are rejected. Last, we propose a Feature Identity Loss
(FIL) to enforce the learned image feature warp-equivariant, meaning that the
result should be identical if the order of warp operation and feature
extraction is swapped. With this constraint, the unsupervised optimization is
achieved more effectively and more stable features are learned. Extensive
experiments are conducted to demonstrate the effectiveness of all the newly
proposed components, and results show our approach outperforms the
state-of-the-art on the homography benchmark datasets both qualitatively and
quantitatively.
- Abstract(参考訳): 本稿では,教師なし深層ホログラフィ推定のための新しいフレームワークを提案する。
私たちの貢献は3つです。
まず,4つのオフセットをホモグラフィに回帰させる従来の手法とは異なり,事前に定義された8つのホモグラフィフロー基底の重み付け和で推定できるホモグラフィフロー表現を提案する。
第2に,ネットワーク特徴のランクよりもはるかに少ない8自由度 (dofs) を含むホモグラフを考えると,特徴ランクを減少させる低ランク表現 (lrr) ブロックを提案する。
最後に,ワープ操作と特徴抽出の順序が入れ替わった場合の結果が同一となるように,学習画像特徴量ワープ同変を強制する特徴同一性損失(fil)を提案する。
この制約により、教師なし最適化はより効果的に達成され、より安定した特徴が学習される。
提案する全てのコンポーネントの有効性を実証するために広範な実験を行い,ホモグラフィベンチマークデータセットの質的および定量的に比較した。
関連論文リスト
- Deep Homography Estimation for Visual Place Recognition [49.235432979736395]
本稿では,変換器を用いたディープホモグラフィー推定(DHE)ネットワークを提案する。
バックボーンネットワークによって抽出された濃密な特徴写像を入力とし、高速で学習可能な幾何的検証のためにホモグラフィーに適合する。
ベンチマークデータセットを用いた実験により,本手法はいくつかの最先端手法より優れていることが示された。
論文 参考訳(メタデータ) (2024-02-25T13:22:17Z) - Leveraging Graph Diffusion Models for Network Refinement Tasks [72.54590628084178]
本稿では,グラフ拡散に基づく新しいグラフ生成フレームワークSGDMを提案する。
我々のフレームワークはグラフ拡散モデルのスケーラビリティと忠実度を向上するだけでなく、逆プロセスを利用して新しい条件付き生成タスクを実行する。
論文 参考訳(メタデータ) (2023-11-29T18:02:29Z) - Few-shot Image Classification based on Gradual Machine Learning [6.935034849731568]
少ないショット画像分類は、ラベル付きサンプルのみを使用してラベル付きイメージを正確に分類することを目的としている。
段階的機械学習(GML)の非i.dパラダイムに基づく新しいアプローチを提案する。
提案手法は精度でSOTAの性能を1-5%向上させることができることを示す。
論文 参考訳(メタデータ) (2023-07-28T12:30:41Z) - Boosting Few-shot Fine-grained Recognition with Background Suppression
and Foreground Alignment [53.401889855278704]
FS-FGR (Few-shot Fine-fine Recognition) は、限られたサンプルの助けを借りて、新しいきめ細かなカテゴリを認識することを目的としている。
本研究では,背景アクティベーション抑制 (BAS) モジュール,フォアグラウンドオブジェクトアライメント (FOA) モジュール,および局所的局所的(L2L) 類似度測定器からなる2段階の背景アライメントとフォアグラウンドアライメントフレームワークを提案する。
複数のベンチマークで行った実験により,提案手法は既存の最先端技術よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2022-10-04T07:54:40Z) - Bi-PointFlowNet: Bidirectional Learning for Point Cloud Based Scene Flow
Estimation [3.1869033681682124]
本稿では,双方向フロー埋め込み層を用いた新しいシーンフロー推定アーキテクチャを提案する。
提案する双方向層は,前方方向と後方方向の両方で特徴を学習し,推定性能を向上させる。
さらに、階層的特徴抽出とワープにより性能が向上し、計算オーバーヘッドが減少する。
論文 参考訳(メタデータ) (2022-07-15T15:14:53Z) - Abs-CAM: A Gradient Optimization Interpretable Approach for Explanation
of Convolutional Neural Networks [7.71412567705588]
クラスアクティベーションマッピングに基づく手法は、コンピュータビジョンタスクにおけるモデルの内部決定を解釈するために広く用いられている。
バックプロパゲーションから導出される勾配を最適化する絶対値クラス活性化マッピング(Abs-CAM)法を提案する。
Abs-CAMのフレームワークは、2つのフェーズに分けられる。
論文 参考訳(メタデータ) (2022-07-08T02:06:46Z) - Unsupervised Homography Estimation with Coplanarity-Aware GAN [39.477228263736905]
画像ペアからホモグラフィーを推定することは、画像アライメントの根本的な問題である。
HomoGANは、教師なしのホモグラフィー推定を誘導し、支配的な平面に焦点を合わせるように設計されている。
その結果, マッチング誤差は従来のSOTA法よりも22%低いことがわかった。
論文 参考訳(メタデータ) (2022-05-08T09:26:47Z) - CAMERAS: Enhanced Resolution And Sanity preserving Class Activation
Mapping for image saliency [61.40511574314069]
バックプロパゲーション画像のサリエンシは、入力中の個々のピクセルのモデル中心の重要性を推定することにより、モデル予測を説明することを目的としている。
CAMERASは、外部の事前処理を必要とせずに、高忠実度バックプロパゲーション・サリエンシ・マップを計算できる手法である。
論文 参考訳(メタデータ) (2021-06-20T08:20:56Z) - Perceptual Loss for Robust Unsupervised Homography Estimation [1.2891210250935146]
BiHomEは、ソース視点からの歪んだ画像とターゲット視点からの対応する画像との間の特徴空間における距離を最小化する。
我々は、biHomEが合成COCOデータセットの最先端のパフォーマンスを達成することを示しています。
論文 参考訳(メタデータ) (2021-04-20T14:41:54Z) - Self-Supervised Tuning for Few-Shot Segmentation [82.32143982269892]
Few-shotのセグメンテーションは、アノテートされたサンプルがほとんどない各画像ピクセルにカテゴリラベルを割り当てることを目的としている。
既存のメタラーニング手法では, 画像から抽出した視覚的特徴を埋め込み空間に埋め込むと, カテゴリー別識別記述子の生成に失敗する傾向にある。
本稿では,複数のエピソードにまたがる潜在特徴の分布を,自己分割方式に基づいて動的に調整する適応型フレームワークチューニングを提案する。
論文 参考訳(メタデータ) (2020-04-12T03:53:53Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。