論文の概要: Unsupervised Homography Estimation with Coplanarity-Aware GAN
- arxiv url: http://arxiv.org/abs/2205.03821v1
- Date: Sun, 8 May 2022 09:26:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-10 15:47:43.886222
- Title: Unsupervised Homography Estimation with Coplanarity-Aware GAN
- Title(参考訳): Coplanarity-Aware GANを用いた教師なしホログラフィー推定
- Authors: Mingbo Hong, Yuhang Lu, Nianjin Ye, Chunyu Lin, Qijun Zhao, Shuaicheng
Liu
- Abstract要約: 画像ペアからホモグラフィーを推定することは、画像アライメントの根本的な問題である。
HomoGANは、教師なしのホモグラフィー推定を誘導し、支配的な平面に焦点を合わせるように設計されている。
その結果, マッチング誤差は従来のSOTA法よりも22%低いことがわかった。
- 参考スコア(独自算出の注目度): 39.477228263736905
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Estimating homography from an image pair is a fundamental problem in image
alignment. Unsupervised learning methods have received increasing attention in
this field due to their promising performance and label-free training. However,
existing methods do not explicitly consider the problem of plane-induced
parallax, which will make the predicted homography compromised on multiple
planes. In this work, we propose a novel method HomoGAN to guide unsupervised
homography estimation to focus on the dominant plane. First, a multi-scale
transformer network is designed to predict homography from the feature pyramids
of input images in a coarse-to-fine fashion. Moreover, we propose an
unsupervised GAN to impose coplanarity constraint on the predicted homography,
which is realized by using a generator to predict a mask of aligned regions,
and then a discriminator to check if two masked feature maps are induced by a
single homography. To validate the effectiveness of HomoGAN and its components,
we conduct extensive experiments on a large-scale dataset, and the results show
that our matching error is 22% lower than the previous SOTA method. Code is
available at https://github.com/megvii-research/HomoGAN.
- Abstract(参考訳): 画像対からホモグラフィを推定することは画像アライメントにおける根本的な問題である。
教師なし学習は有望なパフォーマンスとラベルなしのトレーニングによって注目を集めている。
しかし、既存の手法では平面誘起パララックスの問題を明確に考慮していないため、予測されたホモグラフィーは複数の平面で妥協される。
本研究では,非教師なしホモグラフィ推定を支配面に焦点を合わせるための新しい手法であるHomoGANを提案する。
まず,マルチスケールトランスフォーマーネットワークは,入力画像の特徴ピラミッドからホモグラフィを粗い方法で予測するように設計されている。
さらに、予測ホモグラフィーにコプラナリティ制約を課す教師なしGANを提案し、生成器を用いて整列した領域のマスクを予測し、2つのマスク付き特徴写像が単一のホモグラフィーによって誘導されるかどうかを判別する。
HomoGANとそのコンポーネントの有効性を検証するため,大規模なデータセット上で広範囲に実験を行い,マッチング誤差が従来のSOTA法よりも22%低いことを示す。
コードはhttps://github.com/megvii-research/homoganで入手できる。
関連論文リスト
- Two-Dimensional Unknown View Tomography from Unknown Angle Distributions [2.4961059113841952]
本研究では,視角の分布が不明な場合,未知の視角下での2次元トモグラフィー手法を提案する。
2D UVT問題に関する中程度の文献があるが、既存の2D UVTアルゴリズムの多くは、通常利用できない角度分布の知識を前提としている。
提案手法は, クロスバリデーション誤差に基づく最適化タスクとして問題を定式化し, 基礎となる2次元構造と連動して角度分布を推定する。
我々はPCA法とグラフラプラシアン・トモグラフィー(GLT)を用いて雑音予測によるアルゴリズムの性能評価を行った。
論文 参考訳(メタデータ) (2025-01-06T09:27:08Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - APRF: Anti-Aliasing Projection Representation Field for Inverse Problem
in Imaging [74.9262846410559]
Sparse-view Computed Tomography (SVCT) は画像の逆問題である。
近年の研究では、インプリシット・ニューラル・リ表現(INR)を用いて、シングラムとCT画像の座標に基づくマッピングを構築している。
自己教師型SVCT再構成法の提案 -抗エイリアス射影表現場(APRF)-
APRFは空間的制約によって隣接する投影ビュー間の連続的な表現を構築することができる。
論文 参考訳(メタデータ) (2023-07-11T14:04:12Z) - Semi-supervised Deep Large-baseline Homography Estimation with
Progressive Equivalence Constraint [25.022907946911033]
ホログラフィー推定は, 画像オーバーレイが低く, 受容野が限られているため, 大規模なベースラインの場合, 誤りである。
本稿では,大規模ベースラインのホモグラフィを複数の中間データに変換することによって,プログレッシブな推定手法を提案する。
提案手法は,小規模なベースラインシーンにおける競合性能を維持しつつ,大規模ベースラインシーンにおける最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-12-06T05:28:05Z) - Ground Plane Matters: Picking Up Ground Plane Prior in Monocular 3D
Object Detection [92.75961303269548]
先行する地平面は、モノクル3次元物体検出(M3OD)における非常に情報的な幾何学的手がかりである
本稿では,両問題を一度に解決するGPENetを提案する。
我々のGPENetは、他の手法よりも優れ、最先端のパフォーマンスを実現し、提案手法の有効性と優位性を示すことができる。
論文 参考訳(メタデータ) (2022-11-03T02:21:35Z) - CAMERAS: Enhanced Resolution And Sanity preserving Class Activation
Mapping for image saliency [61.40511574314069]
バックプロパゲーション画像のサリエンシは、入力中の個々のピクセルのモデル中心の重要性を推定することにより、モデル予測を説明することを目的としている。
CAMERASは、外部の事前処理を必要とせずに、高忠実度バックプロパゲーション・サリエンシ・マップを計算できる手法である。
論文 参考訳(メタデータ) (2021-06-20T08:20:56Z) - Scalable Semi-supervised Landmark Localization for X-ray Images using
Few-shot Deep Adaptive Graph [19.588348005574165]
完全に監視されたグラフベースの方法であるDAGに基づいて、少数のショットDAGと呼ばれる半監視された拡張を提案しました。
まず、ラベル付きデータ上でDAGモデルをトレーニングし、教師のSSLメカニズムを使用してラベル付きデータ上で事前トレーニングされたモデルを微調整する。
骨盤,手指,胸部ランドマーク検出タスクについて広範囲に検討を行った。
論文 参考訳(メタデータ) (2021-04-29T19:46:18Z) - Perceptual Loss for Robust Unsupervised Homography Estimation [1.2891210250935146]
BiHomEは、ソース視点からの歪んだ画像とターゲット視点からの対応する画像との間の特徴空間における距離を最小化する。
我々は、biHomEが合成COCOデータセットの最先端のパフォーマンスを達成することを示しています。
論文 参考訳(メタデータ) (2021-04-20T14:41:54Z) - Non-Homogeneous Haze Removal via Artificial Scene Prior and
Bidimensional Graph Reasoning [52.07698484363237]
本研究では,人工シーンの前置と2次元グラフ推論による不均質なヘイズ除去ネットワーク(nhrn)を提案する。
本手法は,単一画像デハジングタスクとハイザイ画像理解タスクの両方において,最先端アルゴリズムよりも優れた性能を実現する。
論文 参考訳(メタデータ) (2021-04-05T13:04:44Z) - Motion Basis Learning for Unsupervised Deep Homography Estimation with
Subspace Projection [27.68752841842823]
本稿では,教師なし深層ホモグラフィ推定のための新しいフレームワークを提案する。
本手法は,ホモグラフィベンチマークデータセットにおける最先端技術よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-03-29T05:51:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。