論文の概要: Semi-supervised Deep Large-baseline Homography Estimation with
Progressive Equivalence Constraint
- arxiv url: http://arxiv.org/abs/2212.02763v1
- Date: Tue, 6 Dec 2022 05:28:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-07 16:51:19.208271
- Title: Semi-supervised Deep Large-baseline Homography Estimation with
Progressive Equivalence Constraint
- Title(参考訳): プログレッシブ同値制約を用いた半教師付き深大ベースラインホモグラフィ推定
- Authors: Hai Jiang, Haipeng Li, Yuhang Lu, Songchen Han, and Shuaicheng Liu
- Abstract要約: ホログラフィー推定は, 画像オーバーレイが低く, 受容野が限られているため, 大規模なベースラインの場合, 誤りである。
本稿では,大規模ベースラインのホモグラフィを複数の中間データに変換することによって,プログレッシブな推定手法を提案する。
提案手法は,小規模なベースラインシーンにおける競合性能を維持しつつ,大規模ベースラインシーンにおける最先端のパフォーマンスを実現する。
- 参考スコア(独自算出の注目度): 25.022907946911033
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Homography estimation is erroneous in the case of large-baseline due to the
low image overlay and limited receptive field. To address it, we propose a
progressive estimation strategy by converting large-baseline homography into
multiple intermediate ones, cumulatively multiplying these intermediate items
can reconstruct the initial homography. Meanwhile, a semi-supervised homography
identity loss, which consists of two components: a supervised objective and an
unsupervised objective, is introduced. The first supervised loss is acting to
optimize intermediate homographies, while the second unsupervised one helps to
estimate a large-baseline homography without photometric losses. To validate
our method, we propose a large-scale dataset that covers regular and
challenging scenes. Experiments show that our method achieves state-of-the-art
performance in large-baseline scenes while keeping competitive performance in
small-baseline scenes. Code and dataset are available at
https://github.com/megvii-research/LBHomo.
- Abstract(参考訳): ホモグラフィ推定は、低画像オーバーレイと限られた受容場のため、大ベースラインの場合、誤りである。
そこで本研究では,大ベースラインホモグラフィを複数の中間ホモグラフィに変換し,これらの中間項目を累積的に乗算することで初期ホモグラフィを再構築する手法を提案する。
一方,教師付き目的と教師なし目的の2つの構成要素からなる半教師付きホモグラフィの同一性損失が導入された。
第1の教師なし損失は中間ホモグラフィーを最適化するために作用し、第2の教師なし損失は、測光損失なしで大きなベースラインのホモグラフィーを推定するのに役立っている。
そこで本研究では,本手法を検証するために,規則的かつ困難な場面をカバーする大規模データセットを提案する。
実験により,本手法は,小規模なベースラインシーンにおける競合性能を維持しつつ,大規模ベースラインシーンにおける最先端のパフォーマンスを実現することを示す。
コードとデータセットはhttps://github.com/megvii-research/lbhomoで入手できる。
関連論文リスト
- Topograph: An efficient Graph-Based Framework for Strictly Topology Preserving Image Segmentation [78.54656076915565]
位相的正しさは多くの画像分割タスクにおいて重要な役割を果たす。
ほとんどのネットワークは、Diceのようなピクセル単位の損失関数を使って、トポロジカルな精度を無視して訓練されている。
トポロジ的に正確な画像セグメンテーションのための新しいグラフベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-05T16:20:14Z) - Consistency Regularisation for Unsupervised Domain Adaptation in Monocular Depth Estimation [15.285720572043678]
整合性に基づく半教師付き学習問題として,単眼深度推定のための教師なし領域適応を定式化する。
複数の拡張ビューにまたがって一貫性を保ちながら、ソースドメイン上の予測を規則化するペアワイズ損失関数を導入する。
実験では, KITTI と NYUv2 の標準深度推定ベンチマークを用いて,最先端の結果を示す。
論文 参考訳(メタデータ) (2024-05-27T23:32:06Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Unsupervised Homography Estimation with Coplanarity-Aware GAN [39.477228263736905]
画像ペアからホモグラフィーを推定することは、画像アライメントの根本的な問題である。
HomoGANは、教師なしのホモグラフィー推定を誘導し、支配的な平面に焦点を合わせるように設計されている。
その結果, マッチング誤差は従来のSOTA法よりも22%低いことがわかった。
論文 参考訳(メタデータ) (2022-05-08T09:26:47Z) - Semi-supervised Semantic Segmentation with Directional Context-aware
Consistency [66.49995436833667]
我々は、ラベル付きデータの小さなセットに、全くラベル付けされていない画像のより大きなコレクションを提供する半教師付きセグメンテーション問題に焦点をあてる。
好ましいハイレベル表現は、自己認識を失わずにコンテキスト情報をキャプチャするべきである。
我々は,DCロス(Directional Contrastive Loss)を画素対ピクセルの整合性を達成するために提示する。
論文 参考訳(メタデータ) (2021-06-27T03:42:40Z) - Large-scale Unsupervised Semantic Segmentation [163.3568726730319]
本稿では, 大規模無教師付きセマンティックセマンティックセグメンテーション (LUSS) の新たな課題を提案する。
ImageNetデータセットに基づいて、120万のトレーニング画像と40万の高品質なセマンティックセグメンテーションアノテーションを用いた画像Net-Sデータセットを提案する。
論文 参考訳(メタデータ) (2021-06-06T15:02:11Z) - Perceptual Loss for Robust Unsupervised Homography Estimation [1.2891210250935146]
BiHomEは、ソース視点からの歪んだ画像とターゲット視点からの対応する画像との間の特徴空間における距離を最小化する。
我々は、biHomEが合成COCOデータセットの最先端のパフォーマンスを達成することを示しています。
論文 参考訳(メタデータ) (2021-04-20T14:41:54Z) - Motion Basis Learning for Unsupervised Deep Homography Estimation with
Subspace Projection [27.68752841842823]
本稿では,教師なし深層ホモグラフィ推定のための新しいフレームワークを提案する。
本手法は,ホモグラフィベンチマークデータセットにおける最先端技術よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-03-29T05:51:34Z) - Towards Unbiased COVID-19 Lesion Localisation and Segmentation via
Weakly Supervised Learning [66.36706284671291]
本研究では,画像レベルラベルのみに監視されたデータ駆動型フレームワークを提案する。
このフレームワークは、生成する対向ネットワークと病変特異的デコーダの助けを借りて、原画像から潜在的な病変を明示的に分離することができる。
論文 参考訳(メタデータ) (2021-03-01T06:05:49Z) - Edge-Preserving Guided Semantic Segmentation for VIPriors Challenge [3.435043566706133]
現在の最先端およびディープラーニングに基づくセマンティックセマンティックセグメンテーション技術は、よく訓練することは難しい。
付加的な事前情報を得るためのエッジ保存ガイダンスを提案する。
実験により,提案手法は小型のトレーニングセットで優れた性能が得られることを示した。
論文 参考訳(メタデータ) (2020-07-17T11:49:10Z) - Deep Semantic Matching with Foreground Detection and Cycle-Consistency [103.22976097225457]
深層ネットワークに基づく弱い教師付きセマンティックマッチングに対処する。
本研究では,背景乱れの影響を抑えるために,前景領域を明示的に推定する。
複数の画像にまたがって予測変換を強制し、幾何的に可視かつ一貫したサイクル一貫性の損失を発生させる。
論文 参考訳(メタデータ) (2020-03-31T22:38:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。