論文の概要: Visual Correspondence Hallucination: Towards Geometric Reasoning
- arxiv url: http://arxiv.org/abs/2106.09711v1
- Date: Thu, 17 Jun 2021 17:58:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-18 15:47:21.960667
- Title: Visual Correspondence Hallucination: Towards Geometric Reasoning
- Title(参考訳): 視覚対応幻覚 : 幾何学的推論に向けて
- Authors: Hugo Germain and Vincent Lepetit and Guillaume Bourmaud
- Abstract要約: 我々は,ネットワークをトレーニングして,応答者の位置上のピーク確率分布を出力する。
我々は、このネットワークが、目に見えない画像のペアの対応を幻覚することができることを実験的に実証した。
- 参考スコア(独自算出の注目度): 38.47125921410426
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Given a pair of partially overlapping source and target images and a keypoint
in the source image, the keypoint's correspondent in the target image can be
either visible, occluded or outside the field of view. Local feature matching
methods are only able to identify the correspondent's location when it is
visible, while humans can also hallucinate its location when it is occluded or
outside the field of view through geometric reasoning. In this paper, we bridge
this gap by training a network to output a peaked probability distribution over
the correspondent's location, regardless of this correspondent being visible,
occluded, or outside the field of view. We experimentally demonstrate that this
network is indeed able to hallucinate correspondences on unseen pairs of
images. We also apply this network to a camera pose estimation problem and find
it is significantly more robust than state-of-the-art local feature
matching-based competitors.
- Abstract(参考訳): 一対の重なり合うソース画像とターゲット画像と、ソース画像のキーポイントとが与えられた場合、対象画像のキーポイント対応部は、視野内、または視野外のいずれかを視認することができる。
局所的特徴マッチング手法は、可視時のみ対応者の位置を識別できるが、人間は、幾何学的推論によってその位置をオクルードしたり、視野の外側に表示したりすることもできる。
本稿では,ネットワークをトレーニングしてこのギャップを橋渡しし,対応者の位置のピーク確率分布を,その対応者が目に見えるか,無視されているか,あるいは視野の外にあるかに関わらず出力する。
実験により,このネットワークが認識できない画像の対の対応を幻覚的に表現できることを実証した。
また、このネットワークをカメラポーズ推定問題に適用し、最先端のローカル特徴マッチングベースの競合よりもはるかに堅牢であることを示す。
関連論文リスト
- Breaking the Frame: Visual Place Recognition by Overlap Prediction [53.17564423756082]
本稿では,重なり合う予測に基づく新しい視覚的位置認識手法 VOP を提案する。
VOPは、Vision Transformerのバックボーンを使用してパッチレベルの埋め込みを取得することで、コビジュアブルなイメージセクションを進める。
提案手法では,データベース画像の重複点の評価に投票機構を用いる。
論文 参考訳(メタデータ) (2024-06-23T20:00:20Z) - Exploring Geometry of Blind Spots in Vision Models [56.47644447201878]
CNNやトランスフォーマーのような視覚モデルにおける過敏性の現象について検討する。
本稿では,入力空間に対する信頼度の高い領域を反復的に探索するレベルセットトラバースアルゴリズムを提案する。
モデルが高い信頼度を維持するこれらの連結高次元領域の範囲を推定する。
論文 参考訳(メタデータ) (2023-10-30T18:00:33Z) - Doppelgangers: Learning to Disambiguate Images of Similar Structures [76.61267007774089]
幻像マッチングは、人間が区別することは困難であり、3D再構成アルゴリズムに誤った結果をもたらす可能性がある。
本稿では,視覚的曖昧化に対する学習に基づくアプローチを提案し,イメージペア上でのバイナリ分類タスクとして定式化する。
本手法は, 難易度の高い画像の一致を識別し, SfMパイプラインに統合することにより, 正確な3次元再構成を実現できることを示す。
論文 参考訳(メタデータ) (2023-09-05T17:50:36Z) - Pentagon-Match (PMatch): Identification of View-Invariant Planar Feature
for Local Feature Matching-Based Homography Estimation [2.240487187855135]
コンピュータビジョンにおいて、画像間の正確な点対応を見つけることは、画像縫合、画像検索、視覚的位置決めなど、多くのアプリケーションにおいて重要な役割を担っている。
これらの研究の多くは、RANSACのようなサンプリング手法が使われる前に局所的な特徴のマッチングに焦点を合わせ、初期マッチング結果の検証を行う。
ペンタゴン・マッチ (Pentagon-Match, PMatch) は、ペンタゴンをランダムにサンプリングし、初期一致したキーポイントの正当性を検証するために提案される。
論文 参考訳(メタデータ) (2023-05-27T12:41:23Z) - Feature-based Image Matching for Identifying Individual K\=ak\=a [0.0]
本報告では、個々のk=ak=aを識別する新しい用途のための教師なし特徴ベース画像マッチングパイプラインについて検討する。
クラスタリングに類似性ネットワークを適用することで、個々の鳥を識別する現在の教師付きアプローチの弱点に対処する。
機能ベースの画像マッチングは、既存の教師付きアプローチに代わる実行可能な代替手段を提供するために、類似性ネットワークで使用できると結論付けている。
論文 参考訳(メタデータ) (2023-01-17T03:43:19Z) - A Geometrically Constrained Point Matching based on View-invariant
Cross-ratios, and Homography [2.050924050557755]
ビュー不変クロス比(CR)に基づく初期一致SIFTキーポイントの正当性検証のための幾何学的制約付きアルゴリズムを提案する。
これらのキーポイントからペンタゴンをランダムに形成し、画像間の形状と位置をCRとマッチングすることにより、堅牢な平面領域推定を効率的に行うことができる。
実験結果から,複数平面領域の複数シーンで良好な結果が得られることがわかった。
論文 参考訳(メタデータ) (2022-11-06T01:55:35Z) - LEAD: Self-Supervised Landmark Estimation by Aligning Distributions of
Feature Similarity [49.84167231111667]
自己監督型ランドマーク検出における既存の研究は、画像から高密度(ピクセルレベルの)特徴表現を学習することに基づいている。
自己教師付き方式で高密度同変表現の学習を強化するアプローチを提案する。
機能抽出器にそのような先行性があることは,アノテーションの数が大幅に制限されている場合でも,ランドマーク検出に役立ちます。
論文 参考訳(メタデータ) (2022-04-06T17:48:18Z) - Self-supervised Segmentation via Background Inpainting [96.10971980098196]
移動可能なカメラで撮影された単一の画像で、自己教師付き検出とセグメンテーションのアプローチを導入する。
我々は、提案に基づくセグメンテーションネットワークのトレーニングに利用する自己教師付き損失関数を利用する。
本手法は,標準ベンチマークから視覚的に切り離された画像の人間の検出とセグメント化に応用し,既存の自己監督手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-11-11T08:34:40Z) - An End-to-End Network for Co-Saliency Detection in One Single Image [47.35448093528382]
単一の画像内の共分散検出は、まだ十分に対処されていない一般的な視覚問題である。
本研究では、バックボーンネットと2つの分岐ネットからなる新しいエンドツーエンドのトレーニングネットワークを提案する。
本研究では,2,019個の自然画像のデータセットを各画像に共分散して構築し,提案手法の評価を行う。
論文 参考訳(メタデータ) (2019-10-25T16:00:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。