論文の概要: Learning and Crafting for the Wide Multiple Baseline Stereo
- arxiv url: http://arxiv.org/abs/2112.12027v1
- Date: Wed, 22 Dec 2021 16:52:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-23 15:22:43.595018
- Title: Learning and Crafting for the Wide Multiple Baseline Stereo
- Title(参考訳): ワイドマルチベースラインステレオの学習と製作
- Authors: Dmytro Mishkin
- Abstract要約: この論文は、広い多重ベースラインステレオ(WxBS)問題を導入している。
WxBSは複数の画像取得因子が異なる画像のマッチングを考える。
基礎的真理、評価基準、ベースラインを備えた新しいデータセットが導入された。
- 参考スコア(独自算出の注目度): 4.7210697296108926
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This thesis introduces the wide multiple baseline stereo (WxBS) problem.
WxBS, a generalization of the standard wide baseline stereo problem, considers
the matching of images that simultaneously differ in more than one image
acquisition factor such as viewpoint, illumination, sensor type, or where
object appearance changes significantly, e.g., over time. A new dataset with
the ground truth, evaluation metric and baselines has been introduced.
The thesis presents the following improvements of the WxBS pipeline. (i) A
loss function, called HardNeg, for learning a local image descriptor that
relies on hard negative mining within a mini-batch and on the maximization of
the distance between the closest positive and the closest negative patches.
(ii) The descriptor trained with the HardNeg loss, called HardNet, is compact
and shows state-of-the-art performance in standard matching, patch verification
and retrieval benchmarks. (iii) A method for learning the affine shape,
orientation, and potentially other parameters related to geometric and
appearance properties of local features. (iv) A tentative correspondences
generation strategy which generalizes the standard first to second closest
distance ratio is presented. The selection strategy, which shows performance
superior to the standard method, is applicable to either hard-engineered
descriptors like SIFT, LIOP, and MROGH or deeply learned like HardNet. (v) A
feedback loop is introduced for the two-view matching problem, resulting in
MODS -- matching with on-demand view synthesis -- algorithm. MODS is an
algorithm that handles a viewing angle difference even larger than the previous
state-of-the-art ASIFT algorithm, without a significant increase of
computational cost over "standard" wide and narrow baseline approaches. Last,
but not least, a comprehensive benchmark for local features and robust
estimation algorithms is introduced.
- Abstract(参考訳): この論文は、広い多重ベースラインステレオ(WxBS)問題を導入している。
標準的なワイドベースラインステレオ問題の一般化であるWxBSは、視点、照明、センサータイプ、時間とともにオブジェクトの外観が著しく変化するような複数の画像取得因子で同時に異なる画像のマッチングを考える。
基底真理、評価基準、ベースラインを備えた新しいデータセットが導入された。
この論文は、WxBSパイプラインの以下の改善を示している。
(i)ミニバッチ内の硬い負のマイニングと、最も近い正のパッチと最も近い負のパッチとの間の距離の最大化に依存する局所的な画像記述子を学ぶための、hardnegと呼ばれる損失関数。
(ii) HardNetと呼ばれるHardNeg損失で訓練された記述子はコンパクトで、標準マッチング、パッチ検証、検索ベンチマークで最先端のパフォーマンスを示す。
(iii)局所的特徴の幾何学的・外観的性質に関連するアフィン形状、向き、および潜在的に他のパラメータを学習する方法。
(iv)第1〜第2の距離比を一般化した仮対応生成戦略を示す。
標準メソッドよりも優れたパフォーマンスを示す選択戦略は、SIFT、LIOP、MROGHなどのハードエンジニアリング記述子、あるいはHardNetのように深く学習されたものに適用される。
(v)2ビューマッチング問題に対してフィードバックループを導入し、MODS -- オンデマンドビュー合成とマッチングする -- アルゴリズムを実現する。
MODS は従来の ASIFT アルゴリズムよりもはるかに大きい視角差を処理するアルゴリズムであり、"標準" で幅の狭いベースラインアプローチよりも計算コストが大幅に増加することはない。
最後に、ローカル機能とロバストな推定アルゴリズムの包括的なベンチマークが紹介されている。
関連論文リスト
- Match and Locate: low-frequency monocular odometry based on deep feature
matching [0.65268245109828]
本稿では,1台のカメラしか必要としないロボットオドメトリーの新たなアプローチを提案する。
アプローチは、深い特徴マッチングモデルを用いて、ビデオストリームの連続フレーム間の画像特徴のマッチングに基づいている。
本研究では,AISG-SLAビジュアルローカライゼーションチャレンジにおける手法の性能評価を行い,計算効率が高く,実装が容易であるにもかかわらず,競合する結果が得られた。
論文 参考訳(メタデータ) (2023-11-16T17:32:58Z) - Boosting Few-shot Fine-grained Recognition with Background Suppression
and Foreground Alignment [53.401889855278704]
FS-FGR (Few-shot Fine-fine Recognition) は、限られたサンプルの助けを借りて、新しいきめ細かなカテゴリを認識することを目的としている。
本研究では,背景アクティベーション抑制 (BAS) モジュール,フォアグラウンドオブジェクトアライメント (FOA) モジュール,および局所的局所的(L2L) 類似度測定器からなる2段階の背景アライメントとフォアグラウンドアライメントフレームワークを提案する。
複数のベンチマークで行った実験により,提案手法は既存の最先端技術よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2022-10-04T07:54:40Z) - PatchMVSNet: Patch-wise Unsupervised Multi-View Stereo for
Weakly-Textured Surface Reconstruction [2.9896482273918434]
本稿では,多視点画像の制約を活かしたロバストな損失関数を提案し,あいまいさを緩和する。
我々の戦略は任意の深さ推定フレームワークで実装することができ、任意の大規模MVSデータセットでトレーニングすることができる。
提案手法は,DTU,タンク・アンド・テンプル,ETH3Dなどの一般的なベンチマーク上での最先端手法の性能に達する。
論文 参考訳(メタデータ) (2022-03-04T07:05:23Z) - Spatial-spectral Hyperspectral Image Classification via Multiple Random
Anchor Graphs Ensemble Learning [88.60285937702304]
本稿では,複数のランダムアンカーグラフアンサンブル学習(RAGE)を用いた空間スペクトルHSI分類手法を提案する。
まず、各選択されたバンドのより記述的な特徴を抽出し、局所的な構造と領域の微妙な変化を保存するローカルバイナリパターンを採用する。
次に,アンカーグラフの構成に適応隣接代入を導入し,計算複雑性を低減した。
論文 参考訳(メタデータ) (2021-03-25T09:31:41Z) - Self-supervised Geometric Perception [96.89966337518854]
自己教師付き幾何知覚(self-supervised geometric perception)は、基底幾何モデルラベルなしで対応マッチングのための特徴記述子を学ぶためのフレームワークである。
また,SGPは,地上トラスラベルを用いて訓練した教師付きオークルよりも同等か優れる最先端性能を達成できることを示す。
論文 参考訳(メタデータ) (2021-03-04T15:34:43Z) - Making Affine Correspondences Work in Camera Geometry Computation [62.7633180470428]
局所的な特徴は、ポイント・ツー・ポイント対応ではなく、リージョン・ツー・リージョンを提供する。
本稿では,全モデル推定パイプラインにおいて,地域間マッチングを効果的に活用するためのガイドラインを提案する。
実験により、アフィンソルバはより高速な実行時にポイントベースソルバに匹敵する精度を達成できることが示された。
論文 参考訳(メタデータ) (2020-07-20T12:07:48Z) - ProAlignNet : Unsupervised Learning for Progressively Aligning Noisy
Contours [12.791313859673187]
ProAlignNetは、輪郭形状間の大規模なミスアライメントと複雑な変換を説明できる。
近接感度および局所形状依存類似度測定値の上界から導出される新しい損失関数を用いて学習する。
実世界の2つの応用において、提案したモデルは最先端の手法よりも一貫して優れている。
論文 参考訳(メタデータ) (2020-05-23T14:56:14Z) - RANSAC-Flow: generic two-stage image alignment [53.11926395028508]
単純な教師なしのアプローチは、様々なタスクにおいて驚くほどうまく機能することを示す。
その単純さにもかかわらず、我々の手法は様々なタスクやデータセットで競合する結果を示す。
論文 参考訳(メタデータ) (2020-04-03T12:37:58Z) - Image Matching across Wide Baselines: From Paper to Practice [80.9424750998559]
局所的な特徴とロバストな推定アルゴリズムの包括的なベンチマークを導入する。
パイプラインのモジュール構造は、さまざまなメソッドの容易な統合、構成、組み合わせを可能にします。
適切な設定で、古典的な解決策は依然として芸術の知覚された状態を上回る可能性があることを示す。
論文 参考訳(メタデータ) (2020-03-03T15:20:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。