論文の概要: Image Matching across Wide Baselines: From Paper to Practice
- arxiv url: http://arxiv.org/abs/2003.01587v5
- Date: Thu, 11 Feb 2021 13:50:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-26 23:03:13.107793
- Title: Image Matching across Wide Baselines: From Paper to Practice
- Title(参考訳): 幅広いベースラインにわたる画像マッチング:紙から実践へ
- Authors: Yuhe Jin and Dmytro Mishkin and Anastasiia Mishchuk and Jiri Matas and
Pascal Fua and Kwang Moo Yi and Eduard Trulls
- Abstract要約: 局所的な特徴とロバストな推定アルゴリズムの包括的なベンチマークを導入する。
パイプラインのモジュール構造は、さまざまなメソッドの容易な統合、構成、組み合わせを可能にします。
適切な設定で、古典的な解決策は依然として芸術の知覚された状態を上回る可能性があることを示す。
- 参考スコア(独自算出の注目度): 80.9424750998559
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce a comprehensive benchmark for local features and robust
estimation algorithms, focusing on the downstream task -- the accuracy of the
reconstructed camera pose -- as our primary metric. Our pipeline's modular
structure allows easy integration, configuration, and combination of different
methods and heuristics. This is demonstrated by embedding dozens of popular
algorithms and evaluating them, from seminal works to the cutting edge of
machine learning research. We show that with proper settings, classical
solutions may still outperform the perceived state of the art.
Besides establishing the actual state of the art, the conducted experiments
reveal unexpected properties of Structure from Motion (SfM) pipelines that can
help improve their performance, for both algorithmic and learned methods. Data
and code are online https://github.com/vcg-uvic/image-matching-benchmark,
providing an easy-to-use and flexible framework for the benchmarking of local
features and robust estimation methods, both alongside and against
top-performing methods. This work provides a basis for the Image Matching
Challenge https://vision.uvic.ca/image-matching-challenge.
- Abstract(参考訳): 我々は,局所的特徴量とロバスト推定アルゴリズムの包括的なベンチマークを導入し,下方課題 -- 再構成されたカメラポーズの精度 -- を主要な指標とした。
私たちのパイプラインのモジュール構造は、さまざまなメソッドとヒューリスティックの統合、構成、組み合わせを容易にします。
これは、数十の一般的なアルゴリズムを組み込んで、セレントな作品から機械学習研究の最先端まで、それらを評価することで実証される。
適切な設定で、古典的な解決策は依然として芸術の知覚された状態を上回る可能性があることを示す。
実験では、実際の技術の確立に加えて、アルゴリズムと学習方法の両方において、パフォーマンス向上に役立つStructure from Motion(SfM)パイプラインの予期せぬ特性を明らかにした。
データとコードはオンラインhttps://github.com/vcg-uvic/image-matching-benchmarkで、ローカル機能と堅牢な推定メソッドをベンチマークするための、使いやすい柔軟なフレームワークを提供する。
この作品は、画像マッチングチャレンジ https://vision.uvic.ca/image-matching-challengeの基礎を提供する。
関連論文リスト
- Pushing the Efficiency Limit Using Structured Sparse Convolutions [82.31130122200578]
本稿では,画像の固有構造を利用して畳み込みフィルタのパラメータを削減する構造的スパース畳み込み(SSC)を提案する。
我々は、SSCが効率的なアーキテクチャにおける一般的なレイヤ(奥行き、グループ回り、ポイント回りの畳み込み)の一般化であることを示す。
SSCに基づくアーキテクチャは、CIFAR-10、CIFAR-100、Tiny-ImageNet、ImageNet分類ベンチマークのベースラインと比較して、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2022-10-23T18:37:22Z) - TopicFM: Robust and Interpretable Feature Matching with Topic-assisted [8.314830611853168]
本稿では,効率,堅牢,解釈可能な画像マッチングアーキテクチャを提案する。
TopicFMと呼ばれる新しい特徴マッチングモジュールを導入し、画像間で同じ空間構造をトピックに大まかに整理する。
提案手法は,計算量を削減するために,共可視領域でのみマッチングを行うことができる。
論文 参考訳(メタデータ) (2022-07-01T10:39:14Z) - A modular software framework for the design and implementation of
ptychography algorithms [55.41644538483948]
我々は,Pychographyデータセットをシミュレートし,最先端の再構築アルゴリズムをテストすることを目的とした,新しいptychographyソフトウェアフレームワークであるSciComを紹介する。
その単純さにもかかわらず、ソフトウェアはPyTorchインターフェースによる高速化処理を利用する。
結果は合成データと実データの両方で示される。
論文 参考訳(メタデータ) (2022-05-06T16:32:37Z) - Towards a Unified Approach to Homography Estimation Using Image Features
and Pixel Intensities [0.0]
ホモグラフィ行列は、様々な視覚に基づくロボットタスクにおいて重要な要素である。
伝統的に、ホモグラフィー推定アルゴリズムは特徴ベースまたは強度ベースに分類される。
本稿では,2つのクラスを1つの非線形最適化手順に統合するハイブリッド手法を提案する。
論文 参考訳(メタデータ) (2022-02-20T02:47:05Z) - Summarize and Search: Learning Consensus-aware Dynamic Convolution for
Co-Saliency Detection [139.10628924049476]
人間は、まず、グループ全体のコンセンサス知識を要約し、その後、各画像内の対応するオブジェクトを検索することで、共相検出を行う。
以前の方法は、通常、最初のプロセスで堅牢性、スケーラビリティ、安定性を欠き、第2のプロセスでイメージ機能とコンセンサス機能を融合させる。
本稿では,新たなコンセンサスを考慮した動的畳み込みモデルを提案する。
論文 参考訳(メタデータ) (2021-10-01T12:06:42Z) - Video Frame Interpolation via Structure-Motion based Iterative Fusion [19.499969588931414]
映像フレーム補間のための構造運動に基づく反復融合法を提案する。
観客が前景や背景の物体に対して異なる視覚的嗜好を持つという観察に触発されて,私たちは初めて,映像フレーム補間作業の評価プロセスにサリエンシマスクを使うことを提案する。
論文 参考訳(メタデータ) (2021-05-11T22:11:17Z) - How Fine-Tuning Allows for Effective Meta-Learning [50.17896588738377]
MAMLライクなアルゴリズムから派生した表現を解析するための理論的フレームワークを提案する。
我々は,勾配降下による微調整により得られる最良予測器のリスク境界を提示し,アルゴリズムが共有構造を有効活用できることを実証する。
この分離の結果、マイニングベースのメソッド、例えばmamlは、少数ショット学習における"frozen representation"目標を持つメソッドよりも優れている。
論文 参考訳(メタデータ) (2021-05-05T17:56:00Z) - Deep Keypoint-Based Camera Pose Estimation with Geometric Constraints [80.60538408386016]
連続するフレームから相対的なカメラのポーズを推定することは、視覚計測の基本的な問題である。
本稿では,検出,特徴抽出,マッチング,外乱除去のための学習可能なモジュールで構成されるエンドツーエンドのトレーニング可能なフレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-29T21:41:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。