論文の概要: RoMa: Revisiting Robust Losses for Dense Feature Matching
- arxiv url: http://arxiv.org/abs/2305.15404v1
- Date: Wed, 24 May 2023 17:59:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-25 13:43:38.192166
- Title: RoMa: Revisiting Robust Losses for Dense Feature Matching
- Title(参考訳): RoMa: 複雑な特徴マッチングのためのロバストなロバストな損失を再考
- Authors: Johan Edstedt, Qiyu Sun, Georg B\"okman, M{\aa}rten Wadenb\"ack,
Michael Felsberg
- Abstract要約: マルコフ連鎖の観点から、マッチングに対するロバストな損失を再考する。
提案手法は,最先端技術と比較して大幅に改善されている。
- 参考スコア(独自算出の注目度): 15.654688635092953
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Dense feature matching is an important computer vision task that involves
estimating all correspondences between two images of a 3D scene. In this paper,
we revisit robust losses for matching from a Markov chain perspective, yielding
theoretical insights and large gains in performance. We begin by constructing a
unifying formulation of matching as a Markov chain, based on which we identify
two key stages which we argue should be decoupled for matching. The first is
the coarse stage, where the estimated result needs to be globally consistent.
The second is the refinement stage, where the model needs precise localization
capabilities. Inspired by the insight that these stages concern distinct
issues, we propose a coarse matcher following the regression-by-classification
paradigm that provides excellent globally consistent, albeit not exactly
localized, matches. This is followed by a local feature refinement stage using
well-motivated robust regression losses, yielding extremely precise matches.
Our proposed approach, which we call RoMa, achieves significant improvements
compared to the state-of-the-art. Code is available at
https://github.com/Parskatt/RoMa
- Abstract(参考訳): Dense機能マッチングは、3Dシーンの2つの画像間のすべての対応を推定する重要なコンピュータビジョンタスクである。
本稿では,マルコフ連鎖の観点からのマッチングにおけるロバストな損失を再考し,理論的洞察と性能の大きな向上をもたらす。
まず、マッチングをマルコフ連鎖として統一的に定式化することから始め、マッチングのために分離すべき2つの重要な段階を特定する。
1つ目は粗い段階であり、そこでは推定結果がグローバルに一貫性を持たなければならない。
2つ目は、モデルが正確なローカライゼーション機能を必要とするリファインメントステージである。
これらの段階が異なる問題を考慮しているという洞察に触発されて、我々は、完全に局所化されていない優れたグローバルな一貫性を提供する回帰分類パラダイムに従う粗いマッチングを提案する。
これに続き、よく動機づけられたロバストな回帰損失を用いて、局所的な機能改善ステージが続き、非常に正確な一致が得られる。
提案手法はRoMaと呼ばれ,最先端技術と比較して大幅に改善されている。
コードはhttps://github.com/Parskatt/RoMaで入手できる。
関連論文リスト
- Large-scale Point Cloud Registration Based on Graph Matching
Optimization [30.92028761652611]
アンダーライン最適化に基づくアンダーライングラフアンダーラインマッチングを提案する。
提案手法は3DMatch/3DLoMatchベンチマークとKITTIベンチマークで評価されている。
論文 参考訳(メタデータ) (2023-02-12T03:29:35Z) - Okapi: Generalising Better by Making Statistical Matches Match [7.392460712829188]
オカピは、オンライン統計マッチングに基づく頑健な半教師あり学習のためのシンプルで効率的で汎用的な方法である。
提案手法では, 最寄りのマッチング手法を用いて, 整合性損失に対するクロスドメインビューを生成する。
経験的リスクの最小化を改善するために、余分な遅延のないデータを活用することは実際に可能であることを示す。
論文 参考訳(メタデータ) (2022-11-07T12:41:17Z) - REGTR: End-to-end Point Cloud Correspondences with Transformers [79.52112840465558]
我々は、注意機構が明示的な特徴マッチングとRANSACの役割を置き換えることができると推測する。
本稿では,最終文集合を直接予測するエンドツーエンドフレームワークを提案する。
提案手法は3DMatchおよびModelNetベンチマークにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-28T06:01:00Z) - Deep Kernelized Dense Geometric Matching [14.274582421372308]
深層カーネルを用いた連続確率回帰タスクとしてグローバル対応推定を定式化することを提案する。
提案手法は,競争力のあるHPatchesとYFCC100mベンチマークの最先端技術と比較して,大幅な改善を実現している。
論文 参考訳(メタデータ) (2022-02-01T18:58:46Z) - Efficient Person Search: An Anchor-Free Approach [86.45858994806471]
パーソンサーチは、クエリーの人物を、リアルで切り刻まれていない画像から、同時にローカライズし、識別することを目的としている。
この目標を達成するために、最先端モデルは通常、Faster R-CNNのような2段階検出器にre-idブランチを追加する。
本研究では,この課題に対処するためのアンカーフリーな手法を提案する。
論文 参考訳(メタデータ) (2021-09-01T07:01:33Z) - Warp Consistency for Unsupervised Learning of Dense Correspondences [116.56251250853488]
密接な対応を学習する上で重要な課題は、実画像対に対する地道整合の欠如である。
密な対応回帰のための教師なし学習目標であるWarp Consistencyを提案する。
私たちのアプローチは、MegaDepth、RobotCar、TSSなど、いくつかの挑戦的なベンチマークに新しい最先端を設定します。
論文 参考訳(メタデータ) (2021-04-07T17:58:22Z) - Higher Performance Visual Tracking with Dual-Modal Localization [106.91097443275035]
Visual Object Tracking (VOT)は、堅牢性と正確性の両方に同期性を必要とする。
ONRによるロバストなローカリゼーション抑制器とOFCによるターゲットセンターへの正確なローカリゼーションにより、ターゲットローカリゼーションのためのデュアルモーダルフレームワークを提案します。
論文 参考訳(メタデータ) (2021-03-18T08:47:56Z) - Patch2Pix: Epipolar-Guided Pixel-Level Correspondences [38.38520763114715]
Patch2Pixは,これらの提案によって定義された局所領域から画素レベルのマッチングを回帰することで,提案手法を洗練する新しい改良ネットワークである。
改良ネットワークは画像マッチング, ホモグラフィー推定, ローカライゼーションタスクにおいて, 対応ネットワークの性能を大幅に向上させることを示す。
論文 参考訳(メタデータ) (2020-12-03T13:44:02Z) - Robust Person Re-Identification through Contextual Mutual Boosting [77.1976737965566]
本研究では,歩行者の局地化を目的としたコンテキスト相互ブースティングネットワーク(CMBN)を提案する。
歩行者をローカライズし、文脈情報と統計的推測を効果的に活用することで特徴を再検討する。
ベンチマークの実験は、最先端のアーキテクチャと比較してアーキテクチャの優位性を示している。
論文 参考訳(メタデータ) (2020-09-16T06:33:35Z) - Pseudo-Convolutional Policy Gradient for Sequence-to-Sequence
Lip-Reading [96.48553941812366]
唇読解は唇運動系列から音声内容を推測することを目的としている。
seq2seqモデルの伝統的な学習プロセスには2つの問題がある。
本稿では,これら2つの問題に対処するために,PCPGに基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2020-03-09T09:12:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。