論文の概要: $\mathbb{X}$Resolution Correspondence Networks
- arxiv url: http://arxiv.org/abs/2012.09842v2
- Date: Wed, 24 Mar 2021 17:27:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-02 07:22:50.212251
- Title: $\mathbb{X}$Resolution Correspondence Networks
- Title(参考訳): $\mathbb{X}$Resolution Cor correspondingence Networks
- Authors: Georgi Tinchev, Shuda Li, Kai Han, David Mitchell, Rigas Kouskouridas
- Abstract要約: 本稿では,照明変化や視点変化,スタイルの違いに挑戦しながら,重なり合う視野を持つ対の像間の正確な密接な対応を確立することを目的とする。
- 参考スコア(独自算出の注目度): 15.214155342197474
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we aim at establishing accurate dense correspondences between
a pair of images with overlapping field of view under challenging illumination
variation, viewpoint changes, and style differences. Through an extensive
ablation study of the state-of-the-art correspondence networks, we surprisingly
discovered that the widely adopted 4D correlation tensor and its related
learning and processing modules could be de-parameterised and removed from
training with merely a minor impact over the final matching accuracy. Disabling
these computational expensive modules dramatically speeds up the training
procedure and allows to use 4 times bigger batch size, which in turn
compensates for the accuracy drop. Together with a multi-GPU inference stage,
our method facilitates the systematic investigation of the relationship between
matching accuracy and up-sampling resolution of the native testing images from
1280 to 4K. This leads to discovery of the existence of an optimal resolution
$\mathbb{X}$ that produces accurate matching performance surpassing the
state-of-the-art methods particularly over the lower error band on public
benchmarks for the proposed network.
- Abstract(参考訳): 本稿では,照明変化や視点変化,スタイルの違いに挑戦しながら,重なり合う視野を持つ対の像間の正確な密接な対応を確立することを目的とする。
最先端の通信網の広範囲にわたるアブレーション研究により, 広く採用されている4次元相関テンソルとその関連学習・処理モジュールが, 最終的な一致精度よりもわずかに小さな影響で, トレーニングから切り離され, 除去されることがわかった。
これらの計算コストの高いモジュールを無効にすることで、トレーニング手順を劇的にスピードアップし、バッチサイズを4倍に拡大することが可能になります。
提案手法は,マルチGPU推論の段階とともに,1280~4Kのネイティブテスト画像のマッチング精度とアップサンプリング解像度の関係を系統的に検討する。
これにより、提案したネットワークの公開ベンチマークにおいて、特に低いエラー帯域を超越した最先端の手法よりも正確なマッチング性能を実現する最適解像度$\mathbb{X}$の存在が発見された。
関連論文リスト
- HomoMatcher: Dense Feature Matching Results with Semi-Dense Efficiency by Homography Estimation [39.48940223810725]
画像ペア間の特徴マッチングは、SLAMのような多くのアプリケーションを駆動するコンピュータビジョンの基本的な問題である。
本稿では,セミセンスマッチングフレームワークにおけるファインマッチングモジュールの強化に焦点をあてる。
我々は、粗いマッチングから得られたパッチ間の視点マッピングを生成するために、軽量で効率的なホモグラフィ推定ネットワークを用いる。
論文 参考訳(メタデータ) (2024-11-11T04:05:12Z) - Forgery-aware Adaptive Transformer for Generalizable Synthetic Image
Detection [106.39544368711427]
本研究では,様々な生成手法から偽画像を検出することを目的とした,一般化可能な合成画像検出の課題について検討する。
本稿では,FatFormerという新しいフォージェリー適応トランスフォーマー手法を提案する。
提案手法は, 平均98%の精度でGANを観測し, 95%の精度で拡散モデルを解析した。
論文 参考訳(メタデータ) (2023-12-27T17:36:32Z) - CalibFormer: A Transformer-based Automatic LiDAR-Camera Calibration Network [11.602943913324653]
CalibFormerは自動LiDARカメラキャリブレーションのためのエンドツーエンドネットワークである。
高精細度表現を実現するために、複数のカメラ層とLiDAR画像層を集約する。
平均翻訳誤差は0.8751 Mathrmcm$, 平均回転誤差は0.0562 circ$であった。
論文 参考訳(メタデータ) (2023-11-26T08:59:30Z) - ScaleCrafter: Tuning-free Higher-Resolution Visual Generation with
Diffusion Models [126.35334860896373]
本研究では,事前学習した拡散モデルから,トレーニング画像サイズよりもはるかに高解像度で画像を生成する能力について検討する。
注意ベースや共同拡散アプローチのような、高分解能な生成のための既存の研究は、これらの問題にうまく対処できない。
本稿では,推論中の畳み込み知覚場を動的に調整できる簡易かつ効果的な再拡張法を提案する。
論文 参考訳(メタデータ) (2023-10-11T17:52:39Z) - MMNet: Multi-Collaboration and Multi-Supervision Network for Sequential
Deepfake Detection [81.59191603867586]
シークエンシャルディープフェイク検出は、回復のための正しいシーケンスで偽の顔領域を特定することを目的としている。
偽画像の復元には、逆変換を実装するための操作モデルの知識が必要である。
顔画像の空間スケールや逐次順列化を扱うマルチコラボレーション・マルチスーパービジョンネットワーク(MMNet)を提案する。
論文 参考訳(メタデータ) (2023-07-06T02:32:08Z) - Breaking Modality Disparity: Harmonized Representation for Infrared and
Visible Image Registration [66.33746403815283]
シーン適応型赤外線と可視画像の登録を提案する。
我々は、異なる平面間の変形をシミュレートするためにホモグラフィーを用いる。
我々は、まず、赤外線と可視画像のデータセットが不一致であることを示す。
論文 参考訳(メタデータ) (2023-04-12T06:49:56Z) - LocalTrans: A Multiscale Local Transformer Network for Cross-Resolution
Homography Estimation [52.63874513999119]
クロスレゾリューション画像アライメントは、マルチスケールギガ撮影において重要な問題である。
既存のディープ・ホモグラフィー手法は、それらの間の対応の明示的な定式化を無視し、クロスレゾリューションの課題において精度が低下する。
本稿では,マルチモーダル入力間の対応性を明確に学習するために,マルチスケール構造内に埋め込まれたローカルトランスフォーマーネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-08T02:51:45Z) - Dynamic Resolution Network [40.64164953983429]
現代のCNNの入力解像度の冗長性については、完全には研究されていない。
本稿では,各サンプルに基づいて動的に分解能を決定できる新しい動的分解能ネットワーク(DRNet)を提案する。
DRNetは34%の精度で同様の性能を実現しているが、ImageNetのResNet-50に比べて10%の精度で1.4%の精度向上を実現している。
論文 参考訳(メタデータ) (2021-06-05T13:48:33Z) - Full Matching on Low Resolution for Disparity Estimation [84.45201205560431]
本研究では,マルチステージ完全一致格差推定法(MFM)を提案する。
また,低分解能3次元コストを見積もる代わりに,低分解能4次元ボリュームから全類似度スコアを段階的に切り離すことを実証した。
実験の結果,提案手法は,シーンフローやkitti 2012,kitti 2015のデータセットにおいて,より正確な不一致推定結果を達成し,最先端の手法を上回った。
論文 参考訳(メタデータ) (2020-12-10T11:11:23Z) - Dual-Resolution Correspondence Networks [20.004691262722265]
本稿では,Dual-Resolution Cor correspondingence Networks (DualRC-Net) を導入し,画素単位の対応を粗い方法で求める。
我々はHPatches、InLoc、Aachen Day-Nightなどの大規模公開ベンチマークで評価を行った。
論文 参考訳(メタデータ) (2020-06-16T00:42:43Z) - Efficient Neighbourhood Consensus Networks via Submanifold Sparse
Convolutions [41.43309123350792]
我々は,難解な対応問題に対して有望な性能を実証した近頃のNeighbourhood Consensus Networksを採用する。
メモリ消費の増大, 推論時間の増加, ローカル化の不十分さなど, 主な制約を克服する修正を提案する。
提案した修正により、メモリフットプリントと実行時間が10ドル以上削減され、同じ結果が得られます。
論文 参考訳(メタデータ) (2020-04-22T13:37:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。