Fugu-MT 論文翻訳(概要): RADA: Robust and Accurate Feature Learning with Domain Adaptation

論文の概要: RADA: Robust and Accurate Feature Learning with Domain Adaptation

arxiv url: http://arxiv.org/abs/2407.15791v1
Date: Mon, 22 Jul 2024 16:49:58 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-23 14:00:56.269780
Title: RADA: Robust and Accurate Feature Learning with Domain Adaptation
Title（参考訳）: RADA: ドメイン適応によるロバストで正確な機能学習
Authors: Jingtai He, Gehao Zhang, Tingting Liu, Songlin Du,
Abstract要約: 本稿では、2つの重要な要素を組み込んだ多層機能集約ネットワークを導入し、堅牢で正確な特徴の学習を容易にする。提案手法は,画像マッチング,カメラポーズ推定,視覚的ローカライゼーションタスクにおいて優れた結果が得られる。
参考スコア（独自算出の注目度）: 7.905594146253435
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Recent advancements in keypoint detection and descriptor extraction have shown impressive performance in local feature learning tasks. However, existing methods generally exhibit suboptimal performance under extreme conditions such as significant appearance changes and domain shifts. In this study, we introduce a multi-level feature aggregation network that incorporates two pivotal components to facilitate the learning of robust and accurate features with domain adaptation. First, we employ domain adaptation supervision to align high-level feature distributions across different domains to achieve invariant domain representations. Second, we propose a Transformer-based booster that enhances descriptor robustness by integrating visual and geometric information through wave position encoding concepts, effectively handling complex conditions. To ensure the accuracy and robustness of features, we adopt a hierarchical architecture to capture comprehensive information and apply meticulous targeted supervision to keypoint detection, descriptor extraction, and their coupled processing. Extensive experiments demonstrate that our method, RADA, achieves excellent results in image matching, camera pose estimation, and visual localization tasks.
Abstract（参考訳）: 近年のキーポイント検出と記述子抽出の進歩は、局所的な特徴学習タスクにおいて顕著な性能を示している。しかし、既存の手法では、大きな外観変化やドメインシフトなどの極端な条件下では、一般に準最適性能を示す。本研究では,ドメイン適応による堅牢かつ正確な特徴の学習を容易にするために,2つの主成分を組み込んだマルチレベル特徴集約ネットワークを提案する。まず、各領域にまたがる高レベルの特徴分布を整列させ、不変領域表現を実現する。第2に,ウェーブ位置符号化の概念を通じて視覚情報と幾何学情報を統合し,複雑な条件を効果的に処理することで,記述者のロバスト性を高めるトランスフォーマーベースのブースターを提案する。特徴の精度とロバスト性を確保するため,我々は階層型アーキテクチャを採用し,包括的情報を収集し,キーポイント検出,記述子抽出,およびそれらの結合処理に細心の注意を払って監視する。広汎な実験により,画像マッチング,カメラポーズ推定,視覚的ローカライゼーションタスクにおいて,我々の手法であるRADが優れた結果が得られることが示された。

関連論文リスト

GCRPNet: Graph-Enhanced Contextual and Regional Perception Network for Salient Object Detection in Optical Remote Sensing Images [68.33481681452675]
本稿では,GCRPNet(Graph-enhanced contextual and Regional Recognition Network)を提案する。これはMambaアーキテクチャの上に構築され、長距離依存関係を同時にキャプチャし、地域的特徴表現を強化する。マルチスケールの畳み込みによって処理される特徴マップに対して適応的なパッチスキャンを行い、リッチなローカル領域情報をキャプチャする。
論文参考訳（メタデータ） (2025-08-14T11:31:43Z)
Feature Alignment with Equivariant Convolutions for Burst Image Super-Resolution [52.55429225242423]
本稿では,同変畳み込みに基づくアライメントを特徴とするBurst Image Super-Resolution (BISR) のための新しいフレームワークを提案する。これにより、アライメント変換は画像領域の明示的な監督を通じて学習でき、特徴領域に容易に適用できる。 BISRベンチマークの実験は、定量的メトリクスと視覚的品質の両方において、我々のアプローチの優れた性能を示している。
論文参考訳（メタデータ） (2025-03-11T11:13:10Z)
Feature Based Methods in Domain Adaptation for Object Detection: A Review Paper [0.6437284704257459]
ドメイン適応は、異なるデータ分布を持つターゲットドメインにデプロイされた場合、機械学習モデルの性能を向上させることを目的としている。本総説では, 対人学習, 相違に基づく多分野, 教師学生, アンサンブル, ビジョン言語モデルなど, ドメイン適応のための高度な方法論を考察する。特に合成ドメインシフトを含むシナリオにおいて、ラベル付きデータへの依存を最小限に抑える戦略に特に注意が払われる。
論文参考訳（メタデータ） (2024-12-23T06:34:23Z)
Selective Domain-Invariant Feature for Generalizable Deepfake Detection [21.671221284842847]
本稿では,コンテンツの特徴やスタイルを融合させることにより,顔の偽造に対する感受性を低下させる新しいフレームワークを提案する。既存のベンチマークと提案における質的および定量的な結果の両方が、我々のアプローチの有効性を示している。
論文参考訳（メタデータ） (2024-03-19T13:09:19Z)
FMRT: Learning Accurate Feature Matching with Reconciliatory Transformer [29.95553680263075]
本稿では,複数の受容場と異なる特徴を適応的に整合する検出不要な手法であるFMRTを提案する。 FMRTは、ポーズ推定、視覚的ローカライゼーション、ホモグラフィー推定、画像マッチングなど、複数のベンチマークで素晴らしいパフォーマンスを得る。
論文参考訳（メタデータ） (2023-10-20T15:54:18Z)
Exploiting Modality-Specific Features For Multi-Modal Manipulation Detection And Grounding [54.49214267905562]
マルチモーダルな操作検出とグラウンド処理のためのトランスフォーマーベースのフレームワークを構築する。本フレームワークは,マルチモーダルアライメントの能力を維持しながら,モダリティ特有の特徴を同時に探求する。本稿では,グローバルな文脈的キューを各モーダル内に適応的に集約する暗黙的操作クエリ(IMQ)を提案する。
論文参考訳（メタデータ） (2023-09-22T06:55:41Z)
Enhancing Deformable Local Features by Jointly Learning to Detect and Describe Keypoints [8.390939268280235]
局所特徴抽出は、画像マッチングや検索といった重要なタスクに対処するためのコンピュータビジョンにおける標準的なアプローチである。鍵点を共同で検出・記述する新しい変形認識ネットワークであるDALFを提案する。提案手法は、変形可能なオブジェクト検索と、非剛性な3次元表面登録という、2つの実世界のアプリケーションの性能を向上させる。
論文参考訳（メタデータ） (2023-04-02T18:01:51Z)
AIR-DA: Adversarial Image Reconstruction for Unsupervised Domain Adaptive Object Detection [28.22783703278792]
特徴抽出器の対角訓練を容易にするための正則化器としての適応画像再構成(AIR) ドメインシフトに挑戦するいくつかのデータセットにまたがって評価を行った結果,提案手法が従来の手法よりも優れていたことが判明した。
論文参考訳（メタデータ） (2023-03-27T16:51:51Z)
Part-guided Relational Transformers for Fine-grained Visual Recognition [59.20531172172135]
識別的特徴を学習し,特徴変換モジュールとの相関関係を探索するフレームワークを提案する。提案手法は,3-of-the-levelオブジェクト認識において,部分ブランチの追加に頼らず,最先端の性能に達する。
論文参考訳（メタデータ） (2022-12-28T03:45:56Z)
AFAN: Augmented Feature Alignment Network for Cross-Domain Object Detection [90.18752912204778]
オブジェクト検出のための教師なしドメイン適応は、多くの現実世界のアプリケーションにおいて難しい問題である。本稿では、中間領域画像生成とドメイン・アドバイザリー・トレーニングを統合した新しい機能アライメント・ネットワーク(AFAN)を提案する。提案手法は、類似および異種ドメイン適応の双方において、標準ベンチマークにおける最先端の手法よりも大幅に優れている。
論文参考訳（メタデータ） (2021-06-10T05:01:20Z)
RoRD: Rotation-Robust Descriptors and Orthographic Views for Local Feature Matching [32.10261486751993]
本稿では,データ拡張と視点投影による不変記述子の学習を組み合わせる新しい枠組みを提案する。提案手法の有効性をポーズ推定や視覚的位置認識などの重要課題に対して評価する。
論文参考訳（メタデータ） (2021-03-15T17:40:25Z)
Unsupervised Domain Adaptation for Spatio-Temporal Action Localization [69.12982544509427]
S時間動作の局所化はコンピュータビジョンにおいて重要な問題である。本稿では、エンドツーエンドの教師なしドメイン適応アルゴリズムを提案する。空間的特徴と時間的特徴を別々にあるいは共同的に適応した場合に,顕著な性能向上が達成できることを示す。
論文参考訳（メタデータ） (2020-10-19T04:25:10Z)
Domain Conditioned Adaptation Network [90.63261870610211]
本稿では,ドメイン条件付きチャネルアテンション機構を用いて,異なる畳み込みチャネルを励起するドメイン条件適応ネットワーク(DCAN)を提案する。これは、ディープDAネットワークのドメインワイドな畳み込みチャネルアクティベーションを探求する最初の試みである。
論文参考訳（メタデータ） (2020-05-14T04:23:24Z)
iFAN: Image-Instance Full Alignment Networks for Adaptive Object Detection [48.83883375118966]
iFANは、イメージレベルとインスタンスレベルの両方で、機能の分散を正確に調整することを目的としている。ソースのみのベースライン上で10%以上のAPで、最先端のメソッドよりも優れています。
論文参考訳（メタデータ） (2020-03-09T13:27:06Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。