論文の概要: DA-Mamba: Domain Adaptive Hybrid Mamba-Transformer Based One-Stage Object Detection
- arxiv url: http://arxiv.org/abs/2502.11178v2
- Date: Wed, 07 May 2025 10:18:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-08 14:59:11.821951
- Title: DA-Mamba: Domain Adaptive Hybrid Mamba-Transformer Based One-Stage Object Detection
- Title(参考訳): DA-Mamba:Domain Adaptive Hybrid Mamba-Transformer based One-Stage Object Detection
- Authors: A. Enes Doruk, Hasan F. Ates,
- Abstract要約: ドメイン適応型マンバ型一段階物体検出モデルDA-マンバについて述べる。
Mambaアーキテクチャのグローバルなモデリングと線形複雑性にインスパイアされ、最初のドメイン適応型Mambaベースのワンステージオブジェクト検出モデルであるDA-Mambaを提示する。
- 参考スコア(独自算出の注目度): 0.3683202928838613
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent 2D CNN-based domain adaptation approaches struggle with long-range dependencies due to limited receptive fields, making it difficult to adapt to target domains with significant spatial distribution changes. While transformer-based domain adaptation methods better capture distant relationships through self-attention mechanisms that facilitate more effective cross-domain feature alignment, their quadratic computational complexity makes practical deployment challenging for object detection tasks across diverse domains. Inspired by the global modeling and linear computation complexity of the Mamba architecture, we present the first domain-adaptive Mamba-based one-stage object detection model, termed DA-Mamba. Specifically, we combine Mamba's efficient state-space modeling with attention mechanisms to address domain-specific spatial and channel-wise variations. Our design leverages domain-adaptive spatial and channel-wise scanning within the Mamba block to extract highly transferable representations for efficient sequential processing, while cross-attention modules generate long-range, mixed-domain spatial features to enable robust soft alignment across domains. Besides, motivated by the observation that hybrid architectures introduce feature noise in domain adaptation tasks, we propose an entropy-based knowledge distillation framework with margin ReLU, which adaptively refines multi-level representations by suppressing irrelevant activations and aligning uncertainty across source and target domains. Finally, to prevent overfitting caused by the mixed-up features generated through cross-attention mechanisms, we propose entropy-driven gating attention with random perturbations that simultaneously refine target features and enhance model generalization.
- Abstract(参考訳): 最近の2次元CNNベースのドメイン適応手法は、受容場が限られているため、長距離依存に苦慮しているため、空間分布が著しく変化するターゲットドメインへの適応が困難である。
トランスフォーマーベースのドメイン適応手法は、より効果的なクロスドメイン機能アライメントを促進する自己認識機構により、遠方の関係をよりよく捉えるが、その2次計算の複雑さは、さまざまなドメインにわたるオブジェクト検出タスクにおいて、実用的なデプロイを困難にしている。
Mambaアーキテクチャのグローバルなモデリングと線形計算の複雑さに着想を得て,DA-Mambaと呼ばれるドメイン適応型Mambaベースの1段階オブジェクト検出モデルを提案する。
具体的には,Mambaの効率的な状態空間モデリングとアテンション機構を組み合わせることで,ドメイン固有の空間的・チャネル的変動に対処する。
本設計では,Mambaブロック内の領域適応型空間およびチャネルワイド走査を利用して,高転送性表現を抽出し,領域間のソフトアライメントを実現するために,クロスアテンションモジュールが長距離・混合領域空間特徴を生成する。
さらに,ハイブリッドアーキテクチャが領域適応タスクに特徴雑音をもたらすという観測を動機として,不適切なアクティベーションを抑え,ソースドメインやターゲットドメイン間の不確実性を整合させることにより,多レベル表現を適応的に洗練するエントロピーベースの知識蒸留フレームワークReLUを提案する。
最後に、クロスアテンション機構によって生じる混合特徴による過度な適合を防止するために、ターゲット特徴を同時に洗練し、モデル一般化を強化するランダムな摂動を伴うエントロピー駆動型ゲーティングアテンションを提案する。
関連論文リスト
- Exploiting Aggregation and Segregation of Representations for Domain Adaptive Human Pose Estimation [50.31351006532924]
人間のポーズ推定(HPE)は最近、モーション分析、バーチャルリアリティー、ヘルスケア等に広く応用されているため、注目を集めている。
時間と労働集約的なアノテーションのために、ラベル付き現実世界のデータセットが不足している。
本稿では,ドメイン適応型人間のポーズ推定のための表現集約と分離を両立させる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-29T17:59:45Z) - Feature Based Methods in Domain Adaptation for Object Detection: A Review Paper [0.6437284704257459]
ドメイン適応は、異なるデータ分布を持つターゲットドメインにデプロイされた場合、機械学習モデルの性能を向上させることを目的としている。
本総説では, 対人学習, 相違に基づく多分野, 教師学生, アンサンブル, ビジョン言語モデルなど, ドメイン適応のための高度な方法論を考察する。
特に合成ドメインシフトを含むシナリオにおいて、ラベル付きデータへの依存を最小限に抑える戦略に特に注意が払われる。
論文 参考訳(メタデータ) (2024-12-23T06:34:23Z) - TransAdapter: Vision Transformer for Feature-Centric Unsupervised Domain Adaptation [0.3277163122167433]
Unsupervised Domain Adaptation (UDA)は、ソースドメインのラベル付きデータを使用して、ラベルなしのターゲットドメインのタスクを解決することを目的としている。
従来のCNNベースの手法は、複雑なドメイン関係を完全に捉えるのに苦労している。
3つの鍵モジュールを持つSwin Transformerを利用する新しいUDA手法を提案する。
論文 参考訳(メタデータ) (2024-12-05T11:11:39Z) - Dynamic Domain Discrepancy Adjustment for Active Multi-Domain Adaptation [3.367755441623275]
マルチソースアン教師付きドメイン適応(MUDA)は、関連するソースドメインから未ラベルのターゲットドメインに知識を転送することを目的としている。
アクティブマルチドメイン適応(D3AAMDA)のための動的ドメイン不一致適応法(Dynamic Domain Disrepancy Adjustment)を提案する。
このメカニズムは、ソースドメインとターゲットドメイン間の特徴のアライメントレベルを制御し、ソースドメイン内のローカルな有利な特徴情報を効果的に活用する。
論文 参考訳(メタデータ) (2023-07-26T09:40:19Z) - Unsupervised Domain Adaptation via Style-Aware Self-intermediate Domain [52.783709712318405]
非教師なしドメイン適応(UDA)は、ラベル豊富なソースドメインから関連するがラベルのないターゲットドメインに知識を伝達する、かなりの注目を集めている。
本研究では,大規模なドメインギャップと伝達知識を橋渡しし,クラス非ネイティブ情報の損失を軽減するために,SAFF(style-aware feature fusion)法を提案する。
論文 参考訳(メタデータ) (2022-09-05T10:06:03Z) - Domain Adaptation for Object Detection using SE Adaptors and Center Loss [0.0]
本稿では,高速RCNNに基づく教師なしドメイン適応手法を導入し,ドメインシフトによる性能低下を防止する。
また、SEアダプタと呼ばれる圧縮励起機構を利用して、ドメインの注意を向上するアダプティブレイヤのファミリーも導入する。
最後に、インスタンスと画像レベルの表現に中心損失を組み込んで、クラス内分散を改善する。
論文 参考訳(メタデータ) (2022-05-25T17:18:31Z) - Decompose to Adapt: Cross-domain Object Detection via Feature
Disentanglement [79.2994130944482]
本研究では,DDF(Domain Disentanglement Faster-RCNN)を設計し,タスク学習のための特徴のソース固有情報を排除した。
DDF法は,グローバルトリプルト・ディアンタングルメント(GTD)モジュールとインスタンス類似性・ディアンタングルメント(ISD)モジュールを用いて,グローバルおよびローカルステージでの機能ディアンタングルを容易にする。
提案手法は,4つのUDAオブジェクト検出タスクにおいて最先端の手法より優れており,広い適用性で有効であることが実証された。
論文 参考訳(メタデータ) (2022-01-06T05:43:01Z) - AFAN: Augmented Feature Alignment Network for Cross-Domain Object
Detection [90.18752912204778]
オブジェクト検出のための教師なしドメイン適応は、多くの現実世界のアプリケーションにおいて難しい問題である。
本稿では、中間領域画像生成とドメイン・アドバイザリー・トレーニングを統合した新しい機能アライメント・ネットワーク(AFAN)を提案する。
提案手法は、類似および異種ドメイン適応の双方において、標準ベンチマークにおける最先端の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2021-06-10T05:01:20Z) - Disentanglement-based Cross-Domain Feature Augmentation for Effective
Unsupervised Domain Adaptive Person Re-identification [87.72851934197936]
Unsupervised Domain Adaptive (UDA) Person Re-identification (ReID) は、ラベル付きソースドメインからラベル付きターゲットドメインへ知識を転送することを目的としている。
ひとつの課題は、トレーニング用に信頼できるラベルでターゲットドメインサンプルを生成する方法だ。
ディスタングルメントに基づくクロスドメイン機能拡張戦略を提案する。
論文 参考訳(メタデータ) (2021-03-25T15:28:41Z) - Domain Conditioned Adaptation Network [90.63261870610211]
本稿では,ドメイン条件付きチャネルアテンション機構を用いて,異なる畳み込みチャネルを励起するドメイン条件適応ネットワーク(DCAN)を提案する。
これは、ディープDAネットワークのドメインワイドな畳み込みチャネルアクティベーションを探求する最初の試みである。
論文 参考訳(メタデータ) (2020-05-14T04:23:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。