論文の概要: TITAN: Query-Token based Domain Adaptive Adversarial Learning
- arxiv url: http://arxiv.org/abs/2506.21484v1
- Date: Thu, 26 Jun 2025 17:12:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-27 19:53:10.209236
- Title: TITAN: Query-Token based Domain Adaptive Adversarial Learning
- Title(参考訳): TITAN:クエリトークンに基づくドメイン適応型逆学習
- Authors: Tajamul Ashraf, Janibul Bashir,
- Abstract要約: 我々は、適応中にソースデータが利用できなくなり、未ラベルのターゲットドメインに適応しなければならない場合、ソースフリー領域適応オブジェクト検出(SF-DAOD)問題に焦点を当てる。
この問題に対するほとんどのアプローチは、学生教育者(ST)フレームワークを用いた自己教師型アプローチを採用しており、疑似ラベルはソース事前学習モデルを介して生成され、さらなる微調整が行われる。
学生モデルの性能は,教師モデルが崩壊し,主に擬似ラベルの高雑音が原因で著しく低下することが多い。
信頼性の高い擬似ラベルを得るために,我々は提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We focus on the source-free domain adaptive object detection (SF-DAOD) problem when source data is unavailable during adaptation and the model must adapt to an unlabeled target domain. The majority of approaches for the problem employ a self-supervised approach using a student-teacher (ST) framework where pseudo-labels are generated via a source-pretrained model for further fine-tuning. We observe that the performance of a student model often degrades drastically, due to the collapse of the teacher model, primarily caused by high noise in pseudo-labels, resulting from domain bias, discrepancies, and a significant domain shift across domains. To obtain reliable pseudo-labels, we propose a Target-based Iterative Query-Token Adversarial Network (TITAN), which separates the target images into two subsets: those similar to the source (easy) and those dissimilar (hard). We propose a strategy to estimate variance to partition the target domain. This approach leverages the insight that higher detection variances correspond to higher recall and greater similarity to the source domain. Also, we incorporate query-token-based adversarial modules into a student-teacher baseline framework to reduce the domain gaps between two feature representations. Experiments conducted on four natural imaging datasets and two challenging medical datasets have substantiated the superior performance of TITAN compared to existing state-of-the-art (SOTA) methodologies. We report an mAP improvement of +22.7, +22.2, +21.1, and +3.7 percent over the current SOTA on C2F, C2B, S2C, and K2C benchmarks, respectively.
- Abstract(参考訳): 我々は、適応中にソースデータが利用できなくなり、未ラベルのターゲットドメインに適応しなければならない場合、ソースフリー領域適応オブジェクト検出(SF-DAOD)問題に焦点を当てる。
この問題に対するほとんどのアプローチは、学生教育者(ST)フレームワークを用いた自己教師型アプローチを採用しており、疑似ラベルはソース事前学習モデルを介して生成され、さらなる微調整が行われる。
学生モデルの性能は、主に擬似ラベルの高ノイズに起因する教師モデルの崩壊や、ドメインバイアス、不一致、ドメイン間の大きなドメインシフトなどによって著しく低下することが多い。
疑似ラベルの信頼性を得るため,TITAN(Target-based Iterative Query-Token Adversarial Network)を提案する。
対象領域を分割する分散を推定する戦略を提案する。
このアプローチは、より高い検出分散が、ソースドメインに対する高いリコールとより大きな類似性に対応するという洞察を活用する。
また,2つの特徴表現間のドメインギャップを低減するために,クエリトケンベースの対向モジュールを学生と教師のベースラインフレームワークに組み込む。
4つの自然画像データセットと2つの挑戦的な医療データセットで実施された実験は、既存のSOTA法と比較して、TITANの優れた性能を実証している。
C2F、C2B、S2C、K2Cのベンチマークでは、現在のSOTAよりも+22.7、+22.2、+21.1、+3.7%のmAP改善が報告されている。
関連論文リスト
- Unsupervised Domain Adaptive Person Search via Dual Self-Calibration [12.158126976694488]
Unsupervised Domain Adaptive (UDA) パーソンサーチは、ラベル付きソースドメインデータセットでトレーニングされたモデルを、追加のアノテーションなしでターゲットドメインデータセットに採用することに焦点を当てている。
最も効果的なUDA人物探索法は、典型的には、ソースドメインとクラスタリングから派生した擬似ラベルの基底真理を利用する。
ノイズの多い擬似ラベルの干渉を効果的に除去するUDA人物探索のためのDSCA(Dual Self-Calibration)フレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-21T06:54:00Z) - Focus on Your Target: A Dual Teacher-Student Framework for
Domain-adaptive Semantic Segmentation [210.46684938698485]
意味的セグメンテーションのための教師なしドメイン適応(UDA)について検討する。
対象領域からのトレーニングサンプルの割合を減少・増加させることで,「学習能力」が強化・弱まることがわかった。
本稿では,DTS(Double teacher-student)フレームワークを提案し,双方向学習戦略を取り入れた。
論文 参考訳(メタデータ) (2023-03-16T05:04:10Z) - Adapting the Mean Teacher for keypoint-based lung registration under
geometric domain shifts [75.51482952586773]
ディープニューラルネットワークは一般的に、ラベル付きトレーニングデータが多く必要であり、トレーニングデータとテストデータの間のドメインシフトに弱い。
本稿では,ラベル付きソースからラベル付きターゲットドメインへのモデルの適用により,画像登録のための幾何学的領域適応手法を提案する。
本手法は,ベースラインモデルの精度を目標データに適合させながら,ベースラインモデルの50%/47%を継続的に改善する。
論文 参考訳(メタデータ) (2022-07-01T12:16:42Z) - Target and Task specific Source-Free Domain Adaptive Image Segmentation [73.78898054277538]
ソースフリー領域適応画像分割のための2段階のアプローチを提案する。
我々は,高エントロピー領域を抑えつつ,ターゲット固有の擬似ラベルを生成することに注力する。
第2段階では、タスク固有の表現にネットワークを適用することに重点を置いている。
論文 参考訳(メタデータ) (2022-03-29T17:50:22Z) - Low-confidence Samples Matter for Domain Adaptation [47.552605279925736]
ドメイン適応(DA)は、知識をラベルの豊富なソースドメインから関連するがラベルの少ないターゲットドメインに転送することを目的としている。
低信頼度サンプルの処理による新しいコントラスト学習法を提案する。
提案手法を教師なしと半教師付きの両方のDA設定で評価する。
論文 参考訳(メタデータ) (2022-02-06T15:45:45Z) - Cross-Domain Object Detection via Adaptive Self-Training [45.48690932743266]
適応的無バイアス教師(AUT)という自己学習フレームワークを提案する。
AUTは、ドメインシフトに対処するために、逆学習と弱い強度データ拡張を使用する。
私たちは、AUTが既存のすべてのアプローチやOracle(完全に監督された)モデルよりも大きなマージンで優れていることを示しています。
論文 参考訳(メタデータ) (2021-11-25T18:50:15Z) - Source-Free Open Compound Domain Adaptation in Semantic Segmentation [99.82890571842603]
SF-OCDAでは、ターゲットモデルを学習するために、ソース事前訓練されたモデルとターゲットデータのみが利用可能である。
そこで我々は,Cross-Patch Style Swap (CPSS)を提案する。
提案手法は,C-Drivingデータセット上で最先端の結果を生成する。
論文 参考訳(メタデータ) (2021-06-07T08:38:41Z) - On Universal Black-Box Domain Adaptation [53.7611757926922]
実践的な展開という観点から,ドメイン適応の最小限の制約条件について検討する。
ソースモデルのインターフェースのみがターゲットドメインで利用可能であり、2つのドメイン間のラベル空間関係が異なることや未知であることが許されている。
対象試料の局所近傍における予測の整合性によって正規化された自己訓練フレームワークに統一することを提案する。
論文 参考訳(メタデータ) (2021-04-10T02:21:09Z) - Teacher-Student Consistency For Multi-Source Domain Adaptation [28.576613317253035]
マルチソースドメイン適応(MSDA)では、モデルは複数のソースドメインのサンプルに基づいてトレーニングされ、異なるターゲットドメインの推論に使用される。
本稿では,これらの問題を緩和する新手法であるMulti-source Students Teacher (MUST)を提案する。
論文 参考訳(メタデータ) (2020-10-20T06:17:40Z) - Adversarial Bipartite Graph Learning for Video Domain Adaptation [50.68420708387015]
ドメイン適応技術は,異なる領域間のモデルを適応させることに重点を置いているが,ビデオ認識領域ではめったに研究されていない。
近年,映像のソースと対象映像の表現を統一するために,対角学習を活用する視覚領域適応はビデオにはあまり効果がない。
本稿では,ソースとターゲットの相互作用を直接モデル化するAdversarial Bipartite Graph (ABG)学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-31T03:48:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。