論文の概要: TTT-UCDR: Test-time Training for Universal Cross-Domain Retrieval
- arxiv url: http://arxiv.org/abs/2208.09198v1
- Date: Fri, 19 Aug 2022 07:50:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-22 17:05:01.924851
- Title: TTT-UCDR: Test-time Training for Universal Cross-Domain Retrieval
- Title(参考訳): TTT-UCDR:ユニバーサルクロスドメイン検索のためのテストタイムトレーニング
- Authors: Soumava Paul, Aheli Saha, Abhishek Samanta
- Abstract要約: 我々はUCDR(Universal Cross-Domain Retrieval)の下での分散シフトに適応するためのテストタイムトレーニング技術を採用している。
このドメインギャップを埋めるために、テスト時に事前トレーニングされたネットワーク上で、Barlow Twins、Jigsaw Puzzle、RotNetという3つの異なる損失を通じてセルフスーパービジョンを使用します。
この単純なアプローチは、UCDRベンチマークの改善と、挑戦的なデータセットの一般化設定の下でモデルロバスト性の向上につながる。
- 参考スコア(独自算出の注目度): 0.5893124686141781
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Image retrieval is a niche problem in computer vision curated towards finding
similar images in a database using a query. In this work, for the first time in
literature, we employ test-time training techniques for adapting to
distribution shifts under Universal Cross-Domain Retrieval (UCDR). Test-time
training has previously been shown to reduce generalization error for image
classification, domain adaptation, semantic segmentation, and zero-shot
sketch-based image retrieval (ZS-SBIR). In UCDR, in addition to the semantic
shift of unknown categories present in ZS-SBIR, the presence of unknown domains
leads to even higher distribution shifts. To bridge this domain gap, we use
self-supervision through 3 different losses - Barlow Twins, Jigsaw Puzzle and
RotNet on a pretrained network at test-time. This simple approach leads to
improvements on UCDR benchmarks and also improves model robustness under a
challenging cross-dataset generalization setting.
- Abstract(参考訳): 画像検索はコンピュータビジョンにおけるニッチな問題であり、クエリを使ってデータベースで類似した画像を見つける。
本研究では,Universal Cross-Domain Retrieval (UCDR)の下での分散シフトに適応するためのテストタイムトレーニング手法を文献で初めて採用する。
これまでテストタイムトレーニングは、画像分類、ドメイン適応、セマンティックセグメンテーション、ゼロショットスケッチベース画像検索(ZS-SBIR)の一般化誤差を低減することが示されている。
UCDRでは、ZS-SBIRに存在する未知のカテゴリのセマンティックシフトに加えて、未知のドメインの存在はさらに高い分布シフトをもたらす。
このドメインギャップを埋めるために、テスト時にトレーニング済みネットワーク上でBarlow Twins、Jigsaw Puzzle、RotNetという3つの異なる損失を通じてセルフスーパービジョンを使用します。
この単純なアプローチはUCDRベンチマークの改善と、挑戦的なデータセットの一般化設定の下でモデルの堅牢性の向上につながる。
関連論文リスト
- Generalization Capabilities of Neural Cellular Automata for Medical Image Segmentation: A Robust and Lightweight Approach [6.537479355990391]
U-Netは、トレーニング分布から逸脱したデータでテストすると、パフォーマンスが大幅に低下する。
本稿では,従来のU-Netに比べて3桁の規模(すなわちx1000)のモデルを活用することの意味について検討する。
論文 参考訳(メタデータ) (2024-08-28T06:18:55Z) - NormAUG: Normalization-guided Augmentation for Domain Generalization [60.159546669021346]
ディープラーニングのためのNormAUG(Normalization-guided Augmentation)と呼ばれるシンプルで効果的な手法を提案する。
本手法は特徴レベルで多様な情報を導入し,主経路の一般化を改善する。
テスト段階では、アンサンブル戦略を利用して、モデルの補助経路からの予測を組み合わせ、さらなる性能向上を図る。
論文 参考訳(メタデータ) (2023-07-25T13:35:45Z) - Single Domain Generalization via Normalised Cross-correlation Based
Convolutions [14.306250516592304]
単一ドメインの一般化は、単一のソースからのデータを使用して堅牢なモデルをトレーニングすることを目的としている。
本稿では、重みと入力特徴パッチの間の正規化相互相関を計算するXCNormという演算子を提案する。
この演算子で構成されるディープニューラルネットワークは、一般的な意味分布シフトに対して堅牢であることを示す。
論文 参考訳(メタデータ) (2023-07-12T04:15:36Z) - On the Universal Adversarial Perturbations for Efficient Data-free
Adversarial Detection [55.73320979733527]
本稿では,UAPに対して正常サンプルと逆サンプルの異なる応答を誘導する,データに依存しない逆検出フレームワークを提案する。
実験結果から,本手法は様々なテキスト分類タスクにおいて,競合検出性能を実現することが示された。
論文 参考訳(メタデータ) (2023-06-27T02:54:07Z) - Generalizable Metric Network for Cross-domain Person Re-identification [55.71632958027289]
クロスドメイン(ドメインの一般化)シーンは、Re-IDタスクにおいて課題となる。
既存のほとんどのメソッドは、すべてのドメインのドメイン不変またはロバストな機能を学ぶことを目的としています。
本稿では,サンプルペア空間における標本類似性を調べるために,GMN(Generalizable Metric Network)を提案する。
論文 参考訳(メタデータ) (2023-06-21T03:05:25Z) - To Adapt or to Annotate: Challenges and Interventions for Domain
Adaptation in Open-Domain Question Answering [46.403929561360485]
オープンドメイン質問応答(ODQA)のエンドツーエンドモデルの性能について検討する。
モデルが一般化に失敗するだけでなく、高い検索スコアが解答予測の精度を低下させることもしばしばある。
終末回答F1のスコアを最大24ポイント改善するいくつかの介入手法を提案し,評価する。
論文 参考訳(メタデータ) (2022-12-20T16:06:09Z) - One-Shot Domain Adaptive and Generalizable Semantic Segmentation with
Class-Aware Cross-Domain Transformers [96.51828911883456]
セマンティックセグメンテーションのための教師なしのsim-to-realドメイン適応(UDA)は、シミュレーションデータに基づいて訓練されたモデルの実世界のテスト性能を改善することを目的としている。
従来のUDAは、適応のためのトレーニング中に利用可能なラベルのない実世界のサンプルが豊富にあると仮定することが多い。
実世界のデータサンプルが1つしか利用できない,一発の教師なしシム・トゥ・リアル・ドメイン適応(OSUDA)と一般化問題について検討する。
論文 参考訳(メタデータ) (2022-12-14T15:54:15Z) - Semi-Supervised Domain Generalizable Person Re-Identification [74.75528879336576]
既存の人物の再識別(re-id)メソッドは、新しい目に見えないシナリオにデプロイされると立ち往生する。
近年,新たなシナリオにおける未ラベルの広範なデータをトランスダクティブ学習方式で活用するドメイン適応型人物再認識への取り組みが進められている。
我々は、複数のラベル付きデータセットを探索し、人物の再識別のための一般化されたドメイン不変表現を学習することを目指している。
論文 参考訳(メタデータ) (2021-08-11T06:08:25Z) - Multi-Domain Adversarial Feature Generalization for Person
Re-Identification [52.835955258959785]
マルチデータセット特徴一般化ネットワーク(MMFA-AAE)を提案する。
複数のラベル付きデータセットから普遍的なドメイン不変の特徴表現を学習し、それを見えないカメラシステムに一般化することができる。
また、最先端の教師付き手法や教師なしのドメイン適応手法を大きなマージンで超えている。
論文 参考訳(メタデータ) (2020-11-25T08:03:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。