論文の概要: 1st Place Solution for ECCV 2022 OOD-CV Challenge Image Classification
Track
- arxiv url: http://arxiv.org/abs/2301.04795v1
- Date: Thu, 12 Jan 2023 03:44:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-13 14:28:20.140570
- Title: 1st Place Solution for ECCV 2022 OOD-CV Challenge Image Classification
Track
- Title(参考訳): eccv 2022 ood-cvチャレンジ画像分類トラックの1位解
- Authors: Yilu Guo, Xingyue Shi, Weijie Chen, Shicai Yang, Di Xie, Shiliang Pu,
Yueting Zhuang
- Abstract要約: OOD-CVチャレンジは配布外一般化タスクである。
この課題では、私たちのコアソリューションは、ノイズラベル学習が強いテスト時間ドメイン適応法である、と要約することができます。
テスト時間拡張戦略とモデルアンサンブル戦略を統合することで、OOD-CVチャレンジの画像分類リーダーボードに第一位にランクインする。
- 参考スコア(独自算出の注目度): 64.49153847504141
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: OOD-CV challenge is an out-of-distribution generalization task. In this
challenge, our core solution can be summarized as that Noisy Label Learning Is
A Strong Test-Time Domain Adaptation Optimizer. Briefly speaking, our main
pipeline can be divided into two stages, a pre-training stage for domain
generalization and a test-time training stage for domain adaptation. We only
exploit labeled source data in the pre-training stage and only exploit
unlabeled target data in the test-time training stage. In the pre-training
stage, we propose a simple yet effective Mask-Level Copy-Paste data
augmentation strategy to enhance out-of-distribution generalization ability so
as to resist shape, pose, context, texture, occlusion, and weather domain
shifts in this challenge. In the test-time training stage, we use the
pre-trained model to assign noisy label for the unlabeled target data, and
propose a Label-Periodically-Updated DivideMix method for noisy label learning.
After integrating Test-Time Augmentation and Model Ensemble strategies, our
solution ranks the first place on the Image Classification Leaderboard of the
OOD-CV Challenge. Code will be released in
https://github.com/hikvision-research/OOD-CV.
- Abstract(参考訳): OOD-CVチャレンジは配布外一般化タスクである。
この課題において、我々のコアソリューションは、ノイズの多いラベル学習は強力なテスト時ドメイン適応最適化である、と要約できる。
簡単に言えば、我々のメインパイプラインは、ドメイン一般化のための事前訓練段階と、ドメイン適応のためのテストタイムトレーニング段階の2つの段階に分けられる。
事前学習段階ではラベル付きソースデータのみを利用し、テスト時間トレーニング段階ではラベルなしターゲットデータのみを活用する。
事前学習段階では, 形状, ポーズ, コンテクスト, テクスチャ, 咬合, 気象領域の変化に抵抗するために, 分散一般化能力を高めるための, 単純かつ効果的なマスクレベルのコピーペーストデータ拡張戦略を提案する。
テスト時間トレーニング段階では、事前学習したモデルを用いてラベル付き対象データにノイズラベルを割り当て、ラベル付きラベル学習のためのラベル付き周期更新DivideMix法を提案する。
テスト時間拡張戦略とモデルアンサンブル戦略を統合することで、OOD-CVチャレンジの画像分類リーダーボードに第一位にランクインする。
コードはhttps://github.com/hikvision-research/OOD-CVでリリースされる。
関連論文リスト
- LPLgrad: Optimizing Active Learning Through Gradient Norm Sample Selection and Auxiliary Model Training [2.762397703396293]
LPLgrad(Loss Prediction Loss with Gradient Norm)は、モデルの不確実性を効果的に定量化し、画像分類タスクの精度を向上させる。
LPLgradは2つの異なるフェーズで動作する: (i) Em Training Phaseは、メインモデルと補助モデルとを併用して入力特徴の損失を予測することを目的としている。
この二重モデルアプローチは、複雑な入力特徴を抽出し、データから本質的なパターンを効果的に学習する能力を高める。
論文 参考訳(メタデータ) (2024-11-20T18:12:59Z) - Data Adaptive Traceback for Vision-Language Foundation Models in Image Classification [34.37262622415682]
我々はData Adaptive Tracebackと呼ばれる新しい適応フレームワークを提案する。
具体的には、ゼロショット法を用いて、事前学習データの最もダウンストリームなタスク関連サブセットを抽出する。
我々は、擬似ラベルに基づく半教師付き手法を採用し、事前学習画像の再利用と、半教師付き学習における確証バイアス問題に対処するための視覚言語コントラスト学習手法を提案する。
論文 参考訳(メタデータ) (2024-07-11T18:01:58Z) - Towards Seamless Adaptation of Pre-trained Models for Visual Place Recognition [72.35438297011176]
視覚的位置認識のための事前学習モデル(VPR)のシームレスな適応を実現する新しい手法を提案する。
具体的には、地域を識別するための有意義なランドマークに焦点を当てたグローバルな特徴とローカルな特徴の両方を得るために、ハイブリッド適応法を設計する。
実験結果から,本手法はトレーニングデータやトレーニング時間が少なく,最先端の手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2024-02-22T12:55:01Z) - Test-Time Training for Semantic Segmentation with Output Contrastive
Loss [12.535720010867538]
ディープラーニングベースのセグメンテーションモデルは、公開ベンチマークで印象的なパフォーマンスを達成したが、目に見えない環境にうまく一般化することは、依然として大きな課題である。
本稿では、適応過程を安定させるために、頑健で一般化された表現を学習する能力で知られるコントラストロス(OCL)を紹介する。
本手法は,テスト領域データに対するドメイン適応法を用いて事前学習したモデルに適用した場合においても優れ,そのレジリエンスと適応性を示す。
論文 参考訳(メタデータ) (2023-11-14T03:13:47Z) - 1st Place Solution for ECCV 2022 OOD-CV Challenge Object Detection Track [71.12470906323298]
Generalize-then-Adapt(G&A)フレームワークは、2段ドメイン一般化部と1段ドメイン適応部とから構成される。
提案したG&Aフレームワークは,OOD-CVチャレンジにおけるオブジェクト検出リーダボードの初歩的な実現に役立ちます。
論文 参考訳(メタデータ) (2023-01-12T03:50:46Z) - CAFA: Class-Aware Feature Alignment for Test-Time Adaptation [50.26963784271912]
テスト時間適応(TTA)は、テスト時にラベルのないデータにモデルを適応させることによって、この問題に対処することを目的としている。
本稿では,クラス認識特徴アライメント(CAFA, Class-Aware Feature Alignment)と呼ばれる単純な機能アライメント損失を提案する。
論文 参考訳(メタデータ) (2022-06-01T03:02:07Z) - Semi-Supervised Domain Adaptation with Prototypical Alignment and
Consistency Learning [86.6929930921905]
本稿では,いくつかの対象サンプルがラベル付けされていれば,ドメインシフトに対処するのにどの程度役立つか検討する。
ランドマークの可能性を最大限に追求するために、ランドマークから各クラスのターゲットプロトタイプを計算するプロトタイプアライメント(PA)モジュールを組み込んでいます。
具体的には,ラベル付き画像に深刻な摂動を生じさせ,PAを非自明にし,モデル一般化性を促進する。
論文 参考訳(メタデータ) (2021-04-19T08:46:08Z) - Two-phase Pseudo Label Densification for Self-training based Domain
Adaptation [93.03265290594278]
TPLDと呼ばれる,新規な二相擬似ラベル高密度化フレームワークを提案する。
第1フェーズでは,スライディングウインドウ投票を用いて,画像内の内在的空間相関を利用して,自信のある予測を広める。
第2フェーズでは,信頼度に基づく容易な分類を行う。
トレーニングプロセスの容易化と騒音予測の回避を目的として,ブートストラップ機構の導入を行った。
論文 参考訳(メタデータ) (2020-12-09T02:35:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。