論文の概要: Fourier Test-time Adaptation with Multi-level Consistency for Robust
Classification
- arxiv url: http://arxiv.org/abs/2306.02544v1
- Date: Mon, 5 Jun 2023 02:29:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-06 17:18:20.276978
- Title: Fourier Test-time Adaptation with Multi-level Consistency for Robust
Classification
- Title(参考訳): ロバスト分類のためのマルチレベル一貫性を持つフーリエテスト時間適応
- Authors: Yuhao Huang, Xin Yang, Xiaoqiong Huang, Xinrui Zhou, Haozhe Chi,
Haoran Dou, Xindi Hu, Jian Wang, Xuedong Deng, Dong Ni
- Abstract要約: 本稿では,Fourier Test-Time Adaptation (FTTA) と呼ばれる新しい手法を提案する。
FTTAは、予測の自己監督を行うために、ペア入力の信頼性の高い多レベル整合性測定を構築する。
異なる形態と器官を持つ3つの大きな分類データセットで広範囲に検証された。
- 参考スコア(独自算出の注目度): 10.291631977766672
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep classifiers may encounter significant performance degradation when
processing unseen testing data from varying centers, vendors, and protocols.
Ensuring the robustness of deep models against these domain shifts is crucial
for their widespread clinical application. In this study, we propose a novel
approach called Fourier Test-time Adaptation (FTTA), which employs a
dual-adaptation design to integrate input and model tuning, thereby jointly
improving the model robustness. The main idea of FTTA is to build a reliable
multi-level consistency measurement of paired inputs for achieving
self-correction of prediction. Our contribution is two-fold. First, we
encourage consistency in global features and local attention maps between the
two transformed images of the same input. Here, the transformation refers to
Fourier-based input adaptation, which can transfer one unseen image into source
style to reduce the domain gap. Furthermore, we leverage style-interpolated
images to enhance the global and local features with learnable parameters,
which can smooth the consistency measurement and accelerate convergence.
Second, we introduce a regularization technique that utilizes style
interpolation consistency in the frequency space to encourage self-consistency
in the logit space of the model output. This regularization provides strong
self-supervised signals for robustness enhancement. FTTA was extensively
validated on three large classification datasets with different modalities and
organs. Experimental results show that FTTA is general and outperforms other
strong state-of-the-art methods.
- Abstract(参考訳): 深層分類器は、様々なセンター、ベンダー、プロトコルから見当たらないテストデータを処理する場合、大幅なパフォーマンス低下に遭遇する可能性がある。
これらのドメインシフトに対する深層モデルの堅牢性を保証することは、その広範な臨床応用に不可欠である。
本研究では,入力とモデルのチューニングを統合するために,デュアル適応設計を用いるフーリエテストタイム適応(ftta)と呼ばれる新しい手法を提案する。
FTTAの主な考え方は、予測の自己補正を達成するためにペア入力の信頼性の高い多レベル整合性測定を構築することである。
私たちの貢献は2倍です。
まず、グローバル特徴の一貫性と、同じ入力の2つの変換画像間のローカルアテンションマップを奨励する。
ここで、変換はフーリエベースの入力適応を参照し、1つの未認識の画像をソーススタイルに転送し、ドメイン間のギャップを減らすことができる。
さらに,スタイル補間画像を利用して,学習可能なパラメータによるグローバル・ローカル機能を強化し,一貫性測定の円滑化と収束の促進を可能にした。
次に、周波数空間におけるスタイル補間一貫性を利用して、モデル出力のロジット空間における自己整合性を促進する正規化手法を提案する。
この正規化はロバスト性向上のための強い自己教師付き信号を提供する。
FTTAは3つの大きな分類データセットにおいて、異なるモダリティとオルガンで広範囲に検証された。
実験の結果、FTTAは一般的な手法であり、他の強力な最先端手法よりも優れていた。
関連論文リスト
- Visual Fourier Prompt Tuning [63.66866445034855]
本稿では,大規模なトランスフォーマーモデルに適用するための汎用的で効果的な方法として,Visual Fourier Prompt Tuning (VFPT)法を提案する。
提案手法では,高速フーリエ変換を即時埋め込みに取り入れ,空間領域情報と周波数領域情報の両方を調和的に検討する。
提案手法は,2つのベンチマークにおいて,現状のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2024-11-02T18:18:35Z) - Fully Differentiable Correlation-driven 2D/3D Registration for X-ray to CT Image Fusion [3.868072865207522]
画像ベース剛性2D/3Dレジストレーションは, 蛍光ガイド下外科手術において重要な技術である。
デュアルブランチCNN変換器エンコーダを用いた完全微分型相関型ネットワークを提案する。
組込み情報に基づく低周波特徴と高周波特徴の分解に対して相関型損失を提案する。
論文 参考訳(メタデータ) (2024-02-04T14:12:51Z) - Generalized Face Forgery Detection via Adaptive Learning for Pre-trained Vision Transformer [54.32283739486781]
適応学習パラダイムの下で,textbfForgery-aware textbfAdaptive textbfVision textbfTransformer(FA-ViT)を提案する。
FA-ViTは、クロスデータセット評価において、Celeb-DFおよびDFDCデータセット上で93.83%と78.32%のAUCスコアを達成する。
論文 参考訳(メタデータ) (2023-09-20T06:51:11Z) - Consistency Regularization for Generalizable Source-free Domain
Adaptation [62.654883736925456]
ソースフリードメイン適応(source-free domain adapt, SFDA)は、ソースデータセットにアクセスすることなく、十分にトレーニングされたソースモデルを未学習のターゲットドメインに適応することを目的としている。
既存のSFDAメソッドは、ターゲットのトレーニングセット上で適用されたモデルを評価し、目に見えないが同一の分散テストセットからデータを無視する。
より一般化可能なSFDA法を開発するための整合正則化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-03T07:45:53Z) - Improving Transformer-based Image Matching by Cascaded Capturing
Spatially Informative Keypoints [44.90917854990362]
変換器を用いたカスケードマッチングモデル -- Cascade Feature Matching TRansformer (CasMTR) を提案する。
我々は、信頼性マップを通じてキーポイントをフィルタリングするために、単純で効果的な非最大抑圧(NMS)後処理を使用する。
CasMTRは、室内および屋外のポーズ推定および視覚的位置推定において最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-03-06T04:32:34Z) - Disentangled Federated Learning for Tackling Attributes Skew via
Invariant Aggregation and Diversity Transferring [104.19414150171472]
属性は、クライアント間の一貫した最適化方向から、現在の連邦学習(FL)フレームワークを歪めます。
本稿では,ドメイン固有属性とクロス不変属性を2つの補足枝に分離するために,非絡み付きフェデレーション学習(DFL)を提案する。
実験により、DFLはSOTA FL法と比較して高い性能、より良い解釈可能性、より高速な収束率でFLを促進することが確認された。
論文 参考訳(メタデータ) (2022-06-14T13:12:12Z) - FAMLP: A Frequency-Aware MLP-Like Architecture For Domain Generalization [73.41395947275473]
本稿では、変換周波数領域において、ドメイン固有の特徴をフィルタリングする新しい周波数認識アーキテクチャを提案する。
3つのベンチマークの実験では、最先端の手法をそれぞれ3%、4%、9%のマージンで上回った。
論文 参考訳(メタデータ) (2022-03-24T07:26:29Z) - CSformer: Bridging Convolution and Transformer for Compressive Sensing [65.22377493627687]
本稿では,CNNからの詳細な空間情報を活用するためのハイブリッドフレームワークと,表現学習の強化を目的としたトランスフォーマーが提供するグローバルコンテキストを統合することを提案する。
提案手法は、適応的なサンプリングとリカバリからなるエンドツーエンドの圧縮画像センシング手法である。
実験により, 圧縮センシングにおける専用トランスアーキテクチャの有効性が示された。
論文 参考訳(メタデータ) (2021-12-31T04:37:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。