論文の概要: A Closer Look at In-Distribution vs. Out-of-Distribution Accuracy for Open-Set Test-time Adaptation
- arxiv url: http://arxiv.org/abs/2606.01973v1
- Date: Mon, 01 Jun 2026 09:35:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:31.69873
- Title: A Closer Look at In-Distribution vs. Out-of-Distribution Accuracy for Open-Set Test-time Adaptation
- Title(参考訳): オープンセットテスト時間適応における分布内精度と分布外精度の比較
- Authors: Zefeng Li, Evan Shelhamer,
- Abstract要約: 我々は,CIFAR-10-C と ImageNet-C の破損評価ベンチマークにおいて,オープンセットテスト時間適応法をベンチマークした。
CIFAR-10-C と ImageNet-C を用いた InD と OOD の認識における TTA 手法の精度と信頼性の評価を行った。
ソフトマックス/マルチクラス出力をシグモイド/マルチラベル出力に置き換える新しいベースラインを提案する。
- 参考スコア(独自算出の注目度): 6.1293098565089545
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Open-set test-time adaptation (TTA) updates models on new data in the presence of input shifts and unknown output classes. While recent methods have made progress on improving in-distribution (InD) accuracy for known classes, their ability to accurately detect out-of-distribution (OOD) unknown classes remains underexplored. We benchmark robust and open-set TTA methods (SAR, OSTTA, UniEnt, and SoTTA) on the standard corruption benchmarks of CIFAR-10-C at the small scale and ImageNet-C at the large scale. For CIFAR-10-C, we use OOD data from SVHN and CIFAR-100 in their respective corrupted forms of SVHN-C and CIFAR-100-C. For ImageNet-C, we use OOD data from ImageNet-O and Textures in their respective corrupted forms of ImageNet-O-C and Textures-C. ImageNet-O is nearer to ImageNet, as unknown but related object classes (like ''garlic bread'' vs. ''hot dog'' for food, or ''highway'' vs. ''dam'' for infrastructure), while Textures is farther from ImageNet, as non-object patterns (like ''cracked'' mud, ''porous'' sponge, ''veined'' leaves). We evaluate the accuracy and confidence of TTA methods for InD vs. OOD recognition on CIFAR-10-C and ImageNet-C. We verify the accuracy of each method's own OOD detection technique on CIFAR-10-C. We also evaluate on ImageNet-C and report both accuracy and standard OOD detection metrics. We further examine more realistic settings, in which the proportions and rates of OOD data can vary. To explore the trade-off between InD recognition and OOD rejection, we propose a new baseline that replaces softmax/multi-class output with sigmoid/multi-label output. Our analysis shows for the first time that current open-set TTA methods struggle to balance InD and OOD accuracy and that they only imperfectly filter OOD data for their own adaptation updates.
- Abstract(参考訳): オープンセットテスト時間適応(TTA)は、入力シフトや未知の出力クラスの存在下で、新しいデータのモデルを更新します。
近年の手法では、既知のクラスに対する分布内精度(In-distriion, InD)の向上が進んでいるが、未知のクラスを正確に検出する能力はいまだ検討されていない。
我々は,CIFAR-10-CとImageNet-Cの大規模における標準汚職ベンチマークにおいて,ロバストでオープンなTTA手法(SAR,OSTTA,UniEnt,SoTTA)をベンチマークした。
CIFAR-10-C では,SVHN-C と CIFAR-100-C のそれぞれの劣化形態で SVHN-C と CIFAR-100-C の OOD データを使用する。
ImageNet-C では,ImageNet-O と Textures の OOD データを,それぞれが破損した ImageNet-O-C と Textures-C の形式で使用する。
ImageNet-OはImageNetに近いが、関連するオブジェクトクラス(食べ物は'garlic bread'、食べ物は'hot dog'、インフラは'highway'、インフラは'dam')であるのに対して、TexturesはImageNetより遠い('cracked'、泥、'porous'、スポンジ、'veined'、葉)。
CIFAR-10-C と ImageNet-C を用いた InD と OOD の認識における TTA 手法の精度と信頼性の評価を行った。
CIFAR-10-Cにおける各手法のOOD検出手法の精度を検証する。
また、ImageNet-Cで評価を行い、精度と標準OOD検出指標の両方を報告する。
さらに、OODデータの比率とレートが変化するような、より現実的な設定についても検討する。
InD認識とOOD拒絶のトレードオフを探るため,ソフトマックス/マルチクラス出力をシグモイド/マルチラベル出力に置き換える新しいベースラインを提案する。
我々の分析は、現在のオープンセットのTTA手法がInDとOODの精度のバランスに苦しむのを初めて示し、OODデータを不完全にフィルタするだけで適応を更新できることを示した。
関連論文リスト
- Detecting OOD Samples via Optimal Transport Scoring Function [5.093257685701887]
本稿では,OOD検出のための最適輸送理論OTODに基づく新しいスコア関数を提案する。
我々は,各試験試料のOODスコアを計算するために,特徴量,ロジット,ソフトマックス確率空間からの情報を利用する。
実験の結果,この情報を組み合わせることで,OTODの性能を一定のマージンで向上させることができることがわかった。
論文 参考訳(メタデータ) (2025-02-22T06:37:18Z) - Logit Scaling for Out-of-Distribution Detection [13.017887434494373]
トレーニングデータ配信へのアクセスを必要としない簡易なポストホック手法を提案する。
当社の方法である Logit Scaling (LTS) は, 物流内分布(ID) と OOD サンプルを効果的に区別する方法でロジットをスケールする。
CIFAR-10, CIFAR-100, ImageNet, OpenOOD など,様々なスケールでベンチマークを行った。
論文 参考訳(メタデータ) (2024-09-02T11:10:44Z) - Model-free Test Time Adaptation for Out-Of-Distribution Detection [62.49795078366206]
我々はtextbfDistribution textbfDetection (abbr) のための非パラメトリックテスト時間 textbfAdaptation フレームワークを提案する。
Abbrは、オンラインテストサンプルを使用して、テスト中のモデル適応、データ分散の変更への適応性を向上させる。
複数のOOD検出ベンチマークにおける包括的実験により,abrの有効性を示す。
論文 参考訳(メタデータ) (2023-11-28T02:00:47Z) - Masked Images Are Counterfactual Samples for Robust Fine-tuning [77.82348472169335]
微調整の深層学習モデルは、分布内(ID)性能と分布外(OOD)堅牢性の間のトレードオフにつながる可能性がある。
そこで本研究では,マスク付き画像を対物サンプルとして用いて,ファインチューニングモデルのロバスト性を向上させる新しいファインチューニング手法を提案する。
論文 参考訳(メタデータ) (2023-03-06T11:51:28Z) - Effective Robustness against Natural Distribution Shifts for Models with
Different Training Data [113.21868839569]
効果的ロバスト性」は、分配内(ID)性能から予測できる以上の余分な分配外ロバスト性を測定する。
異なるデータに基づいてトレーニングされたモデルの有効ロバスト性を評価・比較するための新しい評価指標を提案する。
論文 参考訳(メタデータ) (2023-02-02T19:28:41Z) - OODformer: Out-Of-Distribution Detection Transformer [15.17006322500865]
現実世界の安全クリティカルなアプリケーションでは、新しいデータポイントがOODであるかどうかを認識することが重要です。
本稿では,OODformer というファースト・オブ・ザ・キンドな OOD 検出アーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-07-19T15:46:38Z) - Probabilistic Trust Intervals for Out of Distribution Detection [8.35564578781252]
本稿では,従来のパラメータを変更することなく,事前学習ネットワークにおけるOOD検出を向上する手法を提案する。
提案手法は,各ネットワーク重みに対する確率的信頼区間を定義し,分布内データを用いて決定する。
我々は,MNIST,Fashion-MNIST,CIFAR-10,CIFAR-100,CIFAR-10-Cについて検討した。
論文 参考訳(メタデータ) (2021-02-02T06:23:04Z) - Learn what you can't learn: Regularized Ensembles for Transductive
Out-of-distribution Detection [76.39067237772286]
ニューラルネットワークの現在のアウト・オブ・ディストリビューション(OOD)検出アルゴリズムは,様々なOOD検出シナリオにおいて不満足な結果をもたらすことを示す。
本稿では,テストデータのバッチを観察した後に検出方法を調整することで,このような「ハード」なOODシナリオがいかに有用かを検討する。
本稿では,テストデータと正規化に人工ラベリング手法を用いて,テストバッチ内のOODサンプルに対してのみ矛盾予測を生成するモデルのアンサンブルを求める手法を提案する。
論文 参考訳(メタデータ) (2020-12-10T16:55:13Z) - Probing Predictions on OOD Images via Nearest Categories [97.055916832257]
ニューラルネットワークが未確認のクラスや破損したイメージから画像を分類する際のアウト・オブ・ディストリビューション(OOD)予測挙動について検討する。
我々は、トレーニングセットにおいて、最も近い隣人と同じラベルで分類されたOOD入力の分数を計算するため、新しい測度、最も近いカテゴリ一般化(NCG)を導入する。
我々は、OODデータがロバストネス半径よりも遥かに遠くにある場合でも、ロバストネットワークは自然訓練よりも一貫してNCG精度が高いことを発見した。
論文 参考訳(メタデータ) (2020-11-17T07:42:27Z) - Tent: Fully Test-time Adaptation by Entropy Minimization [77.85911673550851]
モデルは、テスト中に新しいデータや異なるデータに一般化するように適応する必要があります。
この完全なテスト時間適応の設定では、モデルはテストデータとそれ自身のパラメータしか持たない。
実験エントロピー最小化(tent): 予測のエントロピーによって測定された信頼度に対するモデルを最適化する。
論文 参考訳(メタデータ) (2020-06-18T17:55:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。