Fugu-MT 論文翻訳(概要): Technical note on calibrating vision-language models under covariate shift

論文の概要: Technical note on calibrating vision-language models under covariate shift

arxiv url: http://arxiv.org/abs/2502.07847v1
Date: Tue, 11 Feb 2025 10:10:15 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-13 18:10:00.722918
Title: Technical note on calibrating vision-language models under covariate shift
Title（参考訳）: 共変量シフト下における視覚言語モデルの校正に関する技術的考察
Authors: Behraj Khan, Rizwan Qureshi, Tahir Syed,
Abstract要約: 低ショットビジョン分類のための視覚言語基盤モデルは、ターゲットデータ分布に一般化する限られた能力を有する。我々は,共変量シフトと信頼の相違を緩和する統合フレームワークであるtextitConfidence-Calibrated Covariate Shift Correction(C3SC$)を提案する。 C3SC$はキャリブレーションの堅牢性(ECE)を最大5.82%向上させる。
参考スコア（独自算出の注目度）: 2.8470354623829577
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Despite being a successful example of emerging capability, vision-language foundation models for low-shot vision classification have a limited ability to sufficiently generalize to the target data distribution due to sample poverty, leading to sensitivity to variations in the data. A popular mitigation strategy is finetuning over multiple datasets, but domain generalization is expensive when practiced in this manner. This work examines both covariate shift between pre-training data and the underspecified target data, and \textit{confidence misalignment}, where the model's prediction confidence amplified by the limited data availability. We propose \textit{Confidence-Calibrated Covariate Shift Correction ($C3SC$)}, a unified framework to mitigate both covariate shift and confidence misalignment. $C3SC$ leverages Fisher information penalty for covariate shift correction and confidence misalignment penalty (CMP) to lower confidence on misclassified examples. Experimental results across various vision and covariate shift datasets demonstrates that $C3SC$ significantly improves in calibration (ECE) by $5.82\%$ at maximum. $C3SC$ shows better robustness as well by showing $3.5\%$ improvement in accuracy metric on challenging covariate shift datasets, making $C3SC$ a promising solution for reliable real-world vision-language low-shot applications under distribution shift.
Abstract（参考訳）: 新興能力の例としては成功したものの、低ショット視覚分類のための視覚言語基礎モデルは、サンプルの貧困による対象データ分布に十分に一般化する能力に制限があり、データの変動に敏感になる。一般的な緩和戦略は、複数のデータセットを微調整するが、ドメインの一般化は、この方法で実践する場合、高価である。本研究では、事前学習データと未特定対象データとの共変量シフトと、限られたデータ可用性によってモデルの予測信頼度が増幅される「textit{confidence misalignment」について検討する。我々は、共変量シフトと信頼の相違を緩和する統一的なフレームワークである「textit{Confidence-Calibrated Covariate Shift Correction」(C3SC$)}を提案する。 C3SC$は、CMP(covariate shift correct and confidence misalignment penalty)に対してFisher情報ペナルティを利用して、分類ミスの事例に対する信頼性を低くする。様々なビジョンと共変量シフトデータセットの実験的結果は、C3SC$がキャリブレーション(ECE)を最大5.82\%改善することを示した。 C3SC$は、共変量シフトデータセットに挑戦する際の正確度を3.5\%$で改善することで、信頼性の高い実世界のビジョン言語ローショットアプリケーションに対して、有望なソリューションを提供する。

関連論文リスト

Advancing Reliable Test-Time Adaptation of Vision-Language Models under Visual Variations [67.35596444651037]
視覚言語モデル(VLM)は、素晴らしいゼロショット機能を示すが、ラベル付きデータが利用できない場合、下流タスクの分散シフトに苦慮する。本稿では,信頼性を両面から高めるReliable Test-Time Adaptation (ReTA)法を提案する。
論文参考訳（メタデータ） (2025-07-13T05:37:33Z)
Technical report on label-informed logit redistribution for better domain generalization in low-shot classification with foundation models [0.0]
信頼度校正は、基礎モデルに基づく現実世界の意思決定システムにおいて、新たな課題である。本研究では,微調整の際,不正分類を罰する損失目標に組み込んだペナルティを提案する。 CMP(textitconfidence misalignment penalty)と呼ぶ。
論文参考訳（メタデータ） (2025-01-29T11:54:37Z)
Prediction Accuracy & Reliability: Classification and Object Localization under Distribution Shift [1.433758865948252]
本研究では,自然分布変化と気象増悪が検出品質および信頼性評価に与える影響について検討した。公開されている自動運転データセットから、新しいデータセットがキュレートされた。分散シフト中のCNNの粒度解析により、タスク性能と信頼性推定の両方に異なるタイプのシフトの影響を定量化することができる。
論文参考訳（メタデータ） (2024-09-05T14:06:56Z)
SGCCNet: Single-Stage 3D Object Detector With Saliency-Guided Data Augmentation and Confidence Correction Mechanism [7.631190617438259]
単一段階点ベース3次元物体検出器は、低品質物体(ILQ)の不十分な学習や、局所化精度と分類信頼度(MLC)の不一致といった課題に直面している。 ILQでは、SGCCNetがSaliency-Guided Data Augmentation(SGDA)戦略を採用し、低品質オブジェクトに対するモデルの堅牢性を高める。 MLCでは、ポイントベースマルチクラス検出器に特化して信頼性補正機構(CCM)を設計する。
論文参考訳（メタデータ） (2024-07-01T12:36:01Z)
Binary Classification with Confidence Difference [100.08818204756093]
本稿では,信頼性差分法 (ConfDiff) という,弱教師付き二項分類問題について考察する。本稿では,この問題に対処するためのリスク一貫性のあるアプローチを提案し,推定誤差が最適収束率と一致することを示す。また,整合性や収束率も証明されたオーバーフィッティング問題を緩和するためのリスク補正手法も導入する。
論文参考訳（メタデータ） (2023-10-09T11:44:50Z)
Multiclass Alignment of Confidence and Certainty for Network Calibration [10.15706847741555]
最近の研究では、ディープニューラルネットワーク(DNN)が過信的な予測を行う傾向があることが示されている。予測平均信頼度と予測確実性(MACC)の多クラスアライメントとして知られる簡易なプラグアンドプレイ補助損失を特徴とする列車時キャリブレーション法を提案する。本手法は,領域内および領域外両方のキャリブレーション性能を実現する。
論文参考訳（メタデータ） (2023-09-06T00:56:24Z)
Unleashing the Power of Graph Data Augmentation on Covariate Distribution Shift [50.98086766507025]
本稿では,AIA(Adversarial Invariant Augmentation)という,シンプルで効率の良いデータ拡張戦略を提案する。 AIAは、拡張プロセス中に元の安定した特徴を同時に保存しながら、新しい環境をエクスポーレーションし、生成することを目的としている。
論文参考訳（メタデータ） (2022-11-05T07:55:55Z)
Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文参考訳（メタデータ） (2022-01-11T23:01:12Z)
Test-time Batch Statistics Calibration for Covariate Shift [66.7044675981449]
我々は,推論中に深層モデルを新しい環境に適応させることを提案する。バッチ統計の校正に$alpha$-BNの一般的な定式化を提案する。また、統合テスト時間適応フレームワークCoreを形成するための新しい損失関数も提示する。
論文参考訳（メタデータ） (2021-10-06T08:45:03Z)
Predicting with Confidence on Unseen Distributions [90.68414180153897]
ドメイン適応と予測不確実性文学を結びつけて、挑戦的な未知分布のモデル精度を予測する。分類器の予測における信頼度(DoC)の差は,様々な変化に対して,分類器の性能変化を推定することに成功した。具体的には, 合成分布と自然分布の区別について検討し, その単純さにもかかわらず, DoCは分布差の定量化に優れることを示した。
論文参考訳（メタデータ） (2021-07-07T15:50:18Z)
Learning Invariant Representation with Consistency and Diversity for Semi-supervised Source Hypothesis Transfer [46.68586555288172]
本稿では,SSHT(Semi-supervised Source hypothesis Transfer)という新たなタスクを提案する。本研究では、ランダムに拡張された2つの未ラベルデータ間の予測整合性を容易にし、SSHTの簡易かつ効果的なフレームワークである一貫性と多様性の学習(CDL)を提案する。実験の結果,本手法は,DomainNet,Office-Home,Office-31データセット上で,既存のSSDA手法や教師なしモデル適応手法よりも優れていた。
論文参考訳（メタデータ） (2021-07-07T04:14:24Z)
Unlabelled Data Improves Bayesian Uncertainty Calibration under Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文参考訳（メタデータ） (2020-06-26T13:50:19Z)
Evaluating Prediction-Time Batch Normalization for Robustness under Covariate Shift [81.74795324629712]
我々は予測時間バッチ正規化と呼び、共変量シフト時のモデル精度とキャリブレーションを大幅に改善する。予測時間バッチ正規化は、既存の最先端アプローチに相補的な利点をもたらし、ロバスト性を向上させることを示します。この手法は、事前トレーニングと併用して使用すると、さまざまな結果が得られるが、より自然なタイプのデータセットシフトでは、パフォーマンスが良くないようだ。
論文参考訳（メタデータ） (2020-06-19T05:08:43Z)
Diversity inducing Information Bottleneck in Model Ensembles [73.80615604822435]
本稿では,予測の多様性を奨励することで,ニューラルネットワークの効果的なアンサンブルを生成する問題をターゲットにする。そこで本研究では,潜伏変数の学習における逆損失の多様性を明示的に最適化し,マルチモーダルデータのモデリングに必要な出力予測の多様性を得る。最も競争力のあるベースラインと比較して、データ分布の変化の下で、分類精度が大幅に向上した。
論文参考訳（メタデータ） (2020-03-10T03:10:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。