論文の概要: Multi-modal Test-time Adaptation via Adaptive Probabilistic Gaussian Calibration
- arxiv url: http://arxiv.org/abs/2604.19093v1
- Date: Tue, 21 Apr 2026 05:18:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.632684
- Title: Multi-modal Test-time Adaptation via Adaptive Probabilistic Gaussian Calibration
- Title(参考訳): 適応確率ガウス校正による多モードテスト時間適応
- Authors: Jinglin Xu, Yi Li, Chuxiong Sun, Xiao Xu, Jiangmeng Li, Fanjiang Xu,
- Abstract要約: 我々は,カテゴリ条件分布を明示的にモデル化するために,マルチモーダルTTAのための固有確率ガウスモデルを提案する。
また, 適応的な非対称性補正手法を提案し, モダリティ非対称性から生じる悪影響に対処する。
本手法は,多種多様な分散シフト下での最先端性能を実現する。
- 参考スコア(独自算出の注目度): 29.33411240603458
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-modal test-time adaptation (TTA) enhances the resilience of benchmark multi-modal models against distribution shifts by leveraging the unlabeled target data during inference. Despite the documented success, the advancement of multi-modal TTA methodologies has been impeded by a persistent limitation, i.e., the lack of explicit modeling of category-conditional distributions, which is crucial for yielding accurate predictions and reliable decision boundaries. Canonical Gaussian discriminant analysis (GDA) provides a vanilla modeling of category-conditional distributions and achieves moderate advancement in uni-modal contexts. However, in multi-modal TTA scenario, the inherent modality distribution asymmetry undermines the effectiveness of modeling the category-conditional distribution via the canonical GDA. To this end, we introduce a tailored probabilistic Gaussian model for multi-modal TTA to explicitly model the category-conditional distributions, and further propose an adaptive contrastive asymmetry rectification technique to counteract the adverse effects arising from modality asymmetry, thereby deriving calibrated predictions and reliable decision boundaries. Extensive experiments across diverse benchmarks demonstrate that our method achieves state-of-the-art performance under a wide range of distribution shifts. The code is available at https://github.com/XuJinglinn/AdaPGC.
- Abstract(参考訳): マルチモーダルテスト時間適応(TTA)は、ベンチマークマルチモーダルモデルの分散シフトに対するレジリエンスを高める。
文書化された成功にもかかわらず、マルチモーダルなTTA手法の進歩は永続的な制限、すなわちカテゴリー条件分布の明示的なモデリングの欠如によって妨げられている。
カノニカルガウス判別分析(GDA)は、圏条件分布のバニラモデルを提供し、ユニモーダル文脈における適度な進歩を達成する。
しかし、マルチモーダルTTAシナリオでは、固有モダリティ分布非対称性は、標準GDAによるカテゴリー条件分布のモデル化の有効性を損なう。
この目的のために,マルチモーダルTTAの確率的ガウスモデルを導入して,カテゴリ条件分布を明示的にモデル化するとともに,モダリティ非対称性に起因する悪影響を対処する適応的コントラスト非対称性補正手法を提案し,キャリブレーション予測と信頼性決定境界を導出する。
多様なベンチマークによる大規模な実験により,本手法は広範囲な分散シフトの下で最先端の性能を達成できることが示されている。
コードはhttps://github.com/XuJinglinn/AdaPGCで入手できる。
関連論文リスト
- Gaussian Joint Embeddings For Self-Supervised Representation Learning [0.0]
自己パラメトリック表現学習は、しばしば決定論的予測アーキテクチャに頼り、潜在空間におけるコンテキストとターゲットビューを整列させる。
生成的関節モデルに基づく確率的代替案を提案する。
論文 参考訳(メタデータ) (2026-03-26T00:54:54Z) - RDIT: Residual-based Diffusion Implicit Models for Probabilistic Time Series Forecasting [4.140149411004857]
RDITは、点推定と残差に基づく条件拡散と双方向のMambaネットワークを組み合わせたプラグアンドプレイフレームワークである。
RDITは, 強いベースラインに比べてCRPSの低下, 高速推論, カバレッジの向上を実現している。
論文 参考訳(メタデータ) (2025-09-02T14:06:29Z) - Continuous Bayesian Model Selection for Multivariate Causal Discovery [22.945274948173182]
離散モデル選択問題の連続緩和を利用したスケーラブルなアルゴリズムを提案する。
ベイズ非パラメトリックモデルとしてカウスカルプロセス条件密度推定器(CGP-CDE)を用いる。
この行列は、限界確率と非巡回正規化器を用いて最適化され、最大 A 後方因果グラフを与える。
論文 参考訳(メタデータ) (2024-11-15T12:55:05Z) - MITA: Bridging the Gap between Model and Data for Test-time Adaptation [68.62509948690698]
テスト時間適応(TTA)は、モデルの一般化性を高めるための有望なパラダイムとして登場した。
本稿では,Met-In-The-MiddleをベースとしたMITAを提案する。
論文 参考訳(メタデータ) (2024-10-12T07:02:33Z) - Diffusion models for probabilistic programming [56.47577824219207]
拡散モデル変分推論(DMVI)は確率型プログラミング言語(PPL)における自動近似推論手法である
DMVIは実装が容易で、例えば正規化フローを用いた変分推論の欠点を伴わずに、PPLでヘイズルフリー推論が可能であり、基礎となるニューラルネットワークモデルに制約を課さない。
論文 参考訳(メタデータ) (2023-11-01T12:17:05Z) - Comparing Probability Distributions with Conditional Transport [63.11403041984197]
新しい発散として条件輸送(CT)を提案し、償却されたCT(ACT)コストと近似します。
ACTは条件付き輸送計画の計算を補正し、計算が容易な非バイアスのサンプル勾配を持つ。
さまざまなベンチマークデータセットのジェネレーティブモデリングでは、既存のジェネレーティブ敵対ネットワークのデフォルトの統計距離をACTに置き換えることで、一貫してパフォーマンスを向上させることが示されています。
論文 参考訳(メタデータ) (2020-12-28T05:14:22Z) - Autoregressive Score Matching [113.4502004812927]
自動回帰条件スコアモデル(AR-CSM)を提案する。
AR-CSMモデルでは、このデータ分布とモデル分布のばらつきを効率的に計算し、最適化することができ、高価なサンプリングや対向訓練を必要としない。
本研究では,合成データに対する密度推定,画像生成,画像復調,暗黙エンコーダを用いた潜在変数モデルの訓練に応用できることを示す。
論文 参考訳(メタデータ) (2020-10-24T07:01:24Z) - Stacking for Non-mixing Bayesian Computations: The Curse and Blessing of
Multimodal Posteriors [8.11978827493967]
MCMCの並列実行, 変動型, モードベースの推論を用いて, できるだけ多くのモードをヒットさせる手法を提案する。
重み付き推論プロセスが真のデータを近似する例と理論的整合性を示す。
いくつかのモデルファミリで実践的な実装を示す。
論文 参考訳(メタデータ) (2020-06-22T15:26:59Z) - Decision-Making with Auto-Encoding Variational Bayes [71.44735417472043]
変分分布とは異なる後部近似を用いて意思決定を行うことが示唆された。
これらの理論的な結果から,最適モデルに関するいくつかの近似的提案を学習することを提案する。
おもちゃの例に加えて,単細胞RNAシークエンシングのケーススタディも紹介する。
論文 参考訳(メタデータ) (2020-02-17T19:23:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。