論文の概要: Reliability-Gated Source Anchoring for Continual Test-Time Adaptation
- arxiv url: http://arxiv.org/abs/2605.14063v2
- Date: Tue, 19 May 2026 02:22:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:08.349898
- Title: Reliability-Gated Source Anchoring for Continual Test-Time Adaptation
- Title(参考訳): 連続的なテスト時間適応のための信頼性保証型ソースアンカリング
- Authors: Vikash Singh, Debargha Ganguly, Weicong Chen, Sabyasachi Sahoo, Sreehari Sankar, Biyao Zhang, Mohsen Hariri, Shouren Wang, Osama Zafar, Christian Gagné, Vipin Chaudhary,
- Abstract要約: RMemSafeはROIDの拡張であり、凍結したソースの正規化予測エントロピーを使用して、目的のすべての明示的なソース結合の使用を減らします。
ASRと組み合わせて、RMemSafeは、マッチしたスプリットの連続破壊セルの8ドルに対して、最も低いエラーを達成している。
制御されたソース劣化スイープは、ROID+ASRよりも1.13タイムsの浅い損傷勾配を示し、優雅な劣化予測と一致している。
- 参考スコア(独自算出の注目度): 10.125561764902447
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Continual test-time adaptation (CTTA) updates a pretrained model online on an unlabeled, non-stationary stream while anchoring it to a frozen source checkpoint. This anchor is useful only when the source remains reliable. On CCC-Hard, however, a ResNet-50 source falls to approximately $1.3\%$ top-$1$ accuracy, while existing source-anchored CTTA methods continue applying the same anchor strength. We call this failure mode blind anchoring and propose RMemSafe, a reliability-gated extension of ROID that uses the frozen source's normalized predictive entropy to attenuate all explicit source-coupled uses in the objective. When the source posterior approaches uniformity, the gate closes: the source anchor and agreement filter vanish, and the objective reduces to a source-agnostic fallback comprising ROID's base losses plus marginal calibration. Combined with ASR, RMemSafe achieves the lowest error on $8$ of $9$ matched-split continual-corruption cells and is the best reset-based method on all $9$, improving ROID+ASR by $1.05$~pp on ResNet-50 and $0.48$~pp on ViT-B/16. A controlled source-degradation sweep shows a $1.13{\times}$ shallower harm slope than ROID+ASR, consistent with the graceful-decay prediction. The entropy gate detects high-entropy source collapse, not confidently wrong low-entropy sources; this scope is explicitly evaluated and discussed.
- Abstract(参考訳): 連続テスト時間適応(CTTA)は、未ラベルの非定常ストリーム上で事前トレーニングされたモデルを更新し、凍結したソースチェックポイントに固定する。
このアンカーは、ソースが信頼できる場合にのみ有効である。
しかしCCC-Hardでは、ResNet-50のソースは1.3\%の精度で1.3\%に低下し、既存のソースアンコールCTTAメソッドも同様のアンカー強度を適用し続けている。
我々は、この障害モードをブラインドアンカーと呼び、凍結したソースの正規化予測エントロピーを用いて、その目的におけるすべての明示的なソース結合の使用を減らし、信頼性の高いROIDの拡張であるRMemSafeを提案する。
ソースアンカーと合意フィルタは消滅し、目的はROIDのベース損失と限界校正を含むソース非依存のフォールバックに還元される。
ASRと組み合わせて、RMemSafeは、マッチしたスプリットの連続破壊セルの$9$で最低エラーを達成し、9$で最高リセットベースのメソッドであり、ResNet-50では$1.05$~pp、ViT-B/16では$0.48$~ppでROID+ASRを改善する。
制御されたソース劣化スイープは、ROID+ASRよりも1.13{\times=浅いハーネス勾配を示し、優雅なデカイ予測と一致している。
エントロピーゲートは、高エントロピー源の崩壊を検知し、信頼性に欠ける低エントロピー源を検出する。
関連論文リスト
- TILT: Target-induced loss tilting under covariate shift [14.526961596109361]
我々は、教師なしドメイン適応のためのTarget-induced Loss Tilting(TILT)を紹介し、分析する。
ソース予測を$f+b$として分解する新しい客観的関数に基づいて、ラベル付きソースデータに$f+b$を適合させ、同時にラベルなしターゲット入力に補助コンポーネント$b$をペナル化する。
この標的側のペナルティは、人口レベルでの相対的な重み付けを暗黙的に引き起こすが、推定値として$b*_f$は、現在の誤差に自己局所化され、任意のソース・ターゲット対に対して均一に拘束される。
論文 参考訳(メタデータ) (2026-05-14T02:26:34Z) - Learning When to Act: Communication-Efficient Reinforcement Learning via Run-Time Assurance [0.27998963147546146]
Lyapunov の安全性保護の下で制御入力と通信効率のタイミング決定を単一ポリシで学習できることが示される。
実行時保証層は、1ステップのリアプノフ予測と事前計算されたLQRバックアップを介してポリシーをオーバーライドする。
12-state 3D quadrotor のケーススタディでは、古典的な STC が難解な高次元システムにフレームワークを拡張している。
論文 参考訳(メタデータ) (2026-05-11T23:55:15Z) - Exactness Matters for Physical Rule Enforcement [4.230349220081444]
より強い物理ルールの執行がいつ信頼できるか、いつそれが流通シフトの源となるかは、まだ不明である。
この問題は作用素の正確性(すなわち、補修写像が対象多様体上の恒等写像であるかどうか)を通して研究する。
制御ミスマッチ、スクリーニングされたクリーンアップ、アダプティブゲーティング、および外部バックボーンチェックは、最適な近似登録操作ポイントが生またはほぼ同一であることを示す。
論文 参考訳(メタデータ) (2026-05-08T07:59:59Z) - Reinforcement Learning from Multi-Source Imperfect Preferences: Best-of-Both-Regimes Regret [71.69884486156359]
我々は, 累積的不完全化予算を用いて, エンフルティソースの不完全性選好からエピソードRLを考察した。
我々は,最良な登録行動を示す,後悔$tildeO(sqrtK/M+)$の統一アルゴリズムを提案する。
論文 参考訳(メタデータ) (2026-03-20T19:34:53Z) - $V_{0.5}$: Generalist Value Model as a Prior for Sparse RL Rollouts [81.48669089692189]
一般値モデル(例えば$V_0.5$)は、コンテキスト内のモデル機能を明示的にエンコードすることで、事前訓練された値推定を実現する。
本稿では,このような値モデルにより予測されるベースラインと,スパースロールアウトから導出される経験的平均とを適応的に融合する$V_0.5$を提案する。
V_0.5$はGRPOとDAPOを大きく上回り、より高速な収束と約10%のパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2026-03-11T14:57:41Z) - Diffusion Controller: Framework, Algorithms and Parameterization [54.82539154511621]
本稿では,逆拡散サンプリングを(一般化された)線形解法マルコフ決定過程における状態のみの制御として活用する統一的な制御理論的視点を提案する。
このフレームワークでは、制御はトレーニング済みのリバースタイムのトランジションカーネルを再重み付けし、端末の目的と$f$分割コストのバランスをとる。
安定拡散v1.4の実験では、選好調整の勝利率が一貫した上昇を示し、品質効率のトレードオフを改善した。
論文 参考訳(メタデータ) (2026-03-07T01:49:59Z) - ODAR: Principled Adaptive Routing for LLM Reasoning via Active Inference [60.958331943869126]
ODAR-Expertは、原則化されたリソース割り当てによる精度と効率のトレードオフを最適化する適応的なルーティングフレームワークである。
我々は、MATHの98.2%の精度、HumanityのLast Examの54.8%を含む、強く一貫した利得を示している。
論文 参考訳(メタデータ) (2026-02-27T05:22:01Z) - BadCLIP++: Stealthy and Persistent Backdoors in Multimodal Contrastive Learning [73.46118996284888]
マルチモーダル・コントラスト学習モデルに対するバックドア攻撃の研究は、ステルスネスと永続性という2つの大きな課題に直面している。
両課題に対処する統合フレームワークであるBadCLIP++を提案する。
ステルスネスのために,タスク関連領域付近に知覚不可能なパターンを埋め込むセマンティックフュージョンQRマイクロトリガーを導入する。
持続性については、半径縮小とセントロイドアライメントによるトリガ埋め込みを安定化する。
論文 参考訳(メタデータ) (2026-02-19T08:31:16Z) - RRaPINNs: Residual Risk-Aware Physics Informed Neural Networks [0.0]
物理インフォームドニューラルネットワーク(PINN)は通常、大きな局所的なエラーを隠蔽する平均残差を最小化する。
CVaR(Residual Risk-Aware Physics-Informed Neural Networks PINNs)を提案する。
本稿では, メモリレスサンプリング, グローバルのみのテール予算, 残留中心リスクなどのフレームワークの制限について論じ, 永続的ハードポイント再生, 局所的リスク予算, およびBC/IC用語に対する多目的リスクを概説する。
論文 参考訳(メタデータ) (2025-11-23T16:10:45Z) - Stochastic gradient descent for streaming linear and rectified linear systems with adversarial corruptions [8.756480554457985]
我々は,SGD-expを最大50%のMassart汚職率で真のパラメータにほぼ線形収束する新しい保証を示す。
これはストリーミング環境での堅牢なReLU回帰に対する初めての収束保証結果である。
論文 参考訳(メタデータ) (2024-03-02T12:45:01Z) - SLOE: A Faster Method for Statistical Inference in High-Dimensional
Logistic Regression [68.66245730450915]
実用データセットに対する予測の偏見を回避し、頻繁な不確実性を推定する改善された手法を開発している。
私たちの主な貢献は、推定と推論の計算時間をマグニチュードの順序で短縮する収束保証付き信号強度の推定器SLOEです。
論文 参考訳(メタデータ) (2021-03-23T17:48:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。