論文の概要: Tempora: Characterising the Time-Contingent Utility of Online Test-Time Adaptation
- arxiv url: http://arxiv.org/abs/2602.06136v1
- Date: Thu, 05 Feb 2026 19:10:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-09 22:18:26.072453
- Title: Tempora: Characterising the Time-Contingent Utility of Online Test-Time Adaptation
- Title(参考訳): Tempora: オンラインテスト時間適応の時間持続的ユーティリティを特徴付ける
- Authors: Sudarshan Sreeram, Young D. Kwon, Cecilia Mascolo,
- Abstract要約: テスト時間適応(TTA)は、ドメインシフトの下で劣化するマシンラーニング(ML)モデルに対して、魅力的な治療法を提供する。
従来の評価では、正確さとレイテンシのトレードオフを見越して、無制限の処理時間を前提としていた。
時間的圧力下でのTTA評価のためのフレームワークであるTemporaを紹介する。
- 参考スコア(独自算出の注目度): 16.841308606553685
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Test-time adaptation (TTA) offers a compelling remedy for machine learning (ML) models that degrade under domain shifts, improving generalisation on-the-fly with only unlabelled samples. This flexibility suits real deployments, yet conventional evaluations unrealistically assume unbounded processing time, overlooking the accuracy-latency trade-off. As ML increasingly underpins latency-sensitive and user-facing use-cases, temporal pressure constrains the viability of adaptable inference; predictions arriving too late to act on are futile. We introduce Tempora, a framework for evaluating TTA under this pressure. It consists of temporal scenarios that model deployment constraints, evaluation protocols that operationalise measurement, and time-contingent utility metrics that quantify the accuracy-latency trade-off. We instantiate the framework with three such metrics: (1) discrete utility for asynchronous streams with hard deadlines, (2) continuous utility for interactive settings where value decays with latency, and (3) amortised utility for budget-constrained deployments. Applying Tempora to seven TTA methods on ImageNet-C across 240 temporal evaluations reveals rank instability: conventional rankings do not predict rankings under temporal pressure; ETA, a state-of-the-art method in the conventional setting, falls short in 41.2% of evaluations. The highest-utility method varies with corruption type and temporal pressure, with no clear winner. By enabling systematic evaluation across diverse temporal constraints for the first time, Tempora reveals when and why rankings invert, offering practitioners a lens for method selection and researchers a target for deployable adaptation.
- Abstract(参考訳): テスト時間適応(TTA)は、ドメインシフトの下で劣化するマシンラーニング(ML)モデルに対して、魅力的な治療法を提供する。
この柔軟性は実際のデプロイメントに適しているが、従来の評価では、正確さとレイテンシのトレードオフを見越して、非バウンド処理時間を非現実的に想定している。
MLはレイテンシに敏感でユーザ対応のユースケースをますます支えているため、時間的プレッシャーは適応可能な推論の可能性を制限している。
この圧力下でTTAを評価するためのフレームワークであるTemporaを紹介する。
デプロイメントの制約をモデル化する時間的シナリオ、測定を運用する評価プロトコル、正確性とレイテンシのトレードオフを定量化する時間的ユーティリティメトリクスで構成されています。
1)ハードな期限付き非同期ストリームの離散ユーティリティ、(2)レイテンシで価値が劣化するインタラクティブな設定の連続ユーティリティ、(3)予算制約のあるデプロイメントの償却ユーティリティである。
240の時間的評価でImageNet-CにTemporaを7つのTTAメソッドに適用すると、ランクの不安定性が明らかになる。
もっとも有効性が高い方法は、汚職タイプや時間的圧力によって異なり、明確な勝者は存在しない。
様々な時間的制約を初めて体系的に評価することで、Temporaはいつ、なぜランクが逆転するのかを明らかにし、実践者にメソッド選択のためのレンズを提供し、研究者にデプロイ可能な適応のターゲットを提供する。
関連論文リスト
- Beyond Parameter Finetuning: Test-Time Representation Refinement for Node Classification [59.11332582888994]
グラフニューラルネットワークは、アウト・オブ・ディストリビューションテストのシナリオにおいて、大きなパフォーマンス劣化を示すことが多い。
本稿では,モデルパラメータから潜在表現へ適応対象を遷移させる新しいテスト時間表現ファインタニングフレームワークTTReFTを提案する。
具体的には,(1)特定の介入に対する不確実性誘導ノード選択,(2)事前学習した知識を保存する低ランク表現介入,(3)介入認識型マスク付きオートエンコーダの3つの重要な革新によって,TTReFTはこれを達成している。
論文 参考訳(メタデータ) (2026-01-29T12:17:34Z) - Test-Time Adaptation for Non-stationary Time Series: From Synthetic Regime Shifts to Financial Markets [0.0]
因果時間予測と方向分類のための小さなフットプリントテスト時間適応フレームワークについて検討した。
分類にはエントロピーを最小化し、時間的一貫性を強制する。
この枠組みは、ETTベンチマークの総合的体制シフトと、パンデミック、高インフレ、リカバリの2段階にわたるデイリーエクイティとFXシリーズ(SPY、QQQ、EUR/USD)で評価する。
論文 参考訳(メタデータ) (2026-01-20T22:30:23Z) - Counterfactual Explanations for Time Series Should be Human-Centered and Temporally Coherent in Interventions [17.023825093545582]
我々は,臨床推論や患者固有のダイナミックスに則った,持続的で目標指向の介入を反映した反事実へのシフトを提唱する。
本稿では, 時系列の最先端手法の解析を行い, 生成した反事実が測定ノイズに非常に敏感であることを示す。
論文 参考訳(メタデータ) (2025-12-16T16:31:10Z) - BayesTTA: Continual-Temporal Test-Time Adaptation for Vision-Language Models via Gaussian Discriminant Analysis [41.09181390655176]
CLIPのような視覚言語モデル(VLM)は、強いゼロショット認識を実現するが、実世界のシナリオに共通する時空間的な分散シフトの下で大幅に劣化する。
テスト分布が時間とともに徐々に変化するCT-TTA(textitContinal-Temporal Test-Time Adaptation)として、この実践的問題を定式化する。
我々は、時間的に一貫した予測を実行し、視覚表現を動的に調整する、ベイズ適応フレームワークであるtextitBayesTTAを提案する。
論文 参考訳(メタデータ) (2025-07-11T14:02:54Z) - Error-quantified Conformal Inference for Time Series [55.11926160774831]
時系列予測の不確かさの定量化は、時系列データの時間的依存と分布シフトのために困難である。
量子化損失関数をスムースにすることで,iError-quantified Conformal Inference (ECI)を提案する。
ECIは有効な誤発見制御と、他のベースラインよりも厳密な予測セットを出力することができる。
論文 参考訳(メタデータ) (2025-02-02T15:02:36Z) - Generative Regression Based Watch Time Prediction for Short-Video Recommendation [36.95095097454143]
短いビデオレコメンデーションシステムでは、時計の時間予測が重要なタスクとして現れている。
最近の研究は、連続時計時間推定を正規回帰タスクに変換することによって、これらの問題に対処しようとしている。
本稿では,WTPをシーケンス生成タスクとして再構成する新しい生成回帰(GR)フレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-28T16:48:55Z) - Interactive Test-Time Adaptation with Reliable Spatial-Temporal Voxels for Multi-Modal Segmentation [56.70910056845503]
マルチモーダルテストタイム適応(MM-TTA)は、補完的なマルチモーダル入力をオンライン形式で活用することにより、ラベルのないターゲットドメインにモデルを適応させる。
従来のMM-TTA法は, 時間的不整合によるフレームワイドの不安定な予測と, 信頼度誘導の仮定に反する不正確な予測の2つの大きな限界に悩まされていた。
Latte++は、より情報的な幾何学的対応によって不安定なフレーム単位の予測をより抑制し、対話型テスト時間適応(ITTA)は、努力を伴わない人間のフィードバックを促進するフレキシブルなアドオンである。
論文 参考訳(メタデータ) (2024-03-11T06:56:08Z) - Score Matching-based Pseudolikelihood Estimation of Neural Marked
Spatio-Temporal Point Process with Uncertainty Quantification [59.81904428056924]
我々は、不確実な定量化を伴うmarkPsを学習するためのスコアMAtching推定器であるSMASHを紹介する。
具体的には,スコアマッチングによるマークPsの擬似的類似度を推定することにより,正規化自由度を推定する。
提案手法の優れた性能は、事象予測と不確実性定量化の両方において広範な実験によって実証される。
論文 参考訳(メタデータ) (2023-10-25T02:37:51Z) - Modeling Online Behavior in Recommender Systems: The Importance of
Temporal Context [30.894950420437926]
推薦システムの性能を評価するときの時間的文脈の省略が、いかに誤った自信をもたらすかを示す。
既存のモデルに時間的文脈をさらに埋め込むためのトレーニング手順を提案する。
その結果、時間的目標を含めれば、リコール@20を最大20%改善できることがわかった。
論文 参考訳(メタデータ) (2020-09-19T19:36:43Z) - Towards Streaming Perception [70.68520310095155]
本稿では、リアルタイムオンライン知覚のための単一のメトリクスにレイテンシと精度を協調的に統合するアプローチを提案する。
この指標の背後にある重要な洞察は、瞬間ごとに認識スタック全体の出力を共同で評価することである。
本稿では,都市ビデオストリームにおけるオブジェクト検出とインスタンスセグメンテーションの具体的タスクに注目し,高品質で時間依存的なアノテーションを備えた新しいデータセットを寄贈する。
論文 参考訳(メタデータ) (2020-05-21T01:51:35Z) - Bottom-Up Temporal Action Localization with Mutual Regularization [107.39785866001868]
TALの最先端の解決策は、3つの行動指示相のフレームレベルの確率を評価することである。
学習手順を相互に規則化するための2つの規則化用語を導入する。
実験は2つの人気のTALデータセット、THUMOS14とActivityNet1.3で行われている。
論文 参考訳(メタデータ) (2020-02-18T03:59:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。