Fugu-MT 論文翻訳(概要): Adaptive Calibration in Non-Stationary Environments

論文の概要: Adaptive Calibration in Non-Stationary Environments

arxiv url: http://arxiv.org/abs/2605.11490v1
Date: Tue, 12 May 2026 04:06:40 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-13 21:48:56.565096
Title: Adaptive Calibration in Non-Stationary Environments
Title（参考訳）: 非定常環境における適応校正
Authors: Junyan Liu, Haipeng Luo, Lillian J. Ratliff,
Abstract要約: 複数のキャリブレーション対策の下で適応的なキャリブレーション保証を実現するアルゴリズムの組を開発する。我々の手法は先行研究(Hu et al., 2026, Luo et al., 2025)の上に構築され、基礎となる基底真理付近でより微細な分解を割り当てる予測空間の非一様分割を導入する。
参考スコア（独自算出の注目度）: 44.81344039432424
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Making calibrated online predictions is a central challenge in modern AI systems. Much of the existing literature focuses on fully adversarial environments where outcomes may be arbitrary, leading to conservative algorithms that can perform suboptimally in more benign settings, such as when outcomes are nearly stationary. This gap raises a natural question: can we design online prediction algorithms whose calibration error automatically adapts to the degree of non-stationarity in the environment, smoothly interpolating between i.i.d. and adversarial regimes? We answer this question in the affirmative and develop a suite of algorithms that achieve adaptive calibration guarantees under multiple calibration measures. Specifically, with $T$ being the number of rounds and $C\in[0,T]$ being an unknown non-stationary measure defined as the minimal $\ell_1$ deviation of the mean outcomes, our algorithms attain $\widetilde{O}(\sqrt{T}+(TC)^{\frac{1}{3}})$ for $\ell_1$ calibration error and $\widetilde{O}((1+C)^{\frac{1}{3}})$ for both $\ell_2$ and pseudo KL calibration error. These bounds match the optimal rates in the stationary case ($C=0$) and recover known guarantees in the fully adversarial regime ($C=T$). Our approach builds on and extends prior work [Hu et al., 2026, Luo et al., 2025], introducing an epoch-based scheduling together with a novel non-uniform partition of the prediction space that allocates finer resolution near the underlying ground truth.
Abstract（参考訳）: オンライン予測を校正することは、現代のAIシステムにおいて重要な課題である。既存の文献の多くは、結果が任意である可能性のある完全な敵対的な環境に焦点を当てており、結果がほぼ定常であるような、より良質な設定で最適に実行できる保守的なアルゴリズムにつながっている。キャリブレーションエラーが環境の非定常度に自動的に適応し、i.d.d.と敵の体制をスムーズに補間するオンライン予測アルゴリズムを設計できるだろうか? 本稿では,複数のキャリブレーション対策の下で適応的なキャリブレーション保証を実現するアルゴリズム群を開発した。具体的には、$T$はラウンド数であり、$C\in[0,T]$は平均結果の最小値である$\ell_1$の偏差として定義される未知の非定常測度であり、我々のアルゴリズムは$\widetilde{O}(\sqrt{T}+(TC)^{\frac{1}{3}})$ for $\ell_1$の校正誤差と$\widetilde{O}((1+C)^{\frac{1}{3}})$を$\ell_2$と擬似KLの校正誤差の両方に対して$\widetilde{O}(\sqrt{T}+(TC)^{\frac{1}{3}})$に達する。これらの境界は定常の場合(C=0$)の最適レートと一致し、完全に敵対的な体制(C=T$)における既知の保証を回復する。提案手法は先行研究(Hu et al , 2026, Luo et al , 2025)の上に構築され, 基礎となる基底真理付近でより微細な分解能を割り当てる予測空間の非一様分割と共にエポックベースのスケジューリングを導入する。

関連論文リスト

Optimal Unconstrained Self-Distillation in Ridge Regression: Strict Improvements, Precise Asymptotics, and One-Shot Tuning [61.07540493350384]
自己蒸留(英: Self-distillation, SD)とは、教師自身の予測と地道の混合で学生を訓練する過程である。任意の予測リスクに対して、各正規化レベルにおいて、最適に混合された学生がリッジ教師に改善されることが示される。本稿では,グリッド探索やサンプル分割,再構成なしに$star$を推定する一貫したワンショットチューニング手法を提案する。
論文参考訳（メタデータ） (2026-02-19T17:21:15Z)
Near-optimal Swap Regret Minimization for Convex Losses [21.006993033547708]
我々は、ほぼ最適の$widetilde O(sqrt T)$期待スワップリミスを保証するランダム化されたオンラインアルゴリズムを、単位区間において適応的に選択されたLipschitz凸損失の任意の列に対して与える。
論文参考訳（メタデータ） (2026-02-09T16:26:34Z)
Efficient Calibration for Decision Making [26.81026842833163]
HuとWu(FOCS'24)はこれを、キャリブレーション決定損失(mathsfCDL$)と呼ばれる近似キャリブレーション尺度を定義するために使用する。我々は、$mathsfCDL_K$が情報理論および計算学的に抽出可能なときの包括的理論を開発する。
論文参考訳（メタデータ） (2025-11-17T18:52:00Z)
Truthfulness of Decision-Theoretic Calibration Measures [5.414308305392762]
サブサンプリングステップキャリブレーションと呼ばれる新たなキャリブレーション尺度である$mathsfStepCEtextsfsub$を導入する。特に、任意の積分布において、$mathsfStepCEtextsfsub$は$O(1)$ factorまで真であるのに対し、事前決定理論の校正策は$e-Omega(T)$-$Omega(sqrtT)$ truthfulness gapに苦しむ。
論文参考訳（メタデータ） (2025-03-04T08:20:10Z)
Orthogonal Causal Calibration [55.28164682911196]
我々は、因果校正作業を標準(非因果予測モデル)の校正作業に還元する一般的なアルゴリズムを開発する。以上の結果から,既存のキャリブレーションアルゴリズムを因果的設定に応用できることが示唆された。
論文参考訳（メタデータ） (2024-06-04T03:35:25Z)
Variance-Dependent Regret Bounds for Non-stationary Linear Bandits [52.872628573907434]
報酬分布の分散と$B_K$の分散を利用するアルゴリズムを提案する。 Restarted Weighted$textOFUL+$とRestarted$textSAVE+$の2つの新しいアルゴリズムを紹介します。特に、V_K$が$K$よりはるかに小さい場合、我々のアルゴリズムは、異なる設定下での非定常線形バンドレットの最先端結果よりも優れている。
論文参考訳（メタデータ） (2024-03-15T23:36:55Z)
Testing Calibration in Nearly-Linear Time [14.099477870728595]
プロパティテストのレンズによるキャリブレーションのアルゴリズム的な研究に焦点をあてる。実験的なスムーズなキャリブレーション線形プログラムは,高構造グラフ上の最小コストフローの例として再計算できる,という簡単な観察を行う。我々は,キャリブレーションの標準概念を忠実に捉え,我々のアルゴリズムが大規模なサンプルサイズに対応するために効率的にスケールできることを実証する実験を行った。
論文参考訳（メタデータ） (2024-02-20T17:53:24Z)
An Elementary Predictor Obtaining $2\sqrt{T}+1$ Distance to Calibration [4.628072661683411]
オンライン予測器は, 対向的な設定でキャリブレーションまでの距離が$O(sqrtT)$であることを示す。キャリブレーション誤差を最大2sqrtT+1$で求める,極めて単純,効率的,決定論的アルゴリズムを提案する。
論文参考訳（メタデータ） (2024-02-18T00:53:05Z)
Variance-Dependent Regret Bounds for Linear Bandits and Reinforcement Learning: Adaptivity and Computational Efficiency [90.40062452292091]
本稿では,不整合雑音を持つ線形帯域に対する計算効率のよい最初のアルゴリズムを提案する。我々のアルゴリズムは未知のノイズの分散に適応し、$tildeO(d sqrtsum_k = 1K sigma_k2 + d)$ regretを達成する。また、強化学習において、線形混合マルコフ決定過程(MDP)に対する分散適応アルゴリズムを提案する。
論文参考訳（メタデータ） (2023-02-21T00:17:24Z)
Large-Scale Methods for Distributionally Robust Optimization [53.98643772533416]
我々のアルゴリズムは、トレーニングセットのサイズとパラメータの数によらず、多くの評価勾配を必要とすることを証明している。 MNIST と ImageNet の実験により,本手法の 9-36 倍の効率性を持つアルゴリズムの理論的スケーリングが確認された。
論文参考訳（メタデータ） (2020-10-12T17:41:44Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。