論文の概要: Learning to Defer in Non-Stationary Time Series via Switching State-Space Models
- arxiv url: http://arxiv.org/abs/2601.22538v1
- Date: Fri, 30 Jan 2026 04:18:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-02 18:28:15.216439
- Title: Learning to Defer in Non-Stationary Time Series via Switching State-Space Models
- Title(参考訳): 状態空間モデルの変更による非定常時系列のデファーの学習
- Authors: Yannis Montreuil, Letian Yu, Axel Carlier, Lai Xing Ng, Wei Tsang Ooi,
- Abstract要約: 本研究では,非定常時系列の学習 to Deferについて,部分的なフィードバックと時間変化による専門家の可用性について検討する。
L2D-SLDSは文脈依存型状態遷移を持つ線形ガウス状態空間モデルである。
IDSにインスパイアされたルーティングルールを提案し、予測コストを、潜伏体制や共有要因に関する情報と引き換えに取引する。
- 参考スコア(独自算出の注目度): 7.413102772934999
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study Learning to Defer for non-stationary time series with partial feedback and time-varying expert availability. At each time step, the router selects an available expert, observes the target, and sees only the queried expert's prediction. We model signed expert residuals using L2D-SLDS, a factorized switching linear-Gaussian state-space model with context-dependent regime transitions, a shared global factor enabling cross-expert information transfer, and per-expert idiosyncratic states. The model supports expert entry and pruning via a dynamic registry. Using one-step-ahead predictive beliefs, we propose an IDS-inspired routing rule that trades off predicted cost against information gained about the latent regime and shared factor. Experiments show improvements over contextual-bandit baselines and a no-shared-factor ablation.
- Abstract(参考訳): 本研究では,非定常時系列の学習 to Deferについて,部分的なフィードバックと時間変化による専門家の可用性について検討する。
各ステップで、ルータは利用可能な専門家を選択し、ターゲットを観察し、クエリされた専門家の予測のみを確認する。
我々は、L2D-SLDS、文脈依存的な状態遷移を持つ分解された線形ガウス状態空間モデル、クロスエキスパート情報伝達を可能にする共有グローバル因子、および専門家ごとの慣用的状態を用いて、署名された専門家残基をモデル化する。
このモデルは、動的レジストリを介して専門家のエントリーとプルーニングをサポートする。
1段階の予測的信念を用いて、予測コストを、潜伏体制や共有要因に関する情報と引き換えに、IDSにインスパイアされたルーティングルールを提案する。
実験は文脈帯域ベースラインの改善と非共有要素アブレーションを示す。
関連論文リスト
- A Probabilistic Framework for Temporal Distribution Generalization in Industry-Scale Recommender Systems [14.592975643628188]
時間分布シフトは、推奨システムの長期的な精度を損なう。
本稿では,産業規模のインクリメンタル学習パイプラインにシームレスに統合する確率的フレームワークを提案する。
本手法は時間的一般化に優れ,ユーザ当たりのGMVは2.33%上昇する。
論文 参考訳(メタデータ) (2025-11-26T04:02:23Z) - ResAD: Normalized Residual Trajectory Modeling for End-to-End Autonomous Driving [64.42138266293202]
ResADは正規化された残留軌道モデリングフレームワークである。
学習タスクを再編成し、慣性参照からの残留偏差を予測する。
NAVSIMベンチマークでは、ResADはバニラ拡散ポリシーを用いて最先端のPDMS 88.6を達成している。
論文 参考訳(メタデータ) (2025-10-09T17:59:36Z) - FreRA: A Frequency-Refined Augmentation for Contrastive Learning on Time Series Classification [56.925103708982164]
周波数領域からの新たな視点を示し、ダウンストリーム分類の利点として、グローバル、独立、コンパクトの3つを識別する。
本稿では,分類タスクにおける時系列のコントラスト学習に適した,軽量で効果的な周波数補充拡張(FreRA)を提案する。
FreRAは、時系列分類、異常検出、転送学習タスクにおいて、常に10つの主要なベースラインを上回ります。
論文 参考訳(メタデータ) (2025-05-29T07:18:28Z) - Offline Imitation Learning with Model-based Reverse Augmentation [48.64791438847236]
本稿では,自己ペースの逆拡張によるオフラインImitation Learningという,新しいモデルベースフレームワークを提案する。
具体的には、オフラインのデモからリバース・ダイナミック・モデルを構築し、専門家が観察した状態につながる軌道を効率的に生成する。
後続の強化学習法を用いて,拡張軌道から学習し,未観測状態から未観測状態へ移行する。
論文 参考訳(メタデータ) (2024-06-18T12:27:02Z) - Right on Time: Revising Time Series Models by Constraining their Explanations [18.266824309661168]
ディープ時系列モデルは、しばしば急激な相関に依存する傾向があるため、信頼性の問題に悩まされる。
このようなショートカットを緩和し、時系列モデルにおける"Clever-Hans"モーメントを防止するために、Right on Time(RioT)を導入する。
RioTはモデルを制約し、注釈付きスプリアス相関から遠ざけている。
論文 参考訳(メタデータ) (2024-02-20T11:15:13Z) - OpenSTL: A Comprehensive Benchmark of Spatio-Temporal Predictive
Learning [67.07363529640784]
提案するOpenSTLは,一般的なアプローチを再帰的モデルと再帰的モデルに分類する。
我々は, 合成移動物体軌道, 人間の動き, 運転シーン, 交通流, 天気予報など, さまざまな領域にわたるデータセットの標準評価を行う。
リカレントフリーモデルは、リカレントモデルよりも効率と性能のバランスが良いことがわかった。
論文 参考訳(メタデータ) (2023-06-20T03:02:14Z) - On Covariate Shift of Latent Confounders in Imitation and Reinforcement
Learning [69.48387059607387]
模擬・強化学習において,未観測の共同設立者と専門家データを併用することの問題点を考察する。
我々は、外部報酬を伴わずに、確立した専門家データから学ぶことの限界を分析する。
我々は,支援医療とレコメンデーションシステムシミュレーションの課題に挑戦する上で,我々の主張を実証的に検証する。
論文 参考訳(メタデータ) (2021-10-13T07:31:31Z) - Learning summary features of time series for likelihood free inference [93.08098361687722]
時系列データから要約機能を自動的に学習するためのデータ駆動型戦略を提案する。
以上の結果から,データから要約的特徴を学習することで,手作りの値に基づいてLFI手法よりも優れる可能性が示唆された。
論文 参考訳(メタデータ) (2020-12-04T19:21:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。