論文の概要: Recurrent Memory for Online Interdomain Gaussian Processes
- arxiv url: http://arxiv.org/abs/2502.08736v1
- Date: Wed, 12 Feb 2025 19:18:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-14 13:50:21.062467
- Title: Recurrent Memory for Online Interdomain Gaussian Processes
- Title(参考訳): オンライン領域間ガウス過程の繰り返し記憶
- Authors: Wenlong Chen, Naoki Kiyohara, Harrison Bo Hua Zhu, Yingzhen Li,
- Abstract要約: 本稿では,オンライン回帰設定における時系列データ中の長期記憶をキャプチャ可能な,新しいオンラインガウスプロセス(GP)モデルを提案する。
我々のモデルである Online HiPPO Sparse Variational Gaussian Process Regression (OHSGPR) は、その長距離メモリモデリング機能によりRNNドメインで普及しているHiPPOフレームワークを活用している。
我々は、HiPPOフレームワークがドメイン間GPフレームワークに自然に適合していることを示し、HiPPOのODE進化に基づく繰り返し形式でカーネル行列をオンラインで更新可能であることを示した。
- 参考スコア(独自算出の注目度): 18.91108540244912
- License:
- Abstract: We propose a novel online Gaussian process (GP) model that is capable of capturing long-term memory in sequential data in an online regression setting. Our model, Online HiPPO Sparse Variational Gaussian Process Regression (OHSGPR), leverages the HiPPO (High-order Polynomial Projection Operators) framework, which is popularized in the RNN domain due to its long-range memory modeling capabilities. We interpret the HiPPO time-varying orthogonal projections as inducing variables with time-dependent orthogonal polynomial basis functions, which allows the SGPR inducing points to memorize the process history. We show that the HiPPO framework fits naturally into the interdomain GP framework and demonstrate that the kernel matrices can also be updated online in a recurrence form based on the ODE evolution of HiPPO. We evaluate our method on time series regression tasks, showing that it outperforms the existing online GP method in terms of predictive performance and computational efficiency
- Abstract(参考訳): 本稿では,オンライン回帰設定における時系列データ中の長期記憶をキャプチャ可能な,新しいオンラインガウスプロセス(GP)モデルを提案する。
我々のモデルである Online HiPPO Sparse Variational Gaussian Process Regression (OHSGPR) は、その長距離メモリモデリング機能によりRNNドメインで普及しているHiPPO (High-order Polynomial Projection Operators) フレームワークを活用している。
我々は、時間依存直交多項式基底関数を持つ変数を誘導する変数として、HiPPOの時間変化直交射影を解釈する。
我々は、HiPPOフレームワークがドメイン間GPフレームワークに自然に適合していることを示し、HiPPOのODE進化に基づく繰り返し形式でカーネル行列をオンラインで更新可能であることを示した。
本手法は時系列回帰タスクにおいて,予測性能と計算効率の点で既存のオンラインGP法よりも優れていることを示す。
関連論文リスト
- Recursive Gaussian Process State Space Model [4.572915072234487]
動作領域とGPハイパーパラメータの両方に適応可能な新しいオンラインGPSSM法を提案する。
ポイントを誘導するオンライン選択アルゴリズムは、情報的基準に基づいて開発され、軽量な学習を実現する。
合成データセットと実世界のデータセットの総合的な評価は,提案手法の精度,計算効率,適応性を示す。
論文 参考訳(メタデータ) (2024-11-22T02:22:59Z) - Adaptive RKHS Fourier Features for Compositional Gaussian Process Models [12.036747050794135]
ディープガウス過程(Deep Gaussian Processs, DGP)は、非定常過程をモデル化するために構成構造を利用する。
DGP推論の最近の進歩は、再生カーネルヒルベルト空間(RKHS)からのグローバルフーリエ特徴を取り入れることで、複雑な非定常パターンを捕捉するDGPの能力を向上できることを示している。
本稿では,これらの特徴を線形変換を含む構成GPに拡張する。
論文 参考訳(メタデータ) (2024-07-01T23:56:56Z) - REBEL: Reinforcement Learning via Regressing Relative Rewards [59.68420022466047]
生成モデルの時代における最小限のRLアルゴリズムであるREBELを提案する。
理論的には、自然ポリシーグラディエントのような基本的なRLアルゴリズムはREBELの変種と見なすことができる。
我々はREBELが言語モデリングと画像生成に一貫したアプローチを提供し、PPOやDPOとより強くあるいは類似した性能を実現することを発見した。
論文 参考訳(メタデータ) (2024-04-25T17:20:45Z) - Linear Time GPs for Inferring Latent Trajectories from Neural Spike
Trains [7.936841911281107]
我々は,Hida-Mat'ernカーネルと共役変分推論(CVI)を利用した潜在GPモデルの一般的な推論フレームワークであるcvHMを提案する。
我々は任意の確率で線形時間複雑性を持つ潜在神経軌道の変分推定を行うことができる。
論文 参考訳(メタデータ) (2023-06-01T16:31:36Z) - Robust and Adaptive Temporal-Difference Learning Using An Ensemble of
Gaussian Processes [70.80716221080118]
本稿では、時間差学習(TD)による政策評価の世代的視点について考察する。
OS-GPTDアプローチは、状態-逆ペアのシーケンスを観測することにより、与えられたポリシーの値関数を推定するために開発された。
1つの固定カーネルに関連する限られた表現性を緩和するために、GP前の重み付けアンサンブル(E)を用いて代替のスキームを生成する。
論文 参考訳(メタデータ) (2021-12-01T23:15:09Z) - Non-Gaussian Gaussian Processes for Few-Shot Regression [71.33730039795921]
乱変数ベクトルの各成分上で動作し,パラメータを全て共有する可逆なODEベースのマッピングを提案する。
NGGPは、様々なベンチマークとアプリケーションに対する競合する最先端のアプローチよりも優れています。
論文 参考訳(メタデータ) (2021-10-26T10:45:25Z) - Incremental Ensemble Gaussian Processes [53.3291389385672]
本稿では,EGPメタラーナーがGP学習者のインクリメンタルアンサンブル(IE-) GPフレームワークを提案し,それぞれが所定のカーネル辞書に属するユニークなカーネルを持つ。
各GP専門家は、ランダムな特徴ベースの近似を利用してオンライン予測とモデル更新を行い、そのスケーラビリティを生かし、EGPメタラーナーはデータ適応重みを生かし、熟練者ごとの予測を合成する。
新たなIE-GPは、EGPメタラーナーおよび各GP学習者内における構造化力学をモデル化することにより、時間変化関数に対応するように一般化される。
論文 参考訳(メタデータ) (2021-10-13T15:11:25Z) - Modular Deep Reinforcement Learning for Continuous Motion Planning with
Temporal Logic [59.94347858883343]
本稿では,マルコフ決定過程(MDP)をモデルとした自律動的システムの運動計画について検討する。
LDGBA と MDP の間に組込み製品 MDP (EP-MDP) を設計することである。
モデルフリー強化学習(RL)のためのLDGBAベースの報酬形成と割引スキームは、EP-MDP状態にのみ依存する。
論文 参考訳(メタデータ) (2021-02-24T01:11:25Z) - HiPPO: Recurrent Memory with Optimal Polynomial Projections [93.3537706398653]
本稿では,連続信号と離散時系列をベースに投影してオンライン圧縮するための一般フレームワーク(HiPPO)を提案する。
過去の各時間ステップの重要性を示す尺度が与えられた場合、HiPPOは自然なオンライン関数近似問題に対する最適解を生成する。
このフォーマルなフレームワークは、すべての履歴を記憶するために時間をかけてスケールする新しいメモリ更新メカニズム(HiPPO-LegS)を提供する。
論文 参考訳(メタデータ) (2020-08-17T23:39:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。