論文の概要: Spectral Alignment in Forward-Backward Representations via Temporal Abstraction
- arxiv url: http://arxiv.org/abs/2603.20103v2
- Date: Mon, 23 Mar 2026 14:27:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 14:46:12.203484
- Title: Spectral Alignment in Forward-Backward Representations via Temporal Abstraction
- Title(参考訳): 時間的抽象化による前方後方表現におけるスペクトルアライメント
- Authors: Seyed Mahdi B. Azad, Jasper Hoffmann, Iman Nematollahi, Hao Zhu, Abhinav Valada, Joschka Boedecker,
- Abstract要約: 前方後方表現は連続空間における後続表現(SR)を学習するための強力なフレームワークを提供する。
基本的なスペクトルミスマッチは、連続環境の高階遷移ダイナミクスとFBアーキテクチャの低階ボトルネックの間にしばしば存在する。
時間的抽象は、高周波スペクトル成分を抑圧する低域通過フィルタとして機能することを示す。
- 参考スコア(独自算出の注目度): 18.90573294229263
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Forward-backward (FB) representations provide a powerful framework for learning the successor representation (SR) in continuous spaces by enforcing a low-rank factorization. However, a fundamental spectral mismatch often exists between the high-rank transition dynamics of continuous environments and the low-rank bottleneck of the FB architecture, making accurate low-rank representation learning difficult. In this work, we analyze temporal abstraction as a mechanism to mitigate this mismatch. By characterizing the spectral properties of the transition operator, we show that temporal abstraction acts as a low-pass filter that suppresses high-frequency spectral components. This suppression reduces the effective rank of the induced SR while preserving a formal bound on the resulting value function error. Empirically, we show that this alignment is a key factor for stable FB learning, particularly at high discount factors where bootstrapping becomes error-prone. Our results identify temporal abstraction as a principled mechanism for shaping the spectral structure of the underlying MDP and enabling effective long-horizon representations in continuous control.
- Abstract(参考訳): フォワード・バックワード(FB)表現は、連続空間における後続表現(SR)を低ランクの分解によって学習するための強力なフレームワークを提供する。
しかし、連続環境の高階遷移ダイナミクスとFBアーキテクチャの低階ボトルネックとの間には、基本的なスペクトルミスマッチが存在し、正確な低階表現学習が困難になる。
本研究では,このミスマッチを緩和するメカニズムとして時間的抽象化を解析する。
遷移作用素のスペクトル特性を特徴付けることにより、時間的抽象化が低域通過フィルタとして機能し、高周波スペクトル成分を抑圧することを示す。
この抑制は、結果の値関数誤差に形式的境界を保ちながら、誘導されたSRの有効ランクを減少させる。
このアライメントは、特にブートストラップがエラーを起こしやすい高い割引係数において、安定したFB学習の鍵となる要因であることを示す。
本研究は, 時間的抽象化を, 基礎となるMDPのスペクトル構造を定式化し, 連続制御における有効長方形表現を実現するための原理的メカニズムとして捉えた。
関連論文リスト
- Laplacian-LoRA: Delaying Oversmoothing in Deep GCNs via Spectral Low-Rank Adaptation [0.0]
標準グラフ畳み込みネットワーク(GCN)の低ランク適応であるLaplacian-LoRAを提案する。
メッセージパッシングを再設計する代わりに、Laplacian-LoRAは学習可能でスペクトルに固定された修正を固定されたLaplacian伝搬演算子に導入する。
また,Laplacian-LoRAはGCNの有効深度を最大2倍にまで延ばし,過スムージングの開始を連続的に遅らせることを示した。
論文 参考訳(メタデータ) (2026-02-07T00:03:19Z) - State Rank Dynamics in Linear Attention LLMs [37.607046806053035]
州の階級階層化は、線形アテンションヘッド間で異なるスペクトル分岐によって特徴づけられる。
低ランクの頭部はモデル推論に欠かせないが、高ランクの頭部は顕著な冗長性を示す。
我々は,KVキャッシュのオーバーヘッドを38.9%削減し,モデル精度を大きく維持するゼロショット戦略であるJoint Rank-Norm Pruningを提案する。
論文 参考訳(メタデータ) (2026-02-02T15:00:42Z) - Contrastive Spectral Rectification: Test-Time Defense towards Zero-shot Adversarial Robustness of CLIP [68.44229678548298]
コントラストスペクトル整流(Contrastive Spectral Rectification, CSR)は、敵の例に対する効率的な試験時間防御である。
CSRはSOTAを18.1%上回り、AutoAttackに勝っている。
CSRは様々な視覚的タスクに幅広い適用性を示す。
論文 参考訳(メタデータ) (2026-01-27T05:24:45Z) - Unleashing Temporal Capacity of Spiking Neural Networks through Spatiotemporal Separation [67.69345363409835]
スパイキングニューラルネットワーク(SNN)は、時間的処理に自然に適していると考えられており、膜電位の伝播は、コア時間的モデリングメカニズムとして広く見なされている。
我々は, 膜伝播を段階的に段階的に除去する非ステートフル(NS)モデルの設計を行った。
論文 参考訳(メタデータ) (2025-12-05T07:05:53Z) - PAS: A Training-Free Stabilizer for Temporal Encoding in Video LLMs [57.790910044227935]
ビデオLLMは時間的不整合に悩まされ、フレームタイミングの小さなシフトは注意をそらすことができ、関連するフレームを抑えることができる。
本稿では, 位相アグリゲード平滑化(PAS)について述べる。これは, 頭部に小さな反対位相オフセットを適用して, 出力を集約する学習自由機構である。
解析の結果,RoPE回転ロジットは,時間核でスケールしたコンテントドット積として近似でき,このカーネルを滑らかにすることで,小さな時間シフトに対する注意のリプシッツ安定性が得られ,マルチフェーズ平均化は,Nyquist-valid サンプリング下での頭当たりスペクトルを保ちながら高周波リップルを減衰させることがわかった。
論文 参考訳(メタデータ) (2025-11-14T05:56:47Z) - Demystifying Spectral Feature Learning for Instrumental Variable Regression [21.514407689434364]
スペクトル特徴に基づく2段最小二乗推定器の一般化誤差を導出する。
パフォーマンスは2つの重要な要因に依存しており、結果の明確な分類につながります。
論文 参考訳(メタデータ) (2025-06-12T17:06:43Z) - Holistic Physics Solver: Learning PDEs in a Unified Spectral-Physical Space [54.13671100638092]
Holistic Physics Mixer (HPM) は、スペクトルと物理情報を統一された空間に統合するためのフレームワークである。
我々はHPMが精度と計算効率の両面で最先端の手法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2024-10-15T08:19:39Z) - Low-Light Video Enhancement via Spatial-Temporal Consistent Decomposition [52.89441679581216]
低照度ビデオエンハンスメント(LLVE)は、激しい視認性とノイズに悩まされる動的または静的なシーンの復元を目指している。
本稿では、ビューに依存しない、ビューに依存しないコンポーネントを組み込んだ革新的なビデオ分解戦略を提案する。
我々のフレームワークは、既存のメソッドを一貫して上回り、新しいSOTAパフォーマンスを確立します。
論文 参考訳(メタデータ) (2024-05-24T15:56:40Z) - Spectral Decomposition Representation for Reinforcement Learning [100.0424588013549]
本稿では, スペクトル分解表現法(SPEDER)を提案する。この手法は, データ収集ポリシーに急激な依存を生じさせることなく, ダイナミックスから状態-作用の抽象化を抽出する。
理論的解析により、オンライン設定とオフライン設定の両方において提案アルゴリズムのサンプル効率が確立される。
実験により、いくつかのベンチマークで現在の最先端アルゴリズムよりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-08-19T19:01:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。