論文の概要: Lag Operator SSMs: A Geometric Framework for Structured State Space Modeling
- arxiv url: http://arxiv.org/abs/2512.18965v1
- Date: Mon, 22 Dec 2025 02:25:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-23 18:54:32.583474
- Title: Lag Operator SSMs: A Geometric Framework for Structured State Space Modeling
- Title(参考訳): Lag Operator SSMs: 構造化状態空間モデリングのための幾何学的フレームワーク
- Authors: Sutashu Tomonaga, Kenji Doya, Noboru Murata,
- Abstract要約: 柔軟かつモジュール化された離散時間構造化状態空間モデル(SSM)を構築するためのフレームワークを導入する。
提案手法は,システムの基本機能「すべり」を測定することにより,離散時間再発を幾何学的に導出する新しいラグ演算子に基づく。
- 参考スコア(独自算出の注目度): 3.3864018929063477
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Structured State Space Models (SSMs), which are at the heart of the recently popular Mamba architecture, are powerful tools for sequence modeling. However, their theoretical foundation relies on a complex, multi-stage process of continuous-time modeling and subsequent discretization, which can obscure intuition. We introduce a direct, first-principles framework for constructing discrete-time SSMs that is both flexible and modular. Our approach is based on a novel lag operator, which geometrically derives the discrete-time recurrence by measuring how the system's basis functions "slide" and change from one timestep to the next. The resulting state matrices are computed via a single inner product involving this operator, offering a modular design space for creating novel SSMs by flexibly combining different basis functions and time-warping schemes. To validate our approach, we demonstrate that a specific instance exactly recovers the recurrence of the influential HiPPO model. Numerical simulations confirm our derivation, providing new theoretical tools for designing flexible and robust sequence models.
- Abstract(参考訳): 構造化状態空間モデル(Structured State Space Models、SSM)は、最近人気になったMambaアーキテクチャの中心にある、シーケンスモデリングのための強力なツールである。
しかし、その理論基盤は、連続時間モデリングとその後の離散化の複雑な多段階プロセスに依存しており、直観を曖昧にすることができる。
フレキシブルかつモジュール化された離散時間SSMを構築するための,直接的な第1原理フレームワークを導入する。
提案手法は, システムの基底関数の「すべり」を計測し, 時間段階から次へと変化させることにより, 離散時間再発を幾何学的に導出する新しいラグ演算子に基づく。
結果として得られる状態行列は、この演算子を含む単一の内部積によって計算され、異なる基底関数とタイムワープスキームを柔軟に組み合わせることで、新しいSSMを作成するためのモジュラー設計空間を提供する。
提案手法の有効性を検証するため,特定の事例が影響のあるHiPPOモデルの再発を正確に回復することを示した。
数値シミュレーションにより導出が確認され、フレキシブルでロバストなシーケンスモデルを設計するための新しい理論ツールが提供される。
関連論文リスト
- Merging Memory and Space: A State Space Neural Operator [8.378604588491394]
State Space Neural Operator (SS-NO) は時間依存偏微分方程式の解演算子を学習するためのコンパクトなアーキテクチャである。
SS-NOは多種多様なPDEベンチマークにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2025-07-31T11:09:15Z) - Bridging Expressivity and Scalability with Adaptive Unitary SSMs [15.244653633181303]
本稿では,適応ユニタリ状態空間モデル(Adaptive Unitary State Space Model, AUSSM)を紹介する。
AUSSMとそのハイブリッド変種であるMambaoutperformが、パリティやモジュラー算術といった形式的なタスクでSSMに先立つことを示す。
この結果から,ユニタリ反復は記号的および連続的シーケンスモデリングの両方において,強力かつ効率的な帰納的バイアスを与えることが示された。
論文 参考訳(メタデータ) (2025-07-07T17:47:16Z) - Sequential-Parallel Duality in Prefix Scannable Models [68.39855814099997]
近年では Gated Linear Attention (GLA) や Mamba など様々なモデルが開発されている。
ニアコンスタント時間並列評価と線形時間、定数空間シーケンシャル推論をサポートするニューラルネットワークモデルの全クラスを特徴付けることができるだろうか?
論文 参考訳(メタデータ) (2025-06-12T17:32:02Z) - Longhorn: State Space Models are Amortized Online Learners [51.10124201221601]
ステートスペースモデル(SSM)は、トレーニング中に並列性を維持しながら線形デコード効率を提供する。
本研究では、オンライン学習のレンズを通してSSM設計を探求し、特定のオンライン学習問題のメタモジュールとしてSSMを概念化する。
我々は、オンライン連想的リコール問題を解決するためのクローズドフォームソリューションに類似した、新しいディープSSMアーキテクチャであるLonghornを紹介した。
論文 参考訳(メタデータ) (2024-07-19T11:12:08Z) - Time-SSM: Simplifying and Unifying State Space Models for Time Series Forecasting [22.84798547604491]
状態空間モデル(SSM)は、基底関数の集合を用いて連続系を近似し、それらを離散化して入力データを処理する。
本稿では,SSMを時系列データに適用するためのより直感的で汎用的なガイダンスを提供する,動的スペクトル演算子(Dynamic Spectral Operator)と呼ばれる新しい理論フレームワークを提案する。
パラメータの7分の1しか持たない新しいSSM基盤モデルであるTime-SSMを紹介する。
論文 参考訳(メタデータ) (2024-05-25T17:42:40Z) - S2RMs: Spatially Structured Recurrent Modules [105.0377129434636]
モジュール構造とテンポラル構造の両方を同時に活用できる動的構造を利用するための一歩を踏み出します。
我々のモデルは利用可能なビューの数に対して堅牢であり、追加のトレーニングなしで新しいタスクに一般化できる。
論文 参考訳(メタデータ) (2020-07-13T17:44:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。