論文の概要: LyTimeT: Towards Robust and Interpretable State-Variable Discovery
- arxiv url: http://arxiv.org/abs/2510.19716v1
- Date: Wed, 22 Oct 2025 16:03:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:16.12939
- Title: LyTimeT: Towards Robust and Interpretable State-Variable Discovery
- Title(参考訳): LyTimeT: 堅牢で解釈可能な状態変数発見を目指す
- Authors: Kuai Yu, Crystal Su, Xiang Liu, Judah Goldfeder, Mingyuan Shao, Hod Lipson,
- Abstract要約: LyTimeTは、解釈可能な変数抽出のためのフレームワークである。
動的ビデオシステムの堅牢で安定した潜伏表現を学習する。
その結果,時間的注意と安定性の制約を組み合わせることで,予測モデルが得られることがわかった。
- 参考スコア(独自算出の注目度): 7.505092370141079
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Extracting the true dynamical variables of a system from high-dimensional video is challenging due to distracting visual factors such as background motion, occlusions, and texture changes. We propose LyTimeT, a two-phase framework for interpretable variable extraction that learns robust and stable latent representations of dynamical systems. In Phase 1, LyTimeT employs a spatio-temporal TimeSformer-based autoencoder that uses global attention to focus on dynamically relevant regions while suppressing nuisance variation, enabling distraction-robust latent state learning and accurate long-horizon video prediction. In Phase 2, we probe the learned latent space, select the most physically meaningful dimensions using linear correlation analysis, and refine the transition dynamics with a Lyapunov-based stability regularizer to enforce contraction and reduce error accumulation during roll-outs. Experiments on five synthetic benchmarks and four real-world dynamical systems, including chaotic phenomena, show that LyTimeT achieves mutual information and intrinsic dimension estimates closest to ground truth, remains invariant under background perturbations, and delivers the lowest analytical mean squared error among CNN-based (TIDE) and transformer-only baselines. Our results demonstrate that combining spatio-temporal attention with stability constraints yields predictive models that are not only accurate but also physically interpretable.
- Abstract(参考訳): 高次元映像からシステムの真の動的変数を抽出することは、背景運動、閉塞、テクスチャ変化などの視覚的要因を逸脱させることで困難である。
動的システムの頑健かつ安定な潜在表現を学習する,解釈可能な変数抽出のための2相フレームワークLyTimeTを提案する。
フェーズ1では、LyTimeTは時空間のタイムスフォーマーベースのオートエンコーダを使用し、グローバルな注意力を利用して、ニュアンス変動を抑制しながら動的に関連する領域に注目する。
フェーズ2では、学習された潜伏空間を探索し、線形相関解析を用いて最も物理的に有意な次元を選択し、リャプノフに基づく安定正規化器を用いて遷移ダイナミクスを洗練し、ロールアウト時の収縮を強制し、エラー蓄積を低減する。
カオス現象を含む5つの合成ベンチマークと4つの実世界の力学系の実験により、LyTimeTは相互情報と本質的な次元の推定を行い、背景摂動の下では不変であり、CNNベースの(TIDE)とトランスフォーマーのみのベースラインで最低解析平均2乗誤差を提供することを示した。
その結果,時空間の注意と安定性の制約を組み合わせることで,精度だけでなく物理的に解釈可能な予測モデルが得られることがわかった。
関連論文リスト
- Drift No More? Context Equilibria in Multi-Turn LLM Interactions [58.69551510148673]
コンテキストドリフト(Contexts drift)とは、ターン間のゴール一貫性のある振る舞いからモデルが出力する出力の段階的なばらつきである。
シングルターンエラーとは異なり、ドリフトは時間的に展開し、静的な評価指標では捉えにくい。
マルチターンドリフトは、避けられない崩壊というよりも、制御可能な平衡現象として理解できることを示す。
論文 参考訳(メタデータ) (2025-10-09T04:48:49Z) - Continuous-Time SO(3) Forecasting with Savitzky--Golay Neural Controlled Differential Equations [51.510040541600176]
この研究は、$SO(3)$で連続時間回転オブジェクトの力学をモデル化することを提案する。
単純化された動作仮定に依存する既存の手法とは異なり、本手法は下層の物体軌道の一般的な潜在力学系を学習する。
実世界のデータに対する実験結果から、既存の手法と比較して魅力的な予測能力が示された。
論文 参考訳(メタデータ) (2025-06-07T12:41:50Z) - Towards Stabilized and Efficient Diffusion Transformers through Long-Skip-Connections with Spectral Constraints [51.83081671798784]
Diffusion Transformers (DiT) は、画像およびビデオ生成のための強力なアーキテクチャとして登場し、優れた品質とスケーラビリティを提供している。
DiTの実用アプリケーションは本質的に動的特徴不安定性に悩まされており、キャッシュされた推論中にエラーを増幅する。
我々は,Long-Skip-Connections (LSCs) で拡張された画像およびビデオ生成型DiTであるSkip-DiTを提案する。
論文 参考訳(メタデータ) (2024-11-26T17:28:10Z) - DualDynamics: Synergizing Implicit and Explicit Methods for Robust Irregular Time Series Analysis [3.686808512438363]
NDE法とニューラルフロー法を組み合わせた新しいフレームワークである「DualDynamics」を紹介する。
このアプローチは計算要求のバランスを保ちながら表現力を高め、既存の手法の限界に対処する。
以上の結果から,DualDynamicsが不規則時系列解析を飛躍的に進める可能性が示唆された。
論文 参考訳(メタデータ) (2024-01-10T07:51:02Z) - EmerNeRF: Emergent Spatial-Temporal Scene Decomposition via
Self-Supervision [85.17951804790515]
EmerNeRFは動的駆動シーンの時空間表現を学習するためのシンプルだが強力なアプローチである。
シーンの幾何学、外観、動き、セマンティクスを自己ブートストラップで同時にキャプチャする。
本手法はセンサシミュレーションにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2023-11-03T17:59:55Z) - Averaging Spatio-temporal Signals using Optimal Transport and Soft
Alignments [110.79706180350507]
Fr'teche は双対性を意味し, 時間的バレシェセンタを定義するために提案した損失が有効であることを示す。
手書き文字と脳画像データによる実験は、我々の理論的発見を裏付けるものである。
論文 参考訳(メタデータ) (2022-03-11T09:46:22Z) - Stochastically forced ensemble dynamic mode decomposition for
forecasting and analysis of near-periodic systems [65.44033635330604]
本稿では,観測力学を強制線形系としてモデル化した新しい負荷予測手法を提案する。
固有線型力学の利用は、解釈可能性やパーシモニーの観点から、多くの望ましい性質を提供することを示す。
電力グリッドからの負荷データを用いたテストケースの結果が提示される。
論文 参考訳(メタデータ) (2020-10-08T20:25:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。