論文の概要: From Path Signatures to Sequential Modeling: Incremental Signature Contributions for Offline RL
- arxiv url: http://arxiv.org/abs/2602.11805v1
- Date: Thu, 12 Feb 2026 10:37:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-13 21:07:25.773845
- Title: From Path Signatures to Sequential Modeling: Incremental Signature Contributions for Offline RL
- Title(参考訳): 経路シグナチャからシーケンスモデリングへ:オフラインRLに対するインクリメンタルシグナチャコントリビューション
- Authors: Ziyi Zhao, Qingchuan Li, Yuxuan Xu,
- Abstract要約: 本稿では,トランケートされた経路シグネチャを時間的に順序付けられた要素列に分解するインクリメンタルシグネチャコントリビューション(ISC)手法を提案する。
ISCは本質的に即時軌跡更新に敏感であり、敏感で安定に要求される制御力学に重要である。
ISC-Transformer (ISCT) は,ISCを標準トランスフォーマーアーキテクチャに統合したオフライン強化学習モデルである。
- 参考スコア(独自算出の注目度): 1.278093617645299
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Path signatures embed trajectories into tensor algebra and constitute a universal, non-parametric representation of paths; however, in the standard form, they collapse temporal structure into a single global object, which limits their suitability for decision-making problems that require step-wise reactivity. We propose the Incremental Signature Contribution (ISC) method, which decomposes truncated path signatures into a temporally ordered sequence of elements in the tensor-algebra space, corresponding to incremental contributions induced by last path increments. This reconstruction preserves the algebraic structure and expressivity of signatures, while making their internal temporal evolution explicit, enabling processing signature-based representations via sequential modeling approaches. In contrast to full signatures, ISC is inherently sensitive to instantaneous trajectory updates, which is critical for sensitive and stability-requiring control dynamics. Building on this representation, we introduce ISC-Transformer (ISCT), an offline reinforcement learning model that integrates ISC into a standard Transformer architecture without further architectural modification. We evaluate ISCT on HalfCheetah, Walker2d, Hopper, and Maze2d, including settings with delayed rewards and downgraded datasets. The results demonstrate that ISC method provides a theoretically grounded and practically effective alternative to path processing for temporally sensitive control tasks.
- Abstract(参考訳): 経路シグネチャは、軌道をテンソル代数に埋め込み、パスの普遍的で非パラメトリックな表現を構成するが、標準形式では、時間構造を単一の大域的対象に分解し、ステップワイズな反応性を必要とする意思決定問題に対する適合性を制限している。
本稿では,最後の経路増分によって引き起こされる漸進的な寄与に対応して,トランケートされた経路シグネチャをテンソル-代数空間内の要素の時間順に分解するインクリメンタルシグネチャコントリビューション(ISC)法を提案する。
この再構成は、シグネチャの代数的構造と表現性を保ちながら、内部の時間的進化を明示し、逐次モデリングアプローチによるシグネチャベースの表現を処理可能にする。
完全なシグネチャとは対照的に、ICCは本質的に瞬間的なトラジェクトリ更新に敏感である。
ISC-Transformer(ISCT)は,ISCを標準トランスフォーマーアーキテクチャに統合するオフライン強化学習モデルである。
私たちは、HalfCheetah、Walker2d、Hopper、Maze2dでISCTを評価し、遅延報酬とダウングレードデータセットの設定を含む。
その結果,ILC法は時間的に敏感な制御タスクのための経路処理に理論的に基礎を置き,実用的な代替手段を提供することを示した。
関連論文リスト
- SpanNorm: Reconciling Training Stability and Performance in Deep Transformers [55.100133502295996]
両パラダイムの強度を統合することでジレンマを解消する新しい手法であるSpanNormを提案する。
我々は、SpanNormと原則付きスケーリング戦略を組み合わせることで、ネットワーク全体にわたって有界信号のばらつきを維持できることを理論的に示す。
経験的に、SpanNormは、密集および混成実験(Mixture-of-Experts、MoE)のシナリオにおいて、標準正規化スキームを一貫して上回っている。
論文 参考訳(メタデータ) (2026-01-30T05:21:57Z) - Unleashing Degradation-Carrying Features in Symmetric U-Net: Simpler and Stronger Baselines for All-in-One Image Restoration [52.82397287366076]
オールインワン画像復元は、統合された枠組み内で様々な劣化(ノイズ、ぼかし、悪天候など)を扱うことを目的としている。
本研究では, 優れた特徴抽出法により, 劣化伝達情報を本質的にエンコードする, 重要な知見を明らかにする。
我々の対称設計は固有の劣化信号を頑健に保存し、スキップ接続に単純な加法融合を施す。
論文 参考訳(メタデータ) (2025-12-11T12:20:31Z) - IAR2: Improving Autoregressive Visual Generation with Semantic-Detail Associated Token Prediction [77.06211178777939]
IAR2は、階層的なセマンティックディーテール合成プロセスを可能にする高度な自己回帰フレームワークである。
我々は、IAR2が自動回帰画像生成のための新しい最先端技術を設定し、ImageNet上で1.50のFIDを達成することを示す。
論文 参考訳(メタデータ) (2025-10-08T12:08:21Z) - EntroPE: Entropy-Guided Dynamic Patch Encoder for Time Series Forecasting [50.794700596484894]
IntroPE(Entropy-Guided Dynamic Patch)は,条件付きエントロピーによる遷移点を動的に検出する新しい時間情報フレームワークである。
これは、パッチの計算上の利点を維持しながら、時間構造を保存する。
長期予測ベンチマークによる実験では、EntroPEは精度と効率の両方を改善している。
論文 参考訳(メタデータ) (2025-09-30T12:09:56Z) - REALIGN: Regularized Procedure Alignment with Matching Video Embeddings via Partial Gromov-Wasserstein Optimal Transport [7.952582509792969]
実世界の命令データには、しばしばバックグラウンドセグメント、繰り返しアクション、順番に示されるステップが含まれている。
正規化部分グロモフ・ワッサースタイン最適輸送(R-FPGWOT)に基づく手続き学習のための自己指導型フレームワークREALIGNを紹介する。
KOTとは対照的に、我々の定式化は部分的なアライメントスキームの下で視覚的対応と時間的関係を共同でモデル化する。
論文 参考訳(メタデータ) (2025-09-29T07:32:14Z) - Bidirectional Feature-aligned Motion Transformation for Efficient Dynamic Point Cloud Compression [97.66080040613726]
特徴空間における動きを暗黙的にモデル化する双方向特徴整合運動変換(Bi-FMT)フレームワークを提案する。
Bi-FMTは、時間的に一貫した潜在表現を生成するために、過去と将来の両方のフレームで機能を調整する。
圧縮効率とランタイムの両方において, Bi-FMT が D-DPCC と AdaDPCC を上回っていることを示す。
論文 参考訳(メタデータ) (2025-09-18T03:51:06Z) - Time-Scale Coupling Between States and Parameters in Recurrent Neural Networks [3.924071936547547]
ゲーテッドニューラルネットワーク(RNN)は、適応的な学習速度の振る舞いを暗黙的に誘発する。
効果は状態空間の時間スケールとパラメータ空間のダイナミクスの結合から生じる。
経験的シミュレーションはこれらの主張を裏付ける。
論文 参考訳(メタデータ) (2025-08-16T18:19:34Z) - DMSC: Dynamic Multi-Scale Coordination Framework for Time Series Forecasting [24.202509006348862]
時系列予測(TSF)は、さまざまなスケールにわたる複雑な時間的依存関係をモデル化する上で、永続的な課題に直面します。
マルチスケールパッチ分解ブロック(EMPD)、トライアドインタラクションブロック(TIB)、適応スケールルーティングMoEブロック(ASR-MoE)を備えた新しい動的マルチスケールコーディネーションフレームワーク(DMSC)を提案する。
EMPDは、指数関数的にスケールした粒度を持つ階層的なパッチにシーケンスを動的に分割する組み込みコンポーネントとして設計されている。
TIBは、各レイヤの分解された表現の中で、パッチ内、パッチ間、およびクロス変数の依存関係を共同でモデル化する。
論文 参考訳(メタデータ) (2025-08-03T13:11:52Z) - DESign: Dynamic Context-Aware Convolution and Efficient Subnet Regularization for Continuous Sign Language Recognition [11.879737436401175]
動的コンテキスト認識畳み込み(DCAC)とサブネット正規化接続性時間分類(SR-CTC)を組み合わせた新しいフレームワークであるDESignを提案する。
DCACは、記号を構成するフレーム間のモーションキューを動的にキャプチャし、コンテキスト情報に基づいて畳み込み重みを一意に適応させる。
SR-CTCは、監督トボリューションワークを適用してトレーニングを規則化し、様々なCTCアライメントパスを探索し、オーバーフィッティングを効果的に防止することを奨励する。
論文 参考訳(メタデータ) (2025-07-04T06:56:28Z) - SigGate: Enhancing Recurrent Neural Networks with Signature-Based Gating Mechanisms [0.0]
本稿では、経路シグネチャをゲーティング機構に組み込むことで、リカレントニューラルネットワーク(RNN)を強化する新しいアプローチを提案する。
本手法は,Long Short-Term Memory (LSTM) と Gated Recurrent Unit (GRU) アーキテクチャをそれぞれ,リセットゲートとリセットゲートを学習可能なパスシグネチャに置き換えることで変更する。
論文 参考訳(メタデータ) (2025-02-13T13:33:35Z) - Towards Continual Learning Desiderata via HSIC-Bottleneck
Orthogonalization and Equiangular Embedding [55.107555305760954]
本稿では,レイヤワイドパラメータのオーバーライトや決定境界の歪みに起因する,概念的にシンプルで効果的な手法を提案する。
提案手法は,ゼロの指数バッファと1.02倍の差が絶対的に優れていても,競争精度が向上する。
論文 参考訳(メタデータ) (2024-01-17T09:01:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。