論文の概要: Stable Transformer-Actor-Critic Model Predictive Control: A Contraction Analysis Approach
- arxiv url: http://arxiv.org/abs/2606.20197v1
- Date: Thu, 18 Jun 2026 13:11:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 18:23:39.868207
- Title: Stable Transformer-Actor-Critic Model Predictive Control: A Contraction Analysis Approach
- Title(参考訳): 安定な変圧器・アクタ・クリティカルモデル予測制御:収縮解析アプローチ
- Authors: Antonio Marino, Valerio Modugno, Marco Cognetti,
- Abstract要約: アクター・クリティカル予測制御(MPC)は複雑な非到達制御問題に効果的に対処する。
本稿では,形式的ロバスト性を持つトランスフォーマー・アクタ・クリティカルなMPCアーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 1.7625675658723843
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Actor-Critic Model Predictive Control (MPC) effectively addresses complex, non-convex control problems, but guaranteeing the closed-loop stability of sequence-based learning models within these pipelines remains challenging. This paper introduces a novel Transformer-Actor-Critic MPC architecture with formal robustness guarantees. First, we prove that Transformer networks can satisfy global incremental Input-to-State Stability ($δ$ISS). We then leverage Riemannian contraction theory to analyze the interconnected dynamics between the physical plant and the predictive neural network. Finally, we integrate these theoretical bounds as a training regularizer to yield a certifiably robust policy. The framework is validated on a nonlinear 3D drone model executing target-reaching and obstacle-avoidance maneuvers.
- Abstract(参考訳): アクター・クリティカル・モデル予測制御(MPC)は複雑な非凸制御問題に効果的に対処するが、これらのパイプライン内のシーケンスベース学習モデルの閉ループ安定性を保証することは依然として困難である。
本稿では,形式的ロバスト性を保証するトランスフォーマー・アクタ・Critic MPCアーキテクチャを提案する。
まず,Transformer ネットワークがグローバルインクリメンタルな入力-状態安定性(δ$ISS)を満たすことを証明する。
次に、リーマンの縮約理論を利用して、物理プラントと予測ニューラルネットワークの間の相互接続力学を解析する。
最後に、これらの理論境界をトレーニング正則化器として統合し、確実に堅牢なポリシーを導出する。
このフレームワークは、目標到達および障害物回避操作を実行する非線形3次元ドローンモデルで検証される。
関連論文リスト
- Taming Curvature: Architecture Warm-Up for Stable Transformer Training [52.6838951211596]
本稿では,Hessian-vector製品を用いた暖かくスタートした変種に基づく最大(プレコンディション付き)Hessian固有値(曲率)の高速オンライン推定手法を提案する。
トレーニングの不安定性は、事前条件付き曲率の急激な上昇と一致し、曲率の深さが増加する。
大規模変圧器の実験により,本手法が効率的な曲率追跡を可能にし,不安定性を低減できることを確認した。
論文 参考訳(メタデータ) (2026-06-15T14:16:56Z) - Unlocking Feature Learning in Gated Delta Networks at Scale [52.705562336559446]
大規模言語モデルの訓練とスケーリングは膨大な計算資源を必要とする。
我々はGated Delta Networkのスケーリングルールを導出する。
言語モデル事前学習の実験により、我々の構成が安定した学習速度転送を可能にすることが確認された。
論文 参考訳(メタデータ) (2026-06-02T08:45:24Z) - Learning-Based Dynamics Modeling and Robust Control for Tendon-Driven Continuum Robots [23.655392951446995]
テンドン駆動型ロボット連続体(TDCR)は複雑な非線形性のため、モデリングと制御に重大な課題をもたらす。
本稿では,高忠実度ダイナミクスモデリングと頑健なニューラルコントロールを統合した微分可能な学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-28T14:20:44Z) - SpanNorm: Reconciling Training Stability and Performance in Deep Transformers [55.100133502295996]
両パラダイムの強度を統合することでジレンマを解消する新しい手法であるSpanNormを提案する。
我々は、SpanNormと原則付きスケーリング戦略を組み合わせることで、ネットワーク全体にわたって有界信号のばらつきを維持できることを理論的に示す。
経験的に、SpanNormは、密集および混成実験(Mixture-of-Experts、MoE)のシナリオにおいて、標準正規化スキームを一貫して上回っている。
論文 参考訳(メタデータ) (2026-01-30T05:21:57Z) - Neural Internal Model Control: Learning a Robust Control Policy via Predictive Error Feedback [16.46487826869775]
本稿では,モデルベース制御とRLベース制御を統合し,ロバスト性を高めるニューラル内部モデル制御を提案する。
我々のフレームワークは、剛体力学にニュートン・オイラー方程式を適用することで予測モデルを合理化し、複雑な高次元非線形性を捉える必要がなくなる。
本研究では,四足歩行ロボットと四足歩行ロボットにおけるフレームワークの有効性を実証し,最先端の手法と比較して優れた性能を実現する。
論文 参考訳(メタデータ) (2024-11-20T07:07:42Z) - PIDformer: Transformer Meets Control Theory [28.10913642120948]
我々は、そのソリューションのスムーズさを本質的に促進する自律的状態空間モデルとして自己意識を公表する。
モデルに参照点を持つPID(Proportional-Integral-Derivative)クローズドループフィードバック制御システムを導入し,ロバスト性や表現能力の向上を図る。
この制御フレームワークにより、新しい変換器のクラス、PID制御変換器(PIDformer)を導出する。
論文 参考訳(メタデータ) (2024-02-25T05:04:51Z) - Outlier-robust neural network training: variation regularization meets trimmed loss to prevent functional breakdown [2.5628953713168685]
我々は,高度に表現力のあるニューラルネットワークを用いた外乱予測モデリングの課題に取り組む。
提案手法は,(1)変換トリミング損失(TTL)と(2)高次変動正規化(HOVR)の2つの重要な要素を統合し,予測関数に滑らかさの制約を課す。
論文 参考訳(メタデータ) (2023-08-04T12:57:13Z) - Provable Guarantees for Generative Behavior Cloning: Bridging Low-Level
Stability and High-Level Behavior [51.60683890503293]
生成モデルを用いた複雑な専門家による実演の行動クローニングに関する理論的枠組みを提案する。
任意の専門的軌跡の時間ごとのステップ分布に一致するトラジェクトリを生成することができることを示す。
論文 参考訳(メタデータ) (2023-07-27T04:27:26Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Robustness Verification for Transformers [165.25112192811764]
我々はトランスフォーマーのための最初のロバスト性検証アルゴリズムを開発した。
提案手法で計算したロバスト性境界は, 素粒子間境界伝播法で計算したロバスト性境界よりもかなり厳密である。
これらの境界はまた、感情分析における異なる単語の重要性を常に反映しているトランスフォーマーの解釈にも光を当てている。
論文 参考訳(メタデータ) (2020-02-16T17:16:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。