論文の概要: Neural Control: Adjoint Learning Through Equilibrium Constraints
- arxiv url: http://arxiv.org/abs/2605.03288v1
- Date: Tue, 05 May 2026 02:19:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-06 19:35:43.723126
- Title: Neural Control: Adjoint Learning Through Equilibrium Constraints
- Title(参考訳): ニューラルコントロール:平衡制約による随伴学習
- Authors: Dezhong Tong, Jiawen Wang, Hengyi Zhou, Yinglong Shen, Xiaonan Huang, M. Khalid Jawed,
- Abstract要約: トラジェクトリに依存した,メモリ効率のよいプロキシ勾配を演算する境界制御フレームワークを提案する。
本研究では,SPSAやCEMなどの勾配のないベースラインの性能向上を示す。
- 参考スコア(独自算出の注目度): 7.41073008855977
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many physical AI tasks are governed by implicit equilibrium: an agent actuates a subset of degrees of freedom (boundary DoFs), while the remaining free DoFs settle by minimizing a total potential energy. Even seemingly basic tasks such as bending a deformable linear object (DLO) to a target shape can exhibit strongly nonlinear behavior due to multi-stability: the same boundary conditions may yield multiple equilibrium shapes depending on the actuation trajectory. However, learning and control in such systems is brittle because the actuation-to-configuration map is defined only implicitly, and naive backpropagation through iterative equilibrium solvers is memory- and compute-intensive. We propose Neural Control, a boundary-control framework that computes trajectory-dependent, memory-efficient proxy gradients by differentiating equilibrium conditions via an adjoint formulation, avoiding unrolling of solver iterations. To improve robustness over long horizons, we integrate these sensitivities into a receding-horizon MPC scheme that repeatedly re-anchors optimization to realized equilibria and mitigates basin-switching in multi-stable regimes. We evaluate Neural Control in simulation and on physical robots manipulating DLOs, and show improved performance over gradient-free baselines such as SPSA and CEM.
- Abstract(参考訳): エージェントは自由度のサブセット(境界DoF)を作動させ、残りの自由DoFは全ポテンシャルエネルギーを最小化する。
変形可能な線形物体(DLO)を対象形状に曲げることのような一見基本的なタスクでさえ、多安定性による強い非線形挙動を示すことができる。
しかし、そのようなシステムにおける学習と制御は、アクティベーション・トゥ・コンフィグレーション・マップが暗黙的にのみ定義され、反復平衡解法による内在的バックプロパゲーションがメモリと計算集約的であるため、不安定である。
本稿では, 境界制御フレームワークであるNeural Controlを提案する。このフレームワークは, 共役の定式化による平衡条件の微分により, トラジェクトリに依存した, メモリ効率のよいプロキシ勾配を計算し, ソルバ反復のアンロールを回避する。
長い地平線上でのロバスト性を改善するために、これらの感度を後退水平MPCスキームに統合し、再アンカー最適化を繰り返すことで、平衡を実現し、複数安定な体制における盆地切替を緩和する。
我々は,シミュレーションおよびDLOを操作する物理ロボット上でのニューラルコントロールを評価し,SPSAやCEMのような勾配のないベースラインよりも優れた性能を示す。
関連論文リスト
- Interaction-Enabled Hartree Fixed Points in Fermionic Resetting Dynamics [0.0]
リセット力学において、システムは繰り返し結合され、相互作用間で再結合される自由度から分離される。
これは非平衡状態を構築するための汎用的な経路を提供し、フェルミオンモデルにおける非平衡力学を研究するための強力で分析的に透明な枠組みを構成する。
本研究では,SPDM力学の閉包を保ちながら非線形な挙動を生成できる密度-密度相互作用のHartree平均場処理を導入する。
論文 参考訳(メタデータ) (2026-03-16T17:14:08Z) - Diffusion Controller: Framework, Algorithms and Parameterization [54.82539154511621]
本稿では,逆拡散サンプリングを(一般化された)線形解法マルコフ決定過程における状態のみの制御として活用する統一的な制御理論的視点を提案する。
このフレームワークでは、制御はトレーニング済みのリバースタイムのトランジションカーネルを再重み付けし、端末の目的と$f$分割コストのバランスをとる。
安定拡散v1.4の実験では、選好調整の勝利率が一貫した上昇を示し、品質効率のトレードオフを改善した。
論文 参考訳(メタデータ) (2026-03-07T01:49:59Z) - Physics-informed post-processing of stabilized finite element solutions for transient convection-dominated problems [0.0]
本研究は、PINN-Augmented SUPG を Shock-Capturing (PASSC) 方法論で拡張するハイブリッド計算フレームワークを提案する。
この手法は半離散有限安定化法と過渡対流拡散に基づく方程式に対するPINN要素補正戦略を組み合わせたものである。
論文 参考訳(メタデータ) (2026-03-03T18:51:17Z) - Solving and learning advective multiscale Darcian dynamics with the Neural Basis Method [4.331539387944184]
本稿では,物理変換型ニューラルベース空間と演算子誘起残留距離を結合した投影型モデルであるNeural Basis法を紹介する。
提案手法は, 高精度かつ堅牢な解を単一解法で生成し, 演算子学習による高速かつ効果的なパラメトリック推論を可能にする。
論文 参考訳(メタデータ) (2026-02-19T19:17:55Z) - Deep Reinforcement Learning Optimization for Uncertain Nonlinear Systems via Event-Triggered Robust Adaptive Dynamic Programming [0.3848364262836075]
本研究では,Reinforcement Learning(RL)駆動のコントローラと外乱回避型拡張状態オブザーバ(ESO)を結合した統合制御アーキテクチャを提案する。
ESOは、システム状態とラップされた乱をリアルタイムで推定するために利用され、効果的な乱れ補償の基礎となる。
論文 参考訳(メタデータ) (2025-12-05T22:52:22Z) - Verifying Closed-Loop Contractivity of Learning-Based Controllers via Partitioning [52.23804865017831]
本稿では,ニューラルネットワークによるパラメータ化を行う非線形制御系における閉ループ収縮の検証問題に対処する。
我々は、対称メッツラー行列の優越的固有値が非正であることを確かめるために、閉ループの縮約性に対するトラクタブルでスケーラブルな十分条件を導出する。
論文 参考訳(メタデータ) (2025-12-01T23:06:56Z) - Drift No More? Context Equilibria in Multi-Turn LLM Interactions [58.69551510148673]
コンテキストドリフト(Contexts drift)とは、ターン間のゴール一貫性のある振る舞いからモデルが出力する出力の段階的なばらつきである。
シングルターンエラーとは異なり、ドリフトは時間的に展開し、静的な評価指標では捉えにくい。
マルチターンドリフトは、避けられない崩壊というよりも、制御可能な平衡現象として理解できることを示す。
論文 参考訳(メタデータ) (2025-10-09T04:48:49Z) - AutoBalance: An Automatic Balancing Framework for Training Physics-Informed Neural Networks [10.223108587188808]
PINNは部分微分方程式を解くための強力で一般的なフレームワークを提供する。
PINNは、PDE残差や境界条件などの複数の損失項のバランスをとる。
既存の手法では、最適化前に勾配を操作することでこの問題に対処している。
本稿では,新しい"ポストコンビイン"トレーニングパラダイムであるAutoBalanceを紹介する。
論文 参考訳(メタデータ) (2025-10-08T06:13:03Z) - Deep Learning Approximation of Diffeomorphisms via Linear-Control
Systems [91.3755431537592]
我々は、制御に線形に依存する$dot x = sum_i=1lF_i(x)u_i$という形の制御系を考える。
対応するフローを用いて、コンパクトな点のアンサンブル上の微分同相写像の作用を近似する。
論文 参考訳(メタデータ) (2021-10-24T08:57:46Z) - Improper Learning with Gradient-based Policy Optimization [62.50997487685586]
未知のマルコフ決定過程に対して学習者がmベースコントローラを与えられる不適切な強化学習設定を考える。
制御器の不適切な混合のクラス上で動作する勾配に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2021-02-16T14:53:55Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。