論文の概要: Elastic ODYN: Differentiable Optimization for Infeasible Control and Learning in Robotics
- arxiv url: http://arxiv.org/abs/2606.16564v1
- Date: Mon, 15 Jun 2026 11:06:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:34.472614
- Title: Elastic ODYN: Differentiable Optimization for Infeasible Control and Learning in Robotics
- Title(参考訳): Elastic ODYN:ロボットにおける不可能な制御と学習のための微分可能な最適化
- Authors: Aristotelis Papatheodorou, Jose Rojas, Ioannis Havoutis, Carlos Mastalli,
- Abstract要約: 弾性ODYN (Elastic ODYN) は、滑らかな2乗 = $ell の弾性緩和によって実現不可能性を扱う原始双対非中間点QPソルバである。
このフレームワークを基盤として,不実現性の下で安定な勾配を持つ微分可能なQP層であるElastic OdynLayerと,不実現性を考慮したSQP法であるElastic OdynSQPを開発した。
- 参考スコア(独自算出の注目度): 6.783137696981211
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Robotic systems routinely encounter conflicting objectives, modeling errors, and degenerate contact conditions that render quadratic programs (QPs) infeasible. Yet most optimization solvers and differentiable QP layers assume feasibility, leading to numerical failures, unstable gradients, or solver breakdown when constraints cannot be simultaneously satisfied. We present Elastic ODYN, a primal--dual non-interior-point QP solver that handles infeasibility through smooth squared-$\ell_2$ elastic relaxations. The resulting formulation remains well posed under ill-conditioning and degeneracy, supports warm starting, and converges to closest-to-feasible solutions when no feasible point exists. A lightweight refinement stage recovers physically meaningful dual variables from the elastic solution. Building on this framework, we develop Elastic OdynLayer, a differentiable QP layer with stable gradients under infeasibility, and Elastic OdynSQP, an infeasibility-aware SQP method that resolves inconsistent subproblems and intrinsically infeasible optimal control tasks through selective constraint relaxation. We evaluate the framework on benchmark QPs, singular contact mechanics, differentiable parameter identification, and quadrupedal and humanoid trajectory optimization. Across all settings, Elastic ODYN consistently outperforms state-of-the-art elastic QP solvers in robustness, warm-start performance, and convergence reliability, enabling optimization, simulation, control, and learning beyond the feasibility assumptions of existing methods.
- Abstract(参考訳): ロボットシステムは、相反する目標に定期的に遭遇し、エラーをモデル化し、二次プログラム(QP)が実現不可能な接触条件を退避させる。
しかし、ほとんどの最適化ソルバと微分可能なQP層は実現可能性を想定しており、同時に制約を満たすことができない場合、数値的な失敗、不安定な勾配、あるいは解解器の分解につながる。
滑らかな正方形-$\ell_2$弾性緩和を通した不実現性を扱う原始双対非中間点QP解法であるElastic ODYNを提案する。
結果の定式化はいまだに条件や縮退の下でうまく行われており、温かい開始をサポートし、実現可能な点が存在しない場合に最も近い解に収束する。
軽量精製工程では、弾性溶液から物理的に有意な双対変数を回収する。
この枠組みに基づいて, 安定な勾配を持つ微分可能なQP層であるElastic OdynLayerと, 不整合サブプロブレムと本質的に不可能な最適制御タスクを選択的拘束緩和により解決するElastic OdynSQPを開発した。
筆者らは,ベンチマークQP,特異接触力学,微分可能なパラメータ同定,および4重対軌道とヒューマノイド軌道の最適化に関するフレームワークの評価を行った。
あらゆる設定において、Elastic ODYNは、堅牢性、ウォームスタート性能、収束信頼性において、最先端の弾力性のあるQPソルバを一貫して上回り、最適化、シミュレーション、制御、既存のメソッドの実現可能性以上の学習を可能にします。
関連論文リスト
- Q-Flow: Stable and Expressive Reinforcement Learning with Flow-Based Policy [51.31164293751206]
Q-Flowは、フローダイナミクスの決定論的性質を利用して、ポリシーによって引き起こされるフローに沿って遅延状態を明確に伝播するフレームワークである。
OGBenchスイートのオフライン学習環境でのQ-Flowの評価では,最先端のベースラインを平均10.6ポイント上回っている。
論文 参考訳(メタデータ) (2026-05-13T12:31:02Z) - Adaptive Smooth Tchebycheff Attention for Multi-Objective Policy Optimization [55.338784037660474]
ドメインにおける多曲率強化学習は、矛盾する目的間の複雑な非脆弱な干渉トレードオフのバランスを必要とする。
本稿では,生態系をモニタリングするプロキシであるロボットビジュアルを用いた,新しいリアルタイムなリアルタイム最適化を提案する。
論文 参考訳(メタデータ) (2026-05-12T21:32:57Z) - Not All Preferences Are Created Equal: Stability-Aware and Gradient-Efficient Alignment for Reasoning Models [52.48582333951919]
ポリシー更新の信号対雑音比を最大化することにより、アライメントの信頼性を高めるために設計された動的フレームワークを提案する。
SAGE(Stability-Aware Gradient Efficiency)は、モデル能力に基づいて候補プールをリフレッシュする粗いきめ細かいカリキュラムメカニズムを統合する。
複数の数学的推論ベンチマークの実験により、SAGEは収束を著しく加速し、静的ベースラインを上回っていることが示された。
論文 参考訳(メタデータ) (2026-02-01T12:56:10Z) - Adaptive Dual-Weighting Framework for Federated Learning via Out-of-Distribution Detection [53.45696787935487]
Federated Learning (FL)は、大規模分散サービスノード間の協調的なモデルトレーニングを可能にする。
実世界のサービス指向デプロイメントでは、異種ユーザ、デバイス、アプリケーションシナリオによって生成されたデータは本質的にIIDではない。
FLoodは、オフ・オブ・ディストリビューション(OOD)検出にインスパイアされた新しいFLフレームワークである。
論文 参考訳(メタデータ) (2026-02-01T05:54:59Z) - Stationary Reweighting Yields Local Convergence of Soft Fitted Q-Iteration [40.322273308230606]
そこで本研究では, 関数近似および分布シフトの下で, 適合Q-定数とそのエントロピー規則化された変種であるソフトFQIが不適切に振る舞うことを示す。
本稿では,現在の方針の定常分布を用いて,各回帰更新を重み付けする静止重み付きソフトFQIを紹介する。
解析の結果,ソフトマックス温度を徐々に下げることで,地球規模の収束が回復する可能性が示唆された。
論文 参考訳(メタデータ) (2025-12-30T00:58:35Z) - Deep FlexQP: Accelerated Nonlinear Programming via Deep Unfolding [16.300563027214555]
本稿では,QP制約の厳密な緩和に基づいて,常に実現可能な2次プログラミング(QP)解法FlexQPを提案する。
元の制約が実現可能であれば、解法は元のQPに対する最適解を見つける。
制約が実現不可能であれば、解はスパースな方法で制約違反を最小限に抑える。
論文 参考訳(メタデータ) (2025-12-01T11:38:45Z) - A General and Streamlined Differentiable Optimization Framework [10.851559133306196]
本稿では,Julia最適化フレームワークのためのDiffOptlインタフェースを提案する。
ファーストクラスのJuMPネイティブAPIでは、ユーザが名前付きパラメータのデリバティブを直接取得することができる。
その結果、ルーチンの区別は、標準のJuMPモデリングプラクティスから逸脱することなく、実験、学習、設計を行うためのトレーニングツールになり得ることが示される。
論文 参考訳(メタデータ) (2025-10-29T21:42:36Z) - Differentiation Through Black-Box Quadratic Programming Solvers [21.717766458737426]
微分可能最適化は、特に二次プログラミング(QP)において重要な研究関心を集めている。
事実上任意のQPソルバのプラグアンドプレイ微分のためのモジュラーおよびソルバ非依存のフレームワークであるdQPを紹介する。
この結果に基づいて、15以上の最先端の解決者とシームレスに統合する、最小限のオーバヘッド、オープンソース実装を提供する。
論文 参考訳(メタデータ) (2024-10-08T20:01:39Z) - Message Passing Neural PDE Solvers [60.77761603258397]
我々は、バックプロップ最適化されたニューラル関数近似器で、グラフのアリーデザインのコンポーネントを置き換えるニューラルメッセージパッシング解決器を構築した。
本稿では, 有限差分, 有限体積, WENOスキームなどの古典的手法を表現的に含んでいることを示す。
本研究では, 異なる領域のトポロジ, 方程式パラメータ, 離散化などにおける高速, 安定, 高精度な性能を, 1次元, 2次元で検証する。
論文 参考訳(メタデータ) (2022-02-07T17:47:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。