Fugu-MT 論文翻訳(概要): Constrained Stein Variational Trajectory Optimization

論文の概要: Constrained Stein Variational Trajectory Optimization

arxiv url: http://arxiv.org/abs/2308.12110v1
Date: Wed, 23 Aug 2023 12:58:40 GMT
ステータス: 翻訳完了
システム内更新日: 2023-08-25 16:58:32.818530
Title: Constrained Stein Variational Trajectory Optimization
Title（参考訳）: 制約付きシュタイン変分軌道最適化
Authors: Thomas Power and Dmitry Berenson
Abstract要約: CSVTOは,一連のトラジェクトリに制約のあるトラジェクトリ最適化を並列に行うアルゴリズムである。多様な軌道を明示的に生成することにより、CSVTOは局所的な最小値の低下を回避できる。
参考スコア（独自算出の注目度）: 6.282068591820947
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We present Constrained Stein Variational Trajectory Optimization (CSVTO), an algorithm for performing trajectory optimization with constraints on a set of trajectories in parallel. We frame constrained trajectory optimization as a novel form of constrained functional minimization over trajectory distributions, which avoids treating the constraints as a penalty in the objective and allows us to generate diverse sets of constraint-satisfying trajectories. Our method uses Stein Variational Gradient Descent (SVGD) to find a set of particles that approximates a distribution over low-cost trajectories while obeying constraints. CSVTO is applicable to problems with arbitrary equality and inequality constraints and includes a novel particle resampling step to escape local minima. By explicitly generating diverse sets of trajectories, CSVTO is better able to avoid poor local minima and is more robust to initialization. We demonstrate that CSVTO outperforms baselines in challenging highly-constrained tasks, such as a 7DoF wrench manipulation task, where CSVTO succeeds in 20/20 trials vs 13/20 for the closest baseline. Our results demonstrate that generating diverse constraint-satisfying trajectories improves robustness to disturbances and initialization over baselines.
Abstract（参考訳）: 本稿では,一連のトラジェクトリに制約を加えてトラジェクトリ最適化を行うアルゴリズムであるConstrained Stein Variational Trajectory Optimization (CSVTO)を提案する。軌道分布に対する制約付き関数最小化の新たな形式として制約付き軌道最適化を行い,制約を目的のペナルティとして扱うことを避け,制約を満たす軌道の多様な集合を生成する。提案手法では,制約に従いながら,低コスト軌道上の分布を近似する粒子の集合を見つけるために,Stein Variational Gradient Descent (SVGD) を用いる。 CSVTOは任意の等式と不等式制約を持つ問題に適用でき、局所最小値から逃れるための新しい粒子再サンプリングステップを含む。多様な軌道の集合を明示的に生成することにより、CSVTOは局所的な最小値の低さを回避でき、初期化に対してより堅牢である。 CSVTOは、7DoFレンチ操作タスクのような高度に制約されたタスクにおいてベースラインよりも優れており、最も近いベースラインでは20/20でCSVTOが13/20で成功している。本研究は,多種多様な制約満足軌道の生成により,障害に対する堅牢性やベースラインに対する初期化が向上することを示す。

関連論文リスト

Parallel Diffusion Solver via Residual Dirichlet Policy Optimization [88.7827307535107]
拡散モデル(DM)は、最先端の生成性能を達成したが、シーケンシャルなデノナイジング特性のため、高いサンプリング遅延に悩まされている。既存のソルバベースの加速度法では、低次元の予算で画像品質が著しく低下することが多い。本研究では,各ステップに複数の勾配並列評価を組み込んだ新しいODE解法であるEnsemble Parallel Directionsolvr(EPD-EPr)を提案する。
論文参考訳（メタデータ） (2025-12-28T05:48:55Z)
HardFlow: Hard-Constrained Sampling for Flow-Matching Models via Trajectory Optimization [4.249024052507976]
本稿では,軌道最適化問題としてハードコントラストサンプリングを再構成する新しいフレームワークを提案する。我々の重要な洞察は、数値的最適制御を利用してサンプリング軌道を操り、終端時刻に制約が正確に満たされるようにすることである。このアルゴリズムは、制約満足度とサンプル品質の両方において、既存のメソッドよりも大幅に優れています。
論文参考訳（メタデータ） (2025-11-11T16:33:57Z)
Single-loop Algorithms for Stochastic Non-convex Optimization with Weakly-Convex Constraints [49.76332265680669]
本稿では、目的関数と制約関数の両方が弱凸である問題の重要な部分集合について検討する。既存の手法では、収束速度の遅さや二重ループ設計への依存など、しばしば制限に直面している。これらの課題を克服するために,新しい単一ループペナルティに基づくアルゴリズムを提案する。
論文参考訳（メタデータ） (2025-04-21T17:15:48Z)
Optimization-Driven Adaptive Experimentation [7.948144726705323]
実世界の実験には、バッチで遅延したフィードバック、非定常性、複数の目的と制約、そして(時には)パーソナライゼーションが含まれる。これらの課題にプロブレム単位で対処するための適応的手法の調整は不可能であり、静的設計はデファクトスタンダードのままである。本稿では,多種多様な目的,制約,統計的手順を柔軟に組み込む数学的プログラミングの定式化について述べる。
論文参考訳（メタデータ） (2024-08-08T16:29:09Z)
Path Signatures for Diversity in Probabilistic Trajectory Optimisation [24.101232487591094]
移動計画は、発生した軌道の関数としてコストを最小化する軌道最適化問題としてキャストすることができる。近年のハードウェアの進歩により、複数の解が同時に得られる並列軌道最適化が可能になった。本稿では, 並列軌道最適化のアルゴリズムを提案し, 解域の多様性を向上し, モード崩壊を回避する。
論文参考訳（メタデータ） (2023-08-08T06:10:53Z)
Independent Component Alignment for Multi-Task Learning [2.5234156040689237]
マルチタスク学習(MTL)では、複数のタスクに共同で取り組むために単一のモデルを訓練する。 MTL最適化の安定性基準として線形勾配系の条件数を用いる。本稿では,提案基準に基づく新しいMTL最適化手法であるAligned-MTLを提案する。
論文参考訳（メタデータ） (2023-05-30T12:56:36Z)
DDPEN: Trajectory Optimisation With Sub Goal Generation Model [70.36888514074022]
本稿では,エスケープネットワークを用いた微分動的プログラミング(DDPEN)を提案する。本稿では,環境の入力マップとして,所望の位置とともにコストマップの形で利用する深層モデルを提案する。このモデルは、目標に導く可能性のある将来の方向を生成し、リアルタイムに実行可能なローカルなミニマを避ける。
論文参考訳（メタデータ） (2023-01-18T11:02:06Z)
Robust Constrained Multi-objective Evolutionary Algorithm based on Polynomial Chaos Expansion for Trajectory Optimization [0.0]
提案手法は,頑健な定式化をPCEを介して決定論的問題に書き換える。ケーススタディとして,風の不確実性を考慮した超音速輸送(SST)の着陸軌道設計を最適化した。
論文参考訳（メタデータ） (2022-05-23T15:33:05Z)
Online Learning to Transport via the Minimal Selection Principle [2.3857747529378917]
決定変数が凸, 三次元オブジェクトであるオンライン学習輸送(OLT)問題について検討する。我々は、平均場と離散化技術を用いてORT問題を解決するために、最小選択探索法(SoMLT)と呼ばれる新しい手法を導出した。
論文参考訳（メタデータ） (2022-02-09T21:25:58Z)
On Constraints in First-Order Optimization: A View from Non-Smooth Dynamical Systems [99.59934203759754]
本稿では,スムーズな制約付き最適化のための一階法について紹介する。提案手法の2つの特徴は、実現可能な集合全体の投影や最適化が避けられることである。結果として得られるアルゴリズムの手順は、制約が非線形であっても簡単に実装できる。
論文参考訳（メタデータ） (2021-07-17T11:45:13Z)
Shortest-Path Constrained Reinforcement Learning for Sparse Reward Tasks [59.419152768018506]
最適ポリシーは必ずk-SP制約を満たすことを示す。本研究では,SP制約に違反するポリシーを完全に排除する代わりに,新たなコスト関数を提案する。また,MiniGrid,DeepMind Lab,Atari,Fetchを用いた実験の結果,提案手法はPPOを著しく改善することが示された。
論文参考訳（メタデータ） (2021-07-13T21:39:21Z)
Modeling the Second Player in Distributionally Robust Optimization [90.25995710696425]
我々は、最悪のケース分布を特徴付けるために神経生成モデルを使うことを議論する。このアプローチは多くの実装と最適化の課題をもたらします。提案されたアプローチは、同等のベースラインよりも堅牢なモデルを生み出す。
論文参考訳（メタデータ） (2021-03-18T14:26:26Z)
On Lower Bounds for Standard and Robust Gaussian Process Bandit Optimization [55.937424268654645]
有界ノルムを持つ関数のブラックボックス最適化問題に対するアルゴリズム非依存な下界を考える。本稿では, 単純さ, 汎用性, エラー確率への依存性の向上など, 後悔の下位境界を導出するための新しい証明手法を提案する。
論文参考訳（メタデータ） (2020-08-20T03:48:14Z)
Conditional gradient methods for stochastically constrained convex minimization [54.53786593679331]
構造凸最適化問題に対する条件勾配に基づく2つの新しい解法を提案する。私たちのフレームワークの最も重要な特徴は、各イテレーションで制約のサブセットだけが処理されることです。提案アルゴリズムは, 条件勾配のステップとともに, 分散の低減と平滑化に頼り, 厳密な収束保証を伴っている。
論文参考訳（メタデータ） (2020-07-07T21:26:35Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。