論文の概要: Global Sampling-Based Trajectory Optimization for Contact-Rich Manipulation via KernelSOS
- arxiv url: http://arxiv.org/abs/2604.27175v1
- Date: Wed, 29 Apr 2026 20:24:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 16:31:53.79862
- Title: Global Sampling-Based Trajectory Optimization for Contact-Rich Manipulation via KernelSOS
- Title(参考訳): KernelSOSによるコンタクトリッチマニピュレーションのためのグローバルサンプリングに基づく軌道最適化
- Authors: Zhongqi Wei, Frederike Dümbgen,
- Abstract要約: 我々はグローバル探索とローカルソリューション空間を統合した統一最適化フレームワークであるGlobal-MPPIを紹介する。
本手法は,スムースなサロゲートから本来の非平滑な目的改善へ最適化景観を移行させる。
実験の結果,提案手法は,既存のベースライン法と比較して,より高速な収束と最終コストの低減を実現し,高品質な解を頑健に発見することを示した。
- 参考スコア(独自算出の注目度): 2.964978357715084
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Contact-rich manipulation is challenging due to its high dimensionality, the requirement for long time horizons, and the presence of hybrid contact dynamics. Sampling-based methods have become a popular approach for this class of problems, but without explicit mechanisms for global exploration, they are susceptible to converging to poor local minima. In this paper, we introduce Global-MPPI, a unified trajectory optimization framework that integrates global exploration and local refinement. At the global level, we leverage kernel sum-of-squares optimization to identify globally promising regions of the solution space. To enable reliable performance for the non-smooth landscapes inherent to contact-rich manipulation, we introduce a graduated non-convexity strategy based on log-sum-exp smoothing, which transitions the optimization landscape from a smoothed surrogate to the original non-smooth objective. Finally, we employ the model-predictive path integral method to locally refine the solution. We evaluate Global-MPPI on high-dimensional, long-horizon contact-rich tasks, including the PushT task and dexterous in-hand manipulation. Experimental results demonstrate that our approach robustly uncovers high-quality solutions, achieving faster convergence and lower final costs compared to existing baseline methods.
- Abstract(参考訳): コンタクトリッチな操作は、その高次元性、長期水平線の要求、およびハイブリッドコンタクトダイナミクスの存在により困難である。
サンプリングに基づく手法は、この種の問題に対して一般的なアプローチとなっているが、グローバルな探索の明確なメカニズムがなければ、現地の貧弱なミニマに収束するおそれがある。
本稿では,グローバル探索と局所改良を統合した統一軌道最適化フレームワークであるGlobal-MPPIを紹介する。
グローバルレベルでは、カーネルの総和最適化を利用して、ソリューション空間のグローバルな将来性のある領域を特定する。
接触リッチな操作に固有の非滑らかなランドスケープに対して信頼性の高い性能を実現するため,log-sum-expスムージングに基づく段階的非凸性戦略を導入し,スムーズなサロゲートから元の非滑らかな目的へ最適化ランドスケープを移行した。
最後に,モデル予測経路積分法を用いて解を局所的に洗練する。
我々は,PushTタスクや器用な手動操作を含む,高次元長軸コンタクトリッチタスクにおけるGlobal-MPPIの評価を行った。
実験により,提案手法は,既存のベースライン法と比較して,より高速な収束と最終コストの低減を実現し,高品質な解を頑健に発見することを示した。
関連論文リスト
- Domain Knowledge Guided Bayesian Optimization For Autonomous Alignment Of Complex Scientific Instruments [0.44654729785785796]
本稿では,探索問題をシンプルにするために,物理的な洞察を活かしたベイズ最適化手法を提案する。
本稿では,12次元6結晶スプリット・アンド・レイ光学系における本手法の有効性を実証する。
実測値を利用して高次元の結合最適化問題をより単純な表現に変換することにより、迅速かつ堅牢な自動チューニングが可能となる。
論文 参考訳(メタデータ) (2026-02-11T09:15:20Z) - Anytime Metaheuristic Framework for Global Route Optimization in Expected-Time Mobile Search [0.6187780920448871]
期待時間モバイルサーチ(ETS)は、移動センサが環境をナビゲートし、隠れた物体を見つけるのに必要な時間を最小化するロボット処理である。
本稿では,EMS のモデルベースソリューションフレームワークである Milaps を導入することにより,後者をさらに拡張した。
論文 参考訳(メタデータ) (2025-12-23T19:19:27Z) - Efficient Global-Local Fusion Sampling for Physics-Informed Neural Networks [5.257115841810259]
両手法の強みを組み合わせたグローバルローカル核融合(GLF)サンプリング戦略を提案する。
ガウス雑音を残差に対して逆スケールしたトレーニングポイントを摂動することで、新しいコロケーションポイントを生成する。
さらに計算オーバーヘッドを低減するために,大域的残差分布を近似するために,軽量線形サロゲートを導入する。
論文 参考訳(メタデータ) (2025-10-28T03:10:54Z) - Preference Optimization for Combinatorial Optimization Problems [54.87466279363487]
強化学習(Reinforcement Learning, RL)は、ニューラルネットワーク最適化のための強力なツールとして登場した。
大幅な進歩にもかかわらず、既存のRLアプローチは報酬信号の減少や大規模な行動空間における非効率な探索といった課題に直面している。
統計的比較モデルを用いて定量的報酬信号を定性的選好信号に変換する新しい手法であるPreference Optimizationを提案する。
論文 参考訳(メタデータ) (2025-05-13T16:47:00Z) - SPGD: Steepest Perturbed Gradient Descent Optimization [0.0]
本稿では,Steepest Perturbed Gradient Descent (SPGD)アルゴリズムを提案する。
一連の候補解を生成し、最も急な損失差を示すものを選択するように設計されている。
予備結果は4つの確立された方法よりも大幅に改善された。
論文 参考訳(メタデータ) (2024-11-07T18:23:30Z) - Towards Global Optimality for Practical Average Reward Reinforcement Learning without Mixing Time Oracles [83.85151306138007]
Multi-level Actor-Critic (MAC) フレームワークには、MLMC (Multi-level Monte-Carlo) 推定器が組み込まれている。
MACは、平均報酬設定において、既存の最先端ポリシーグラデーションベースの手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-03-18T16:23:47Z) - Dynamic Regularized Sharpness Aware Minimization in Federated Learning: Approaching Global Consistency and Smooth Landscape [59.841889495864386]
フェデレートラーニング(FL)では、グローバルサーバの協調の下で、ローカルクライアントのクラスタがチェアリングされる。
クライアントは自身のオプティマに過度に適合する傾向にあり、グローバルな目標から非常に逸脱する。
tt Family FedSMOOは、グローバルな目的に対する局所的な最適性を保証するために動的正規化器を採用する。
理論解析により, tt Family FedSMOO は, 低境界一般化による高速$mathcalO (1/T)$収束率を達成することが示された。
論文 参考訳(メタデータ) (2023-05-19T10:47:44Z) - FedLAP-DP: Federated Learning by Sharing Differentially Private Loss Approximations [53.268801169075836]
我々は,フェデレーション学習のための新しいプライバシ保護手法であるFedLAP-DPを提案する。
公式なプライバシー分析は、FedLAP-DPが典型的な勾配共有方式と同じプライバシーコストを発生させることを示している。
提案手法は, 通常の勾配共有法に比べて高速な収束速度を示す。
論文 参考訳(メタデータ) (2023-02-02T12:56:46Z) - Convergence Rates of Average-Reward Multi-agent Reinforcement Learning
via Randomized Linear Programming [41.30044824711509]
我々は,グローバル報酬が地域報酬の総和であり,共同政策がエージェントの限界と州全体の可観測性に分解される場合に焦点を当てる。
エージェントが局所的なサドル点問題を解き、局所的な重み付き平均化を行うマルチエージェント拡張を開発する。
準グロブリー最適解を得るためのサンプルの複雑さは、状態空間と作用空間の濃度に対する厳密な依存と一致することを確かめる。
論文 参考訳(メタデータ) (2021-10-22T03:48:41Z) - Localized active learning of Gaussian process state space models [63.97366815968177]
多くの共通制御アプリケーションにおいて、優れた性能を達成するためには、グローバルに正確なモデルを必要としない。
本稿では,状態-作用空間の有界部分集合上の正確なモデルを得ることを目的としたガウス過程状態空間モデルに対する能動的学習戦略を提案する。
モデル予測制御を用いることで、探索中に収集した情報を統合し、探索戦略を適応的に改善する。
論文 参考訳(メタデータ) (2020-05-04T05:35:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。