論文の概要: cuNRTO: GPU-Accelerated Nonlinear Robust Trajectory Optimization
- arxiv url: http://arxiv.org/abs/2603.02642v1
- Date: Tue, 03 Mar 2026 06:17:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.84654
- Title: cuNRTO: GPU-Accelerated Nonlinear Robust Trajectory Optimization
- Title(参考訳): cuNRTO: GPUによる非線形ロバスト軌道最適化
- Authors: Jiawei Wang, Arshiya Taj Abdul, Evangelos A. Theodorou,
- Abstract要約: 軌道最適化により、自律システムは不確実性の下で安全に動作することができる。
これらの問題はしばしば計算コストのかかるSOCP(Second Order Conic Programming)の制約に繋がる。
本稿では,ロバストな意思決定に直接適用可能な動的最適化アーキテクチャを2つ提案する。
- 参考スコア(独自算出の注目度): 18.671476756500464
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Robust trajectory optimization enables autonomous systems to operate safely under uncertainty by computing control policies that satisfy the constraints for all bounded disturbances. However, these problems often lead to large Second Order Conic Programming (SOCP) constraints, which are computationally expensive. In this work, we propose the CUDA Nonlinear Robust Trajectory Optimization (cuNRTO) framework by introducing two dynamic optimization architectures that have direct application to robust decision-making and are implemented on CUDA. The first architecture, NRTO-DR, leverages the Douglas-Rachford (DR) splitting method to solve the SOCP inner subproblems of NRTO, thereby significantly reducing the computational burden through parallel SOCP projections and sparse direct solves. The second architecture, NRTO-FullADMM, is a novel variant that further exploits the problem structure to improve scalability using the Alternating Direction Method of Multipliers (ADMM). Finally, we provide GPU implementation of the proposed methodologies using custom CUDA kernels for SOC projection steps and cuBLAS GEMM chains for feedback gain updates. We validate the performance of cuNRTO through simulated experiments on unicycle, quadcopter, and Franka manipulator models, demonstrating speedup up to 139.6$\times$.
- Abstract(参考訳): ロバスト軌道最適化により、自律システムは、全ての境界障害に対する制約を満たす制御ポリシーを演算することで、不確実性の下で安全に動作することができる。
しかし、これらの問題はしばしば計算コストのかかるSOCP(Second Order Conic Programming)の制約に繋がる。
本研究では,頑健な意思決定に直接適用し,CUDAに実装した動的最適化アーキテクチャを2つ導入し,CUDA非線形ロバスト軌道最適化(cuNRTO)フレームワークを提案する。
最初のアーキテクチャであるNRTO-DRは、Douglas-Rachford (DR) 分割法を利用して、NRTOのSOCP内部のサブプロブレムを解く。
第2のアーキテクチャであるNRTO-FullADMMは、ALMM(Alternating Direction Method of Multipliers)を用いたスケーラビリティ向上のために、問題構造をさらに活用する新しいバリエーションである。
最後に,SOCプロジェクションステップ用のカスタムCUDAカーネルとフィードバックゲイン更新のためのcuBLAS GEMMチェーンを用いて,提案手法のGPU実装を行う。
我々は,一輪車,クワッドコプター,フランカマニピュレータ模型のシミュレーション実験によりcuNRTOの性能を検証し,最大139.6$\times$まで高速化した。
関連論文リスト
- AdaFuse: Accelerating Dynamic Adapter Inference via Token-Level Pre-Gating and Fused Kernel Optimization [84.25316984309725]
動的スパース構造とパラメータ効率のよいアダプタ(例えばLoRA)の統合は、大規模言語モデル(LLM)を拡張するための強力な技術である。
計算負荷は最小限に抑えられるが、計算のレイテンシが急上昇し、復号速度が2.5倍以上遅くなる。
AdaFuseはアルゴリズムと基盤となるハードウェアシステムとの緊密な協調設計に基づいて構築されたフレームワークで、効率的な動的アダプタ実行を実現する。
論文 参考訳(メタデータ) (2026-03-12T12:46:42Z) - An End-to-End Deep Reinforcement Learning Approach for Solving the Traveling Salesman Problem with Drones [12.385878815004283]
本研究では、ドローンによるトラベリングセールスマン問題(TSP-D)を解決するための階層的アクター・クリティカル深部強化学習フレームワークを提案する。
アーキテクチャは、Transformerにインスパイアされたエンコーダと、効率の良いMinimal Gated Unitデコーダの2つの主要な計算で構成されている。
フレームワーク全体が非同期のアドバンテージアクター-クリティカルパラダイム内で動作します。
論文 参考訳(メタデータ) (2025-11-07T14:26:29Z) - Joint Transmit and Pinching Beamforming for Pinching Antenna Systems (PASS): Optimization-Based or Learning-Based? [89.05848771674773]
MISO (Multiple-input Single-output) フレームワークを提案する。
それは複数の導波路で構成されており、多数の低コストアンテナ(PA)を備えている。
PAの位置は、大規模パスと空間の両方にまたがるように再構成することができる。
論文 参考訳(メタデータ) (2025-02-12T18:54:10Z) - Resource Management for Low-latency Cooperative Fine-tuning of Foundation Models at the Network Edge [35.40849522296486]
大規模ファウンデーションモデル(FoMos)は、人間のような知性を実現することができる。
FoMosは微調整技術により、特定の下流タスクに適応する必要がある。
デバイスエッジ協調微調整パラダイムにおける多デバイス連携を提唱する。
論文 参考訳(メタデータ) (2024-07-13T12:47:14Z) - Efficiently Training Deep-Learning Parametric Policies using Lagrangian Duality [55.06411438416805]
制約付きマルコフ決定プロセス(CMDP)は、多くの高度な応用において重要である。
本稿では,パラメトリックアクターポリシーを効率的に訓練するための2段階深度決定規則(TS-DDR)を提案する。
現状の手法と比較して, 解の質を高め, 数桁の計算時間を削減できることが示されている。
論文 参考訳(メタデータ) (2024-05-23T18:19:47Z) - Adaptive Subcarrier, Parameter, and Power Allocation for Partitioned
Edge Learning Over Broadband Channels [69.18343801164741]
パーティショニングエッジ学習(PARTEL)は、無線ネットワークにおいてよく知られた分散学習手法であるパラメータサーバトレーニングを実装している。
本稿では、いくつかの補助変数を導入してParticleELを用いてトレーニングできるディープニューラルネットワーク(DNN)モデルについて考察する。
論文 参考訳(メタデータ) (2020-10-08T15:27:50Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。