Fugu-MT 論文翻訳(概要): CGD: Constraint-Guided Diffusion Policies for UAV Trajectory Planning

論文の概要: CGD: Constraint-Guided Diffusion Policies for UAV Trajectory Planning

arxiv url: http://arxiv.org/abs/2405.01758v1
Date: Thu, 2 May 2024 21:50:26 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-06 14:15:00.655911
Title: CGD: Constraint-Guided Diffusion Policies for UAV Trajectory Planning
Title（参考訳）: CGD:UAV軌道計画のための制約誘導拡散政策
Authors: Kota Kondo, Andrea Tagliabue, Xiaoyi Cai, Claudius Tewari, Olivia Garcia, Marcos Espitia-Alvarez, Jonathan P. How,
Abstract要約: 計算時間を短縮するために成功した戦略は、Imitation Learning (IL)を使用して専門家から高速ニューラルネットワーク(NN)ポリシーを開発することである。結果のNNポリシは,専門家と同様のトラジェクトリを高速に生成する上で有効だが,その出力は動的実現可能性を明確に考慮していない。本稿では,トラジェクトリ計画のための新しいILベースのアプローチであるConstraint-Guided Diffusion (CGD)を提案する。
参考スコア（独自算出の注目度）: 26.10588918124538
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Traditional optimization-based planners, while effective, suffer from high computational costs, resulting in slow trajectory generation. A successful strategy to reduce computation time involves using Imitation Learning (IL) to develop fast neural network (NN) policies from those planners, which are treated as expert demonstrators. Although the resulting NN policies are effective at quickly generating trajectories similar to those from the expert, (1) their output does not explicitly account for dynamic feasibility, and (2) the policies do not accommodate changes in the constraints different from those used during training. To overcome these limitations, we propose Constraint-Guided Diffusion (CGD), a novel IL-based approach to trajectory planning. CGD leverages a hybrid learning/online optimization scheme that combines diffusion policies with a surrogate efficient optimization problem, enabling the generation of collision-free, dynamically feasible trajectories. The key ideas of CGD include dividing the original challenging optimization problem solved by the expert into two more manageable sub-problems: (a) efficiently finding collision-free paths, and (b) determining a dynamically-feasible time-parametrization for those paths to obtain a trajectory. Compared to conventional neural network architectures, we demonstrate through numerical evaluations significant improvements in performance and dynamic feasibility under scenarios with new constraints never encountered during training.
Abstract（参考訳）: 従来の最適化ベースのプランナーは、有効ではあるが高い計算コストに悩まされ、軌道生成が遅くなる。計算時間を短縮するために成功した戦略は、Imitation Learning(IL)を使用して、専門家の実証者として扱われる、これらのプランナーから高速ニューラルネットワーク(NN)ポリシーを開発することである。その結果, NN ポリシは, 専門家と同様の軌道を迅速に生成する上で有効であるが, 1) アウトプットは動的実現性を考慮しておらず, (2) トレーニング中に使用する制約と異なる制約の変化に対応できない。これらの制約を克服するために,新しいILベースの軌道計画手法である Constraint-Guided Diffusion (CGD) を提案する。 CGDは、拡散ポリシーと代理効率のよい最適化問題を組み合わせたハイブリッド学習/オンライン最適化方式を利用して、衝突のない動的に実現可能な軌道生成を可能にする。 CGDのキーとなる考え方は、専門家によって解決された元の挑戦的な最適化問題を、より管理しやすい2つのサブプロブレムに分割することである。 (a)衝突のない経路を効率よく見つけ、 (b)これらの経路に対して動的に実現可能な時間パラメトリゼーションを決定し、軌道を得る。従来のニューラルネットワークアーキテクチャと比較して,トレーニング中に発生しない新たな制約のあるシナリオにおいて,性能と動的実現可能性の大幅な向上を示す。

関連論文リスト

Decentralized Learning Strategies for Estimation Error Minimization with Graph Neural Networks [86.99017195607077]
無線ネットワークにおける自己回帰的マルコフ音源のリアルタイムサンプリングと推定について検討する。政策最適化のためのグラフィカル強化学習フレームワークを提案する。理論的には、提案したポリシーは転送可能であり、あるグラフ上で訓練されたポリシーを構造的に類似したグラフに効果的に適用することができる。
論文参考訳（メタデータ） (2026-01-19T02:18:45Z)
Steerable Adversarial Scenario Generation through Test-Time Preference Alignment [58.37104890690234]
対立シナリオ生成は、自律運転システムの安全性評価のためのコスト効率の良いアプローチである。 textbfSteerable textbfAdversarial scenario textbfGEnerator (SAGE) という新しいフレームワークを導入する。 SAGEは、逆境とリアリズムの間のトレードオフを、再トレーニングなしできめ細かいテストタイムコントロールを可能にします。
論文参考訳（メタデータ） (2025-09-24T13:27:35Z)
Improved particle swarm optimization algorithm: multi-target trajectory optimization for swarm drones [20.531764063763678]
従来のParticle Swarm Optimization (PSO) 手法は、リアルタイムシナリオにおける早期収束と遅延に苦慮している。 PSOベースのオンライントラジェクトリプランナであるPE-PSOを提案する。遺伝的アルゴリズム(GA)に基づくタスク割り当てと分散PE-PSOを組み合わせたマルチエージェントフレームワークを開発した。
論文参考訳（メタデータ） (2025-07-18T04:31:49Z)
Towards Constraint-Based Adaptive Hypergraph Learning for Solving Vehicle Routing: An End-to-End Solution [4.965709007367529]
車両の経路問題は、広大な解空間と複雑な制約によって特徴づけられる。本研究では,制約指向のハイパーグラフと強化学習を組み合わせた新しいエンドツーエンドフレームワークを提案する。
論文参考訳（メタデータ） (2025-03-13T14:42:44Z)
Improved deep learning of chaotic dynamical systems with multistep penalty losses [0.0]
カオスシステムの長期的な振る舞いを予測することは、依然として恐ろしい課題である。本稿では,最近提案された多段階ペナルティ演算子を活用することで,これらの課題に対処する新しい枠組みを提案する。
論文参考訳（メタデータ） (2024-10-08T00:13:57Z)
Two-Stage ML-Guided Decision Rules for Sequential Decision Making under Uncertainty [55.06411438416805]
SDMU (Sequential Decision Making Under Uncertainty) は、エネルギー、金融、サプライチェーンといった多くの領域において、ユビキタスである。いくつかのSDMUは、自然にマルチステージ問題(MSP)としてモデル化されているが、結果として得られる最適化は、計算の観点からは明らかに困難である。本稿では,2段階の一般決定規則(TS-GDR)を導入し,線形関数を超えて政策空間を一般化する手法を提案する。 TS-GDRの有効性は、TS-LDR(Two-Stage Deep Decision Rules)と呼ばれるディープリカレントニューラルネットワークを用いたインスタンス化によって実証される。
論文参考訳（メタデータ） (2024-05-23T18:19:47Z)
SOMTP: Self-Supervised Learning-Based Optimizer for MPC-Based Safe Trajectory Planning Problems in Robotics [13.129654942805846]
モデル予測制御(MP)に基づく軌道計画が広く使われており、制御バリア(CBF)はその制約を改善することができる。本稿では,CBF-MPC軌道計画のための自己教師付き学習アルゴリズムを提案する。
論文参考訳（メタデータ） (2024-05-15T09:38:52Z)
An Efficient Learning-based Solver Comparable to Metaheuristics for the Capacitated Arc Routing Problem [67.92544792239086]
我々は,高度メタヒューリスティックスとのギャップを著しく狭めるため,NNベースの解法を導入する。まず,方向対応型注意モデル(DaAM)を提案する。第2に、教師付き事前学習を伴い、堅牢な初期方針を確立するための教師付き強化学習スキームを設計する。
論文参考訳（メタデータ） (2024-03-11T02:17:42Z)
Learning Constrained Optimization with Deep Augmented Lagrangian Methods [54.22290715244502]
機械学習(ML)モデルは、制約付き最適化ソルバをエミュレートするために訓練される。本稿では,MLモデルを用いて2つの解推定を直接予測する手法を提案する。これにより、双対目的が損失関数であるエンドツーエンドのトレーニングスキームと、双対上昇法をエミュレートした原始的実現可能性への解推定を可能にする。
論文参考訳（メタデータ） (2024-03-06T04:43:22Z)
A Multi-Head Ensemble Multi-Task Learning Approach for Dynamical Computation Offloading [62.34538208323411]
共有バックボーンと複数の予測ヘッド(PH)を組み合わせたマルチヘッドマルチタスク学習(MEMTL)手法を提案する。 MEMTLは、追加のトレーニングデータを必要とせず、推測精度と平均平方誤差の両方でベンチマーク手法より優れている。
論文参考訳（メタデータ） (2023-09-02T11:01:16Z)
Multiplicative update rules for accelerating deep learning training and increasing robustness [69.90473612073767]
我々は、幅広い機械学習アルゴリズムに適合し、代替の更新ルールを適用することができる最適化フレームワークを提案する。提案するフレームワークはトレーニングを加速する一方、従来の追加更新ルールとは対照的に、より堅牢なモデルにつながります。
論文参考訳（メタデータ） (2023-07-14T06:44:43Z)
Collaborative Multidisciplinary Design Optimization with Neural Networks [1.2691047660244335]
協調最適化の場合、二項分類の興味深い問題を解くことにより、より高速で信頼性の高い収束が得られることを示す。本稿では,非対称な損失関数,リプシッツ連続性を保証する構造,基本距離関数の性質を尊重する正規化を含むニューラルネットワークのトレーニングを提案する。
論文参考訳（メタデータ） (2021-06-11T00:03:47Z)
A Differential Game Theoretic Neural Optimizer for Training Residual Networks [29.82841891919951]
本稿では、残差接続と畳み込み層の両方を受け入れる一般化微分動的プログラミング(DDP)ニューラルアーキテクチャを提案する。得られた最適制御表現は、トレーニング残余ネットワークを、状態拡張システム上での協調的軌道最適化と解釈できるゲーム論的視点を許容する。
論文参考訳（メタデータ） (2020-07-17T10:19:17Z)
Combining Deep Learning and Optimization for Security-Constrained Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。 SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文参考訳（メタデータ） (2020-07-14T12:38:21Z)
DDPNOpt: Differential Dynamic Programming Neural Optimizer [29.82841891919951]
トレーニングのための最も広く使われているアルゴリズムは、差分動的プログラミング(DDP)とリンク可能であることを示す。本稿では,フィードフォワードと畳み込みネットワークをトレーニングするためのDDPOptの新たなクラスを提案する。
論文参考訳（メタデータ） (2020-02-20T15:42:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。