論文の概要: Decision-Oriented Learning with Differentiable Submodular Maximization
for Vehicle Routing Problem
- arxiv url: http://arxiv.org/abs/2303.01543v2
- Date: Mon, 25 Sep 2023 15:40:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-27 03:40:59.623471
- Title: Decision-Oriented Learning with Differentiable Submodular Maximization
for Vehicle Routing Problem
- Title(参考訳): 車両ルーティング問題に対する可変部分モジュラ最大化による決定指向学習
- Authors: Guangyao Shi, Pratap Tokekar
- Abstract要約: 文脈観測(入力)をサブモジュール関数(出力)のパラメータにマッピングする関数の学習問題について検討する。
本稿では,タスク最適化を予測フェーズにおける微分可能な層として組み込んだフレームワークを提案する。
- 参考スコア(独自算出の注目度): 23.211667169614227
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the problem of learning a function that maps context observations
(input) to parameters of a submodular function (output). Our motivating case
study is a specific type of vehicle routing problem, in which a team of
Unmanned Ground Vehicles (UGVs) can serve as mobile charging stations to
recharge a team of Unmanned Ground Vehicles (UAVs) that execute persistent
monitoring tasks. {We want to learn the mapping from observations of UAV task
routes and wind field to the parameters of a submodular objective function,
which describes the distribution of landing positions of the UAVs .}
Traditionally, such a learning problem is solved independently as a prediction
phase without considering the downstream task optimization phase. However, the
loss function used in prediction may be misaligned with our final goal, i.e., a
good routing decision. Good performance in the isolated prediction phase does
not necessarily lead to good decisions in the downstream routing task. In this
paper, we propose a framework that incorporates task optimization as a
differentiable layer in the prediction phase. Our framework allows end-to-end
training of the prediction model without using engineered intermediate loss
that is targeted only at the prediction performance. In the proposed framework,
task optimization (submodular maximization) is made differentiable by
introducing stochastic perturbations into deterministic algorithms (i.e.,
stochastic smoothing). We demonstrate the efficacy of the proposed framework
using synthetic data. Experimental results of the mobile charging station
routing problem show that the proposed framework can result in better routing
decisions, e.g. the average number of UAVs recharged increases, compared to the
prediction-optimization separate approach.
- Abstract(参考訳): 本研究では,文脈観測(インプット)をサブモジュール関数(アウトプット)のパラメータにマッピングする関数の学習問題について検討する。
我々のモチベーションケーススタディは、無人地上車両(UGV)のチームが、永続的な監視タスクを実行する無人地上車両(UAV)のチームを充電するための移動充電ステーションとして機能する、特定の種類の車両ルーティング問題である。
我々は,UAVタスク経路と風速の観測から,UAVの着陸位置の分布を記述するサブモジュラー目的関数のパラメータへのマッピングを学習したい。
従来,このような学習問題は,下流タスク最適化フェーズを考慮せずに,予測フェーズとして独立に解決される。
しかしながら、予測に使用される損失関数は、最終目標、すなわちよいルーティング決定とミスマッチする可能性がある。
分離された予測フェーズでの優れたパフォーマンスは、必ずしも下流のルーティングタスクにおいて良い決定を導くとは限らない。
本稿では,予測フェーズにおいてタスク最適化を微分可能な層として組み込むフレームワークを提案する。
本フレームワークは,予測性能のみを目標とした中間損失処理を使わずに,予測モデルのエンドツーエンドトレーニングを可能にする。
提案手法では,確率的摂動を決定論的アルゴリズム(確率的平滑化)に導入することにより,タスク最適化(部分モジュラー最大化)を微分可能とした。
提案手法の有効性を合成データを用いて実証する。
移動体充電ステーションルーティング問題の実験結果から,提案手法は,予測最適化別アプローチと比較して,UAVの充電回数の平均増加率など,より優れたルーティング決定をもたらすことが示された。
関連論文リスト
- Traj-Explainer: An Explainable and Robust Multi-modal Trajectory Prediction Approach [12.60529039445456]
複雑な交通環境のナビゲーションはインテリジェントな技術の進歩によって大幅に向上し、自動車の正確な環境認識と軌道予測を可能にした。
既存の研究は、しばしばシナリオエージェントの合同推論を無視し、軌道予測モデルにおける解釈可能性に欠ける。
本研究では, 説明可能な拡散条件に基づく多モード軌道予測トラj-Explainerという, 説明可能性指向の軌道予測モデルが設計されている。
論文 参考訳(メタデータ) (2024-10-22T08:17:33Z) - Truncating Trajectories in Monte Carlo Policy Evaluation: an Adaptive Approach [51.76826149868971]
モンテカルロシミュレーションによる政策評価は多くのMC強化学習(RL)アルゴリズムの中核にある。
本研究では,異なる長さの軌跡を用いた回帰推定器の平均二乗誤差のサロゲートとして品質指標を提案する。
本稿では,Robust and Iterative Data Collection Strategy Optimization (RIDO) という適応アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-17T11:47:56Z) - DiFSD: Ego-Centric Fully Sparse Paradigm with Uncertainty Denoising and Iterative Refinement for Efficient End-to-End Autonomous Driving [55.53171248839489]
我々は、エンドツーエンドの自動運転のためのエゴ中心の完全スパースパラダイムであるDiFSDを提案する。
特に、DiFSDは主にスパース知覚、階層的相互作用、反復的な運動プランナーから構成される。
nuScenesデータセットで行った実験は、DiFSDの優れた計画性能と優れた効率を示す。
論文 参考訳(メタデータ) (2024-09-15T15:55:24Z) - Optimizing Diffusion Models for Joint Trajectory Prediction and Controllable Generation [49.49868273653921]
拡散モデルは、自律運転における共同軌道予測と制御可能な生成を約束する。
最適ガウス拡散(OGD)と推定クリーンマニフォールド(ECM)誘導を導入する。
提案手法は生成過程の合理化を図り,計算オーバーヘッドを低減した実用的な応用を実現する。
論文 参考訳(メタデータ) (2024-08-01T17:59:59Z) - A Multi-Stage Goal-Driven Network for Pedestrian Trajectory Prediction [6.137256382926171]
本稿では,多段階目標駆動ネットワーク(MGNet)と呼ばれる,歩行者軌道予測の新しい手法を提案する。
ネットワークは、条件付き変分オートエンコーダ(CVAE)、アテンションモジュール、多段階ゴール評価器の3つの主要コンポーネントから構成される。
MGNetの有効性は、JAADおよびPIEデータセットに関する総合的な実験を通して示される。
論文 参考訳(メタデータ) (2024-06-26T03:59:21Z) - Knowledge-aware Graph Transformer for Pedestrian Trajectory Prediction [15.454206825258169]
歩行者運動軌跡の予測は、自動運転車の経路計画と移動制御に不可欠である。
近年の深層学習に基づく予測手法は、主に軌跡履歴や歩行者間の相互作用などの情報を利用する。
本稿では,予測性能を向上させるためのグラフトランス構造を提案する。
論文 参考訳(メタデータ) (2024-01-10T01:50:29Z) - Control-Aware Prediction Objectives for Autonomous Driving [78.19515972466063]
本研究では,制御に対する予測の下流効果を評価するための制御認識予測目標(CAPOs)を提案する。
本稿では,エージェント間の注意モデルを用いた重み付けと,予測軌跡を接地真実軌跡に交換する際の制御変動に基づく重み付けの2つの方法を提案する。
論文 参考訳(メタデータ) (2022-04-28T07:37:21Z) - TAE: A Semi-supervised Controllable Behavior-aware Trajectory Generator
and Predictor [3.6955256596550137]
軌道生成と予測は、知的車両のプランナー評価と意思決定において重要な役割を果たす。
本稿では,ドライバの動作を明示的にモデル化する行動認識型トラジェクトリ・オートエンコーダ(TAE)を提案する。
我々のモデルは、統一アーキテクチャにおける軌道生成と予測に対処し、両方のタスクに利益をもたらす。
論文 参考訳(メタデータ) (2022-03-02T17:37:44Z) - RoMA: Robust Model Adaptation for Offline Model-based Optimization [115.02677045518692]
入力出力クエリの静的データセットからブラックボックス目的関数を最大化する入力を探索する問題を考える。
この問題を解決するための一般的なアプローチは、真の客観的関数を近似するプロキシモデルを維持することである。
ここでの大きな課題は、検索中に逆最適化された入力を避ける方法である。
論文 参考訳(メタデータ) (2021-10-27T05:37:12Z) - Divide-and-Conquer for Lane-Aware Diverse Trajectory Prediction [71.97877759413272]
軌道予測は、自動運転車が行動を計画し実行するための安全クリティカルなツールです。
近年の手法は,WTAやベスト・オブ・マニーといったマルチコース学習の目標を用いて,強力なパフォーマンスを実現している。
我々の研究は、軌道予測、学習出力、そして運転知識を使って制約を課すことによるより良い予測における2つの重要な課題に対処する。
論文 参考訳(メタデータ) (2021-04-16T17:58:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。