論文の概要: Decision-Oriented Learning with Differentiable Submodular Maximization
for Vehicle Routing Problem
- arxiv url: http://arxiv.org/abs/2303.01543v1
- Date: Thu, 2 Mar 2023 19:19:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-06 17:15:55.658535
- Title: Decision-Oriented Learning with Differentiable Submodular Maximization
for Vehicle Routing Problem
- Title(参考訳): 車両ルーティング問題に対する可変部分モジュラ最大化による決定指向学習
- Authors: Guangyao Shi, Pratap Tokekar
- Abstract要約: 文脈観測(入力)をサブモジュール関数(出力)のパラメータにマッピングする関数の学習問題について検討する。
本稿では,タスク最適化を予測フェーズにおける微分可能な層として組み込んだフレームワークを提案する。
- 参考スコア(独自算出の注目度): 21.70169149901781
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the problem of learning a function that maps context observations
(input) to parameters of a submodular function (output). Our motivating case
study is a specific type of vehicle routing problem, in which a team of
Unmanned Ground Vehicles (UGVs) can serve as mobile charging stations to
recharge a team of Unmanned Ground Vehicles (UAVs) that execute persistent
monitoring tasks. {We want to learn the mapping from observations of UAV task
routes and wind field to the parameters of a submodular objective function,
which describes the distribution of landing positions of the UAVs .}
Traditionally, such a learning problem is solved independently as a prediction
phase without considering the downstream task optimization phase. However, the
loss function used in prediction may be misaligned with our final goal, i.e., a
good routing decision. Good performance in the isolated prediction phase does
not necessarily lead to good decisions in the downstream routing task. In this
paper, we propose a framework that incorporates task optimization as a
differentiable layer in the prediction phase. Our framework allows end-to-end
training of the prediction model without using engineered intermediate loss
that is targeted only at the prediction performance. In the proposed framework,
task optimization (submodular maximization) is made differentiable by
introducing stochastic perturbations into deterministic algorithms (i.e.,
stochastic smoothing). We demonstrate the efficacy of the proposed framework
using synthetic data. Experimental results of the mobile charging station
routing problem show that the proposed framework can result in better routing
decisions, e.g. the average number of UAVs recharged increases, compared to the
prediction-optimization separate approach.
- Abstract(参考訳): 本研究では,文脈観測(インプット)をサブモジュール関数(アウトプット)のパラメータにマッピングする関数の学習問題について検討する。
我々のモチベーションケーススタディは、無人地上車両(UGV)のチームが、永続的な監視タスクを実行する無人地上車両(UAV)のチームを充電するための移動充電ステーションとして機能する、特定の種類の車両ルーティング問題である。
我々は,UAVタスク経路と風速の観測から,UAVの着陸位置の分布を記述するサブモジュラー目的関数のパラメータへのマッピングを学習したい。
従来,このような学習問題は,下流タスク最適化フェーズを考慮せずに,予測フェーズとして独立に解決される。
しかしながら、予測に使用される損失関数は、最終目標、すなわちよいルーティング決定とミスマッチする可能性がある。
分離された予測フェーズでの優れたパフォーマンスは、必ずしも下流のルーティングタスクにおいて良い決定を導くとは限らない。
本稿では,予測フェーズにおいてタスク最適化を微分可能な層として組み込むフレームワークを提案する。
本フレームワークは,予測性能のみを目標とした中間損失処理を使わずに,予測モデルのエンドツーエンドトレーニングを可能にする。
提案手法では,確率的摂動を決定論的アルゴリズム(確率的平滑化)に導入することにより,タスク最適化(部分モジュラー最大化)を微分可能とした。
提案手法の有効性を合成データを用いて実証する。
移動体充電ステーションルーティング問題の実験結果から,提案手法は,予測最適化別アプローチと比較して,UAVの充電回数の平均増加率など,より優れたルーティング決定をもたらすことが示された。
関連論文リスト
- Knowledge-aware Graph Transformer for Pedestrian Trajectory Prediction [15.454206825258169]
歩行者運動軌跡の予測は、自動運転車の経路計画と移動制御に不可欠である。
近年の深層学習に基づく予測手法は、主に軌跡履歴や歩行者間の相互作用などの情報を利用する。
本稿では,予測性能を向上させるためのグラフトランス構造を提案する。
論文 参考訳(メタデータ) (2024-01-10T01:50:29Z) - Score Function Gradient Estimation to Widen the Applicability of
Decision-Focused Learning [17.494540497438955]
決定中心学習(DFL)は、タスク損失を直接最小化し、MLモデルをトレーニングすることを目的として、最近提案されたパラダイムである。
本研究では,パラメータ上でのテキスト分布の予測とスコア関数勾配推定(SFGE)を用いて,予測モデルに対する決定中心の更新を計算することにより,これらの制約に対処する。
実験の結果,(1)目的関数と制約の両方で発生する予測に対処し,(2)2段階最適化問題に効果的に取り組むことができることがわかった。
論文 参考訳(メタデータ) (2023-07-11T12:32:13Z) - Integrated Sensing, Computation, and Communication for UAV-assisted
Federated Edge Learning [52.7230652428711]
フェデレーションエッジ学習(FEEL)は、エッジデバイスとサーバ間の定期的な通信を通じて、プライバシ保護モデルトレーニングを可能にする。
無人航空機(UAV)搭載エッジデバイスは、効率的なデータ収集における柔軟性と移動性のため、FEELにとって特に有利である。
論文 参考訳(メタデータ) (2023-06-05T16:01:33Z) - RESET: Revisiting Trajectory Sets for Conditional Behavior Prediction [12.945951957551317]
本稿では、トラジェクトリセット生成のための新しいメトリック駆動アルゴリズムとグラフベースのエンコーダを組み合わせたRESETを提案する。
非条件予測では、RESETは回帰ベースのアプローチと同等のパフォーマンスを達成する。
条件付き予測では、RESETは計画された軌道の遅い融合によって合理的な結果を得る。
論文 参考訳(メタデータ) (2023-04-12T13:39:09Z) - Reinforcement Learning with a Terminator [80.34572413850186]
我々は, TerMDP のパラメータを学習し, 推定問題の構造を活用し, 状態ワイドな信頼境界を提供する。
我々はこれらを用いて証明可能な効率のよいアルゴリズムを構築し、終端を考慮し、その後悔を抑える。
論文 参考訳(メタデータ) (2022-05-30T18:40:28Z) - Control-Aware Prediction Objectives for Autonomous Driving [78.19515972466063]
本研究では,制御に対する予測の下流効果を評価するための制御認識予測目標(CAPOs)を提案する。
本稿では,エージェント間の注意モデルを用いた重み付けと,予測軌跡を接地真実軌跡に交換する際の制御変動に基づく重み付けの2つの方法を提案する。
論文 参考訳(メタデータ) (2022-04-28T07:37:21Z) - Stochastic Trajectory Prediction via Motion Indeterminacy Diffusion [88.45326906116165]
運動不確定性拡散(MID)の逆過程として軌道予測タスクを定式化する新しい枠組みを提案する。
我々は,履歴行動情報と社会的相互作用を状態埋め込みとしてエンコードし,トランジトリの時間的依存性を捉えるためにトランスフォーマーに基づく拡散モデルを考案する。
スタンフォード・ドローンやETH/UCYデータセットなど,人間の軌道予測ベンチマーク実験により,本手法の優位性を実証した。
論文 参考訳(メタデータ) (2022-03-25T16:59:08Z) - TAE: A Semi-supervised Controllable Behavior-aware Trajectory Generator
and Predictor [3.6955256596550137]
軌道生成と予測は、知的車両のプランナー評価と意思決定において重要な役割を果たす。
本稿では,ドライバの動作を明示的にモデル化する行動認識型トラジェクトリ・オートエンコーダ(TAE)を提案する。
我々のモデルは、統一アーキテクチャにおける軌道生成と予測に対処し、両方のタスクに利益をもたらす。
論文 参考訳(メタデータ) (2022-03-02T17:37:44Z) - RoMA: Robust Model Adaptation for Offline Model-based Optimization [115.02677045518692]
入力出力クエリの静的データセットからブラックボックス目的関数を最大化する入力を探索する問題を考える。
この問題を解決するための一般的なアプローチは、真の客観的関数を近似するプロキシモデルを維持することである。
ここでの大きな課題は、検索中に逆最適化された入力を避ける方法である。
論文 参考訳(メタデータ) (2021-10-27T05:37:12Z) - Divide-and-Conquer for Lane-Aware Diverse Trajectory Prediction [71.97877759413272]
軌道予測は、自動運転車が行動を計画し実行するための安全クリティカルなツールです。
近年の手法は,WTAやベスト・オブ・マニーといったマルチコース学習の目標を用いて,強力なパフォーマンスを実現している。
我々の研究は、軌道予測、学習出力、そして運転知識を使って制約を課すことによるより良い予測における2つの重要な課題に対処する。
論文 参考訳(メタデータ) (2021-04-16T17:58:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。