Fugu-MT 論文翻訳(概要): Decision-Oriented Learning with Differentiable Submodular Maximization for Vehicle Routing Problem

論文の概要: Decision-Oriented Learning with Differentiable Submodular Maximization for Vehicle Routing Problem

arxiv url: http://arxiv.org/abs/2303.01543v1
Date: Thu, 2 Mar 2023 19:19:39 GMT
ステータス: 翻訳完了
システム内更新日: 2023-03-06 17:15:55.658535
Title: Decision-Oriented Learning with Differentiable Submodular Maximization for Vehicle Routing Problem
Title（参考訳）: 車両ルーティング問題に対する可変部分モジュラ最大化による決定指向学習
Authors: Guangyao Shi, Pratap Tokekar
Abstract要約: 文脈観測(入力)をサブモジュール関数(出力)のパラメータにマッピングする関数の学習問題について検討する。本稿では,タスク最適化を予測フェーズにおける微分可能な層として組み込んだフレームワークを提案する。
参考スコア（独自算出の注目度）: 21.70169149901781
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We study the problem of learning a function that maps context observations (input) to parameters of a submodular function (output). Our motivating case study is a specific type of vehicle routing problem, in which a team of Unmanned Ground Vehicles (UGVs) can serve as mobile charging stations to recharge a team of Unmanned Ground Vehicles (UAVs) that execute persistent monitoring tasks. {We want to learn the mapping from observations of UAV task routes and wind field to the parameters of a submodular objective function, which describes the distribution of landing positions of the UAVs .} Traditionally, such a learning problem is solved independently as a prediction phase without considering the downstream task optimization phase. However, the loss function used in prediction may be misaligned with our final goal, i.e., a good routing decision. Good performance in the isolated prediction phase does not necessarily lead to good decisions in the downstream routing task. In this paper, we propose a framework that incorporates task optimization as a differentiable layer in the prediction phase. Our framework allows end-to-end training of the prediction model without using engineered intermediate loss that is targeted only at the prediction performance. In the proposed framework, task optimization (submodular maximization) is made differentiable by introducing stochastic perturbations into deterministic algorithms (i.e., stochastic smoothing). We demonstrate the efficacy of the proposed framework using synthetic data. Experimental results of the mobile charging station routing problem show that the proposed framework can result in better routing decisions, e.g. the average number of UAVs recharged increases, compared to the prediction-optimization separate approach.
Abstract（参考訳）: 本研究では,文脈観測(インプット)をサブモジュール関数(アウトプット)のパラメータにマッピングする関数の学習問題について検討する。我々のモチベーションケーススタディは、無人地上車両(UGV)のチームが、永続的な監視タスクを実行する無人地上車両(UAV)のチームを充電するための移動充電ステーションとして機能する、特定の種類の車両ルーティング問題である。我々は,UAVタスク経路と風速の観測から,UAVの着陸位置の分布を記述するサブモジュラー目的関数のパラメータへのマッピングを学習したい。従来,このような学習問題は,下流タスク最適化フェーズを考慮せずに,予測フェーズとして独立に解決される。しかしながら、予測に使用される損失関数は、最終目標、すなわちよいルーティング決定とミスマッチする可能性がある。分離された予測フェーズでの優れたパフォーマンスは、必ずしも下流のルーティングタスクにおいて良い決定を導くとは限らない。本稿では,予測フェーズにおいてタスク最適化を微分可能な層として組み込むフレームワークを提案する。本フレームワークは,予測性能のみを目標とした中間損失処理を使わずに,予測モデルのエンドツーエンドトレーニングを可能にする。提案手法では,確率的摂動を決定論的アルゴリズム(確率的平滑化)に導入することにより,タスク最適化(部分モジュラー最大化)を微分可能とした。提案手法の有効性を合成データを用いて実証する。移動体充電ステーションルーティング問題の実験結果から,提案手法は,予測最適化別アプローチと比較して,UAVの充電回数の平均増加率など,より優れたルーティング決定をもたらすことが示された。

関連論文リスト

An End-to-End Smart Predict-then-Optimize Framework for Vehicle Relocation Problems in Large-Scale Vehicle Crowd Sensing [10.74565749809106]
車両システムは、旅行要求やルートの性質により、しばしば偏りのあるカバレッジを示す。我々は最適化を予測に統合することで、エンドツーエンドのSmart Predict-then-optize (SPO) フレームワークを開発する。このフレームワークは上流の予測エラーではなく、タスク固有のマッチングによって訓練される。
論文参考訳（メタデータ） (2024-11-27T15:16:22Z)
Traj-Explainer: An Explainable and Robust Multi-modal Trajectory Prediction Approach [12.60529039445456]
複雑な交通環境のナビゲーションはインテリジェントな技術の進歩によって大幅に向上し、自動車の正確な環境認識と軌道予測を可能にした。既存の研究は、しばしばシナリオエージェントの合同推論を無視し、軌道予測モデルにおける解釈可能性に欠ける。本研究では, 説明可能な拡散条件に基づく多モード軌道予測トラj-Explainerという, 説明可能性指向の軌道予測モデルが設計されている。
論文参考訳（メタデータ） (2024-10-22T08:17:33Z)
Truncating Trajectories in Monte Carlo Policy Evaluation: an Adaptive Approach [51.76826149868971]
モンテカルロシミュレーションによる政策評価は多くのMC強化学習(RL)アルゴリズムの中核にある。本研究では,異なる長さの軌跡を用いた回帰推定器の平均二乗誤差のサロゲートとして品質指標を提案する。本稿では,Robust and Iterative Data Collection Strategy Optimization (RIDO) という適応アルゴリズムを提案する。
論文参考訳（メタデータ） (2024-10-17T11:47:56Z)
Optimizing Diffusion Models for Joint Trajectory Prediction and Controllable Generation [49.49868273653921]
拡散モデルは、自律運転における共同軌道予測と制御可能な生成を約束する。最適ガウス拡散(OGD)と推定クリーンマニフォールド(ECM)誘導を導入する。提案手法は生成過程の合理化を図り,計算オーバーヘッドを低減した実用的な応用を実現する。
論文参考訳（メタデータ） (2024-08-01T17:59:59Z)
A Multi-Stage Goal-Driven Network for Pedestrian Trajectory Prediction [6.137256382926171]
本稿では,多段階目標駆動ネットワーク(MGNet)と呼ばれる,歩行者軌道予測の新しい手法を提案する。ネットワークは、条件付き変分オートエンコーダ(CVAE)、アテンションモジュール、多段階ゴール評価器の3つの主要コンポーネントから構成される。 MGNetの有効性は、JAADおよびPIEデータセットに関する総合的な実験を通して示される。
論文参考訳（メタデータ） (2024-06-26T03:59:21Z)
Knowledge-aware Graph Transformer for Pedestrian Trajectory Prediction [15.454206825258169]
歩行者運動軌跡の予測は、自動運転車の経路計画と移動制御に不可欠である。近年の深層学習に基づく予測手法は、主に軌跡履歴や歩行者間の相互作用などの情報を利用する。本稿では,予測性能を向上させるためのグラフトランス構造を提案する。
論文参考訳（メタデータ） (2024-01-10T01:50:29Z)
Reinforcement Learning with a Terminator [80.34572413850186]
我々は, TerMDP のパラメータを学習し, 推定問題の構造を活用し, 状態ワイドな信頼境界を提供する。我々はこれらを用いて証明可能な効率のよいアルゴリズムを構築し、終端を考慮し、その後悔を抑える。
論文参考訳（メタデータ） (2022-05-30T18:40:28Z)
Control-Aware Prediction Objectives for Autonomous Driving [78.19515972466063]
本研究では,制御に対する予測の下流効果を評価するための制御認識予測目標(CAPOs)を提案する。本稿では,エージェント間の注意モデルを用いた重み付けと,予測軌跡を接地真実軌跡に交換する際の制御変動に基づく重み付けの2つの方法を提案する。
論文参考訳（メタデータ） (2022-04-28T07:37:21Z)
TAE: A Semi-supervised Controllable Behavior-aware Trajectory Generator and Predictor [3.6955256596550137]
軌道生成と予測は、知的車両のプランナー評価と意思決定において重要な役割を果たす。本稿では,ドライバの動作を明示的にモデル化する行動認識型トラジェクトリ・オートエンコーダ(TAE)を提案する。我々のモデルは、統一アーキテクチャにおける軌道生成と予測に対処し、両方のタスクに利益をもたらす。
論文参考訳（メタデータ） (2022-03-02T17:37:44Z)
RoMA: Robust Model Adaptation for Offline Model-based Optimization [115.02677045518692]
入力出力クエリの静的データセットからブラックボックス目的関数を最大化する入力を探索する問題を考える。この問題を解決するための一般的なアプローチは、真の客観的関数を近似するプロキシモデルを維持することである。ここでの大きな課題は、検索中に逆最適化された入力を避ける方法である。
論文参考訳（メタデータ） (2021-10-27T05:37:12Z)
Divide-and-Conquer for Lane-Aware Diverse Trajectory Prediction [71.97877759413272]
軌道予測は、自動運転車が行動を計画し実行するための安全クリティカルなツールです。近年の手法は,WTAやベスト・オブ・マニーといったマルチコース学習の目標を用いて,強力なパフォーマンスを実現している。我々の研究は、軌道予測、学習出力、そして運転知識を使って制約を課すことによるより良い予測における2つの重要な課題に対処する。
論文参考訳（メタデータ） (2021-04-16T17:58:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。