論文の概要: Deep-Dispatch: A Deep Reinforcement Learning-Based Vehicle Dispatch
Algorithm for Advanced Air Mobility
- arxiv url: http://arxiv.org/abs/2312.10809v1
- Date: Sun, 17 Dec 2023 20:21:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-19 14:35:51.147022
- Title: Deep-Dispatch: A Deep Reinforcement Learning-Based Vehicle Dispatch
Algorithm for Advanced Air Mobility
- Title(参考訳): deep-dispatch: 高度エアモビリティのための深層強化学習に基づく車両派遣アルゴリズム
- Authors: Elaheh Sabziyan Varnousfaderani, Syed A. M. Shihab, Esrat F. Dulia
- Abstract要約: 我々は,営業利益を最大化するために,深層強化学習に基づくeVTOLディスパッチアルゴリズムを開発した。
提案アルゴリズムの性能評価のために,eVTOLを用いた乗客輸送シミュレーション環境を構築した。
その結果,マルチエージェントeVTOLディスパッチアルゴリズムは最適ディスパッチポリシーを近似できることがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Near future air taxi operations with electric vertical take-off and landing
(eVTOL) aircraft will be constrained by the need for frequent recharging of
eVTOLs, limited takeoff and landing pads in vertiports, and subject to
time-varying demand and electricity prices, making the eVTOL dispatch problem
unique and particularly challenging to solve. Previously, we have developed
optimization models to address this problem. Such optimization models however
suffer from prohibitively high computational run times when the scale of the
problem increases, making them less practical for real world implementation. To
overcome this issue, we have developed two deep reinforcement learning-based
eVTOL dispatch algorithms, namely single-agent and multi-agent deep Q-learning
eVTOL dispatch algorithms, where the objective is to maximize operating profit.
An eVTOL-based passenger transportation simulation environment was built to
assess the performance of our algorithms across $36$ numerical cases with
varying number of eVTOLs, vertiports, and demand. The results indicate that the
multi-agent eVTOL dispatch algorithm can closely approximate the optimal
dispatch policy with significantly less computational expenses compared to the
benchmark optimization model. The multi-agent algorithm was found to outperform
the single-agent counterpart with respect to both profits generated and
training time.
- Abstract(参考訳): 電動垂直離着陸機(eVTOL)による将来のエアタクシーの運用は、eVTOLの頻繁な再充電の必要性、垂直離着陸パッドの制限、時間的変化による需要と電力価格の変動により制約され、eVTOLディスパッチ問題はユニークで特に解決が難しい。
これまで,この問題に対処する最適化モデルを開発してきた。
しかし、そのような最適化モデルでは、問題の規模が大きくなると計算実行時間が著しく増加し、現実的な実装では実用性が低下する。
この問題を克服するため、我々は、単エージェントと複数エージェントの深層学習eVTOLディスパッチアルゴリズムという、2つの深層学習eVTOLディスパッチアルゴリズムを開発した。
eVTOLをベースとした旅客輸送シミュレーション環境を構築し,eVTOL,Vertiport,需要の異なる36ドルの数値ケースを対象に,アルゴリズムの性能評価を行った。
その結果、マルチエージェントのeVTOLディスパッチアルゴリズムは、ベンチマーク最適化モデルと比較して計算コストが大幅に少ない最適ディスパッチポリシーを近似できることがわかった。
マルチエージェントアルゴリズムは, 利益とトレーニング時間の両方において, シングルエージェントよりも優れていた。
関連論文リスト
- Towards Robust Spacecraft Trajectory Optimization via Transformers [17.073280827888226]
将来の多機のミッションでは、安全かつ効率的なランデブー操作を確保するために、堅牢な自律的な最適化機能が必要である。
この負担を軽減するため、生成トランスフォーマーモデルを導入し、ロバストな最適初期推定を提供する。
この研究はARTの機能を拡張し、堅牢な制約付き最適制御問題に対処する。
論文 参考訳(メタデータ) (2024-10-08T00:58:42Z) - Autonomous Vehicle Controllers From End-to-End Differentiable Simulation [60.05963742334746]
そこで我々は,AVコントローラのトレーニングにAPG(analytic Policy gradients)アプローチを適用可能なシミュレータを提案し,その設計を行う。
提案するフレームワークは, エージェントがより根底的なポリシーを学ぶのを助けるために, 環境力学の勾配を役立てる, エンド・ツー・エンドの訓練ループに, 微分可能シミュレータを組み込む。
ダイナミクスにおけるパフォーマンスとノイズに対する堅牢性の大幅な改善と、全体としてより直感的なヒューマンライクな処理が見られます。
論文 参考訳(メタデータ) (2024-09-12T11:50:06Z) - A Graph-based Adversarial Imitation Learning Framework for Reliable & Realtime Fleet Scheduling in Urban Air Mobility [5.19664437943693]
本稿では,艦隊スケジューリング問題の包括的最適化について述べる。
また、代替ソリューションのアプローチの必要性も認識している。
新しい模倣アプローチは、目に見えない最悪のシナリオにおいて、パフォーマンスと顕著な改善を実現する。
論文 参考訳(メタデータ) (2024-07-16T18:51:24Z) - DNN Partitioning, Task Offloading, and Resource Allocation in Dynamic Vehicular Networks: A Lyapunov-Guided Diffusion-Based Reinforcement Learning Approach [49.56404236394601]
本稿では,Vehicular Edge Computingにおける共同DNNパーティショニング,タスクオフロード,リソース割り当ての問題を定式化する。
我々の目標は、時間とともにシステムの安定性を保証しながら、DNNベースのタスク完了時間を最小化することである。
拡散モデルの革新的利用を取り入れたマルチエージェント拡散に基づく深層強化学習(MAD2RL)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-11T06:31:03Z) - UAV-enabled Collaborative Beamforming via Multi-Agent Deep Reinforcement Learning [79.16150966434299]
本稿では,UAVを用いた協調ビームフォーミング多目的最適化問題 (UCBMOP) を定式化し,UAVの伝送速度を最大化し,全UAVのエネルギー消費を最小化する。
ヘテロジニアス・エージェント・信頼領域ポリシー最適化(HATRPO)を基本フレームワークとし,改良されたHATRPOアルゴリズム,すなわちHATRPO-UCBを提案する。
論文 参考訳(メタデータ) (2024-04-11T03:19:22Z) - Fractional Deep Reinforcement Learning for Age-Minimal Mobile Edge
Computing [11.403989519949173]
本研究は,AOI( Age-of-Information)によって測定された計算集約更新の時系列に焦点をあてる。
我々は,AoIのタスク更新とオフロードポリシを分断形式で共同で最適化する方法について検討する。
実験の結果,提案アルゴリズムは,いくつかの非フラクタルベンチマークと比較して平均AoIを57.6%削減できることがわかった。
論文 参考訳(メタデータ) (2023-12-16T11:13:40Z) - Multi-Objective Optimization for UAV Swarm-Assisted IoT with Virtual
Antenna Arrays [55.736718475856726]
無人航空機(UAV)ネットワークはIoT(Internet-of-Things)を支援するための有望な技術である
既存のUAV支援データ収集および普及スキームでは、UAVはIoTとアクセスポイントの間を頻繁に飛行する必要がある。
協調ビームフォーミングをIoTとUAVに同時に導入し、エネルギーと時間効率のデータ収集と普及を実現した。
論文 参考訳(メタデータ) (2023-08-03T02:49:50Z) - DL-DRL: A double-level deep reinforcement learning approach for
large-scale task scheduling of multi-UAV [65.07776277630228]
分割・征服フレームワーク(DCF)に基づく二重レベル深層強化学習(DL-DRL)手法を提案する。
特に,上層部DRLモデルにおけるエンコーダ・デコーダ構成ポリシネットワークを設計し,タスクを異なるUAVに割り当てる。
また、低レベルDRLモデルにおける別の注意に基づくポリシーネットワークを利用して、各UAVの経路を構築し、実行されたタスク数を最大化する。
論文 参考訳(メタデータ) (2022-08-04T04:35:53Z) - Enhanced Teaching-Learning-based Optimization for 3D Path Planning of
Multicopter UAVs [2.0305676256390934]
本稿では,無人航空機(UAV)の新しい経路計画アルゴリズムを提案する。
まず,UAVの移動と安全操作の制約と経路長の要件を組み込んだ目的関数を定義する。
次に, 目的関数の定式化を最小化するために, Multi-subject TLBO というアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-05-31T16:00:32Z) - Accelerated Policy Learning with Parallel Differentiable Simulation [59.665651562534755]
微分可能シミュレータと新しいポリシー学習アルゴリズム(SHAC)を提案する。
本アルゴリズムは,スムーズな批判機能により局所最小化の問題を軽減する。
現状のRLと微分可能なシミュレーションベースアルゴリズムと比較して,サンプル効率と壁面時間を大幅に改善した。
論文 参考訳(メタデータ) (2022-04-14T17:46:26Z) - Offloading Optimization in Edge Computing for Deep Learning Enabled
Target Tracking by Internet-of-UAVs [22.143742665920573]
無人航空機(UAV)は標的追跡などの情報提供に広く利用されている。
プレトレーニングされた畳み込みニューラルネットワーク(CNN)がUAVに展開され、キャプチャされたビデオフレームからターゲットを特定する。
この種の視覚目標追跡は、所望の高推論精度と厳格な遅延要求のため、多くの計算資源を必要とする。
これは、このようなディープラーニング(DL)タスクをモバイルエッジコンピューティング(MEC)サーバにオフロードすることを検討する動機となります。
論文 参考訳(メタデータ) (2020-08-18T16:00:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。