論文の概要: Scheduling for Urban Air Mobility using Safe Learning
- arxiv url: http://arxiv.org/abs/2209.15457v1
- Date: Wed, 28 Sep 2022 12:23:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-03 14:40:21.380939
- Title: Scheduling for Urban Air Mobility using Safe Learning
- Title(参考訳): 安全学習による都市エアモビリティのスケジューリング
- Authors: Surya Murthy (University of Illinois, Urbana-Champaign), Natasha A.
Neogi (NASA Langley Research Center), Suda Bharadwaj (Skygrid, Inc.)
- Abstract要約: 本研究は,UAM(Urban Air Mobility)車両が,ハードトラベルとソフトトリップの両期限で走行する際のスケジュール問題について考察する。
オンラインで安全なスケジューラが開発され、ハードな期限が見逃されないようにし、ソフトな期限を欠く平均コストを最小限に抑える。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This work considers the scheduling problem for Urban Air Mobility (UAM)
vehicles travelling between origin-destination pairs with both hard and soft
trip deadlines. Each route is described by a discrete probability distribution
over trip completion times (or delay) and over inter-arrival times of requests
(or demand) for the route along with a fixed hard or soft deadline. Soft
deadlines carry a cost that is incurred when the deadline is missed. An online,
safe scheduler is developed that ensures that hard deadlines are never missed,
and that average cost of missing soft deadlines is minimized. The system is
modelled as a Markov Decision Process (MDP) and safe model-based learning is
used to find the probabilistic distributions over route delays and demand.
Monte Carlo Tree Search (MCTS) Earliest Deadline First (EDF) is used to safely
explore the learned models in an online fashion and develop a near-optimal
non-preemptive scheduling policy. These results are compared with Value
Iteration (VI) and MCTS (Random) scheduling solutions.
- Abstract(参考訳): 本研究は, ハードトリップとソフトトリップの双方で走行する都市エアモビリティ (uam) 車両のスケジューリング問題を検討するものである。
各経路は、旅行完了時間(または遅延)と、固定されたハードまたはソフトの期限とともに、経路の地域間要求(または需要)の確率分布によって記述される。
ソフトな期限には、期限がずれたときに発生するコストが伴う。
オンラインの安全なスケジューラが開発され、ハードデッドラインが見逃されないようにし、ソフトデッドラインが失われる平均コストが最小になる。
システムはマルコフ決定プロセス(MDP)としてモデル化され、経路遅延や需要に対する確率分布の探索に安全なモデルベース学習が使用される。
Monte Carlo Tree Search (MCTS) Earl Most Deadline First (EDF) は、学習したモデルをオンラインで安全に探索し、ほぼ最適に近い非プリエンプティブなスケジューリングポリシーを開発するために使用される。
これらの結果は、値反復(VI)とMCTS(Random)スケジューリングソリューションと比較される。
関連論文リスト
- Truncating Trajectories in Monte Carlo Policy Evaluation: an Adaptive Approach [51.76826149868971]
モンテカルロシミュレーションによる政策評価は多くのMC強化学習(RL)アルゴリズムの中核にある。
本研究では,異なる長さの軌跡を用いた回帰推定器の平均二乗誤差のサロゲートとして品質指標を提案する。
本稿では,Robust and Iterative Data Collection Strategy Optimization (RIDO) という適応アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-17T11:47:56Z) - Physics-guided Active Sample Reweighting for Urban Flow Prediction [75.24539704456791]
都市フロー予測は、バス、タクシー、ライド駆動モデルといった交通サービスのスループットを見積もる、微妙な時間的モデリングである。
最近の予測解は、物理学誘導機械学習(PGML)の概念による改善をもたらす。
我々は、PN(atized Physics-guided Network)を開発し、P-GASR(Physical-guided Active Sample Reweighting)を提案する。
論文 参考訳(メタデータ) (2024-07-18T15:44:23Z) - Learning to Schedule Online Tasks with Bandit Feedback [7.671139712158846]
オンラインタスクスケジューリングは、クラウドコンピューティングやクラウドソーシングにおけるタスク集約型アプリケーションにおいて重要な役割を果たす。
本稿では,二重最適化学習に基づくRobins-Monro(DOL-RM)アルゴリズムを提案する。
DOL-RMは、報酬対コスト比の楽観的な推定と決定モジュールを組み込んだ学習モジュールを統合する。
論文 参考訳(メタデータ) (2024-02-26T10:11:28Z) - Optimal Chaining of Vehicle Plans with Time Windows [0.0]
本研究は,時間ウィンドウで許容される遅延を考慮した新しい計画連鎖定式化と解法を提案する。
静的ダイヤル・ア・ライド問題を解くための新しい車両ディスパッチ手法を提案する。
論文 参考訳(メタデータ) (2024-01-05T16:04:55Z) - Towards Robust Continual Learning with Bayesian Adaptive Moment Regularization [51.34904967046097]
継続的な学習は、モデルが以前に学習した情報を忘れてしまう破滅的な忘れ込みの課題を克服しようとする。
本稿では,パラメータ成長の制約を緩和し,破滅的な忘れを減らし,新しい事前手法を提案する。
以上の結果から, BAdamは, 単頭クラスインクリメンタル実験に挑戦する先行手法に対して, 最先端の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2023-09-15T17:10:51Z) - Deep reinforcement learning for the dynamic vehicle dispatching problem:
An event-based approach [0.0]
この問題を半マルコフ決定プロセスとしてモデル化することで、時間を連続的に扱うことができます。
イベントベースのアプローチは決定空間の複雑さを大幅に減らし、離散時間モデルの他の制限を克服する、と我々は主張する。
その結果、我々の政策は平均待ち時間、キャンセル率、サービス全体の時間に優れており、他のテスト済みのポリシーと比較して最大50%の削減が期待できることがわかった。
論文 参考訳(メタデータ) (2023-07-13T16:29:25Z) - A generalized network level disruption strategy selection model for
urban public transport systems [16.64085440434604]
ディスラプションからの迅速な回復は、トランジットシステムの信頼性にとって極めて重要である。
本研究は, 交通破壊対策を包括的かつ階層的に実施する試みである。
論文 参考訳(メタデータ) (2023-05-07T16:34:25Z) - Machine learning framework for end-to-end implementation of Incident
duration prediction [0.0]
本研究では,インシデントレポートの受信時に利用可能な情報に基づいて,インシデント時間を予測するための分析フレームワークとエンドツーエンド機械学習ソリューションを開発した。
その結果, 従来の研究手法と比較して, 事故発生期間の予測は有意に改善した。
論文 参考訳(メタデータ) (2023-04-23T00:55:19Z) - Better than the Best: Gradient-based Improper Reinforcement Learning for
Network Scheduling [60.48359567964899]
パケット遅延を最小限に抑えるため,制約付き待ち行列ネットワークにおけるスケジューリングの問題を考える。
我々は、利用可能な原子ポリシーよりも優れたスケジューラを生成するポリシー勾配に基づく強化学習アルゴリズムを使用する。
論文 参考訳(メタデータ) (2021-05-01T10:18:34Z) - Modular Deep Reinforcement Learning for Continuous Motion Planning with
Temporal Logic [59.94347858883343]
本稿では,マルコフ決定過程(MDP)をモデルとした自律動的システムの運動計画について検討する。
LDGBA と MDP の間に組込み製品 MDP (EP-MDP) を設計することである。
モデルフリー強化学習(RL)のためのLDGBAベースの報酬形成と割引スキームは、EP-MDP状態にのみ依存する。
論文 参考訳(メタデータ) (2021-02-24T01:11:25Z) - FMA-ETA: Estimating Travel Time Entirely Based on FFN With Attention [88.33372574562824]
フィードフォワードネットワーク(FFN, FFN, 複数要素自己認識(FMA-ETA)に基づく新しいフレームワークを提案する。
異なるカテゴリの特徴に対処し,情報を意図的に集約する,新しい多要素自己認識機構を提案する。
実験の結果、FMA-ETAは予測精度において最先端の手法と競合し、推論速度は大幅に向上した。
論文 参考訳(メタデータ) (2020-06-07T08:10:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。