論文の概要: Spatial-Aware Deep Reinforcement Learning for the Traveling Officer
Problem
- arxiv url: http://arxiv.org/abs/2401.05969v1
- Date: Thu, 11 Jan 2024 15:16:20 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-12 13:56:30.104482
- Title: Spatial-Aware Deep Reinforcement Learning for the Traveling Officer
Problem
- Title(参考訳): 旅行者問題に対する空間認識型深層強化学習
- Authors: Niklas Strau{\ss}, Matthias Schubert
- Abstract要約: トラベルオフィサー問題(TOP)は、困難な最適化課題である。
TOPの最大の課題は駐車違反の動的な性質であり、しばらくするとランダムに現れて消えていく。
本稿では,TOPのための空間認識型深層強化学習手法SATOPを提案する。
- 参考スコア(独自算出の注目度): 2.8781483086625537
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The traveling officer problem (TOP) is a challenging stochastic optimization
task. In this problem, a parking officer is guided through a city equipped with
parking sensors to fine as many parking offenders as possible. A major
challenge in TOP is the dynamic nature of parking offenses, which randomly
appear and disappear after some time, regardless of whether they have been
fined. Thus, solutions need to dynamically adjust to currently fineable parking
offenses while also planning ahead to increase the likelihood that the officer
arrives during the offense taking place. Though various solutions exist, these
methods often struggle to take the implications of actions on the ability to
fine future parking violations into account. This paper proposes SATOP, a novel
spatial-aware deep reinforcement learning approach for TOP. Our novel state
encoder creates a representation of each action, leveraging the spatial
relationships between parking spots, the agent, and the action. Furthermore, we
propose a novel message-passing module for learning future inter-action
correlations in the given environment. Thus, the agent can estimate the
potential to fine further parking violations after executing an action. We
evaluate our method using an environment based on real-world data from
Melbourne. Our results show that SATOP consistently outperforms
state-of-the-art TOP agents and is able to fine up to 22% more parking
offenses.
- Abstract(参考訳): 旅行士官問題(TOP)は確率的最適化の課題である。
この問題では、駐車係が駐車センサを備えた街を通り、できるだけ多くの駐車違反者に罰金を科す。
TOPの大きな課題は駐車違反のダイナミックな性質であり、罰金が課されたかどうかに関わらず、しばらく後にランダムに現れて消える。
したがって、現在の駐車違反に対して動的に調整すると同時に、事故発生時に警官が到着する可能性を高めることも計画する必要がある。
様々な解決策が存在するが、これらの手法は将来の駐車違反を考慮に入れておく能力に対する行動の影響に苦慮することが多い。
本稿では,TOPのための空間認識型深層強化学習手法SATOPを提案する。
新しい状態エンコーダは,パーキングスポット,エージェント,アクション間の空間的関係を利用して,各アクションの表現を生成する。
さらに、与えられた環境における将来の相互作用相関を学習するための新しいメッセージパッシングモジュールを提案する。
これにより、エージェントは、アクションを実行した後、さらに駐車違反の可能性を推定することができる。
本手法はメルボルンの実世界データに基づく環境を用いて評価する。
その結果,SATOPは最先端のTOPエージェントを一貫して上回り,駐車違反を最大22%減らすことができることがわかった。
関連論文リスト
- GPT-Augmented Reinforcement Learning with Intelligent Control for Vehicle Dispatching [82.19172267487998]
GARLIC: GPT拡張強化学習のフレームワーク。
本稿では,GPT強化強化学習とインテリジェント制御のフレームワークであるGARLICについて紹介する。
論文 参考訳(メタデータ) (2024-08-19T08:23:38Z) - Smart Camera Parking System With Auto Parking Spot Detection [1.0512475026060208]
PakStaと呼ばれる新しい手法で駐車場の状態を自動識別する。
本手法はPakLocのオブジェクト検出器を用いて,ビデオフレーム内の駐車場の占有状況を同時に判定する。
提案手法がPKLotデータセットに与える影響は, 人的労働力の94.25%を大幅に削減する結果となった。
論文 参考訳(メタデータ) (2024-07-07T19:00:11Z) - Crowdsourced reviews reveal substantial disparities in public perceptions of parking [2.3034861262968453]
本研究は,全米の駐車場に対する一般の認識を調査するため,費用対効果が高く,広くアクセス可能なデータソースであるクラウドソースオンラインレビューを紹介した。
Google Mapsから得られた911のコアベース統計領域(CBSA)を対象に,駐車関連レビュー4,987,483件のPOI(1,129,460点)について検討した。
POI型とCBSA型にまたがるパーキング感の顕著な変化がみられ,レストランPOIは最もネガティブな傾向を示した。
論文 参考訳(メタデータ) (2024-07-06T15:17:17Z) - Multi-Agent Deep Reinforcement Learning for Dynamic Avatar Migration in
AIoT-enabled Vehicular Metaverses with Trajectory Prediction [70.9337170201739]
本稿では,その歴史データに基づいて,知的車両の将来の軌跡を予測するモデルを提案する。
提案アルゴリズムは,予測なしでアバタータスクの実行遅延を約25%削減できることを示す。
論文 参考訳(メタデータ) (2023-06-26T13:27:11Z) - SHINE: Deep Learning-Based Accessible Parking Management System [1.7109513360384465]
自家用車の増加により、障害者の駐車スペースが乱用されている。
従来のライセンスプレート認識(LPR)システムは、そのような問題にリアルタイムで対処する上で非効率であることが証明されている。
我々は,深層学習に基づく物体検出アルゴリズムを用いて車両を検知するシステム,Shineを提案する。
論文 参考訳(メタデータ) (2023-02-02T02:46:52Z) - Crowd-sensing Enhanced Parking Patrol using Sharing Bikes' Trajectories [20.705097835958245]
違法な自動車駐車は、大気汚染や交通事故につながる交通渋滞を引き起こすため、世界中の主要都市が直面する一般的な都市問題である。
Mobikeの巨大で高品質なシェアリングバイクは、ユビキタスで違法な駐車検知アプローチを設計するユニークな機会を提供する。
検出結果は、パトロールスケジュール、すなわち、違法な駐車リスクの高い地域へパトロール警官を派遣し、パトロール効率をさらに向上させることができる。
論文 参考訳(メタデータ) (2021-10-29T05:48:51Z) - Robust Reinforcement Learning Under Minimax Regret for Green Security [50.03819244940543]
グリーン・セキュリティ・ドメインは、密猟者、違法なロガー、違法な漁師の敵対行動の不確実さに直面してパトロールを計画する被告を特徴としている。
文献では検討されていないミニマックスの後悔基準に従って,グリーンセキュリティのための堅牢なシーケンシャルパトロール計画に着目する。
対戦行動のパラメータ値を制御するディフェンダーと自然のゲームとしてこの問題を定式化し,ロバストなポリシーを見つけるアルゴリズムMIRRORを設計する。
論文 参考訳(メタデータ) (2021-06-15T20:11:12Z) - MoParkeR : Multi-objective Parking Recommendation [5.970994932728028]
既存のパーキングレコメンデーションソリューションは主に、未使用のオプションのみに基づく駐車場の検索と提案に重点を置いている。
さらに重要なことは、これらの要因は時間とともに変化し、互いに衝突し、現在の駐車推奨システムによって生み出されるレコメンデーションは効果がない可能性がある。
我々は、様々な競合要因を同時に考慮したMoParkeRと呼ばれる多目的駐車場推薦エンジンを設計し、その解決策を提案する。
論文 参考訳(メタデータ) (2021-06-10T10:57:09Z) - Contingencies from Observations: Tractable Contingency Planning with
Learned Behavior Models [82.34305824719101]
人間は未来の出来事を正確に推論することで決定を下す素晴らしい能力を持っている。
本研究では,高次元のシーン観察からエンドツーエンドに学習する汎用コンテンシビリティプランナを開発する。
このモデルが行動観察から忍耐強くコンティンジェンシーを学習できることを示す。
論文 参考訳(メタデータ) (2021-04-21T14:30:20Z) - ParkPredict: Motion and Intent Prediction of Vehicles in Parking Lots [65.33650222396078]
我々は、駐車場環境を開発し、人間の駐車操作のデータセットを収集する。
本稿では,多モード長短期記憶(LSTM)予測モデルと畳み込みニューラルネットワークLSTM(CNN-LSTM)を物理ベースの拡張カルマンフィルタ(EKF)ベースラインと比較する。
以上の結果から,1) 意図をよく推定できる(LSTMとCNN-LSTMモデルによる約85% のトップ1精度と100% トップ3精度),2) 運転者の意図する駐車場所の知識が駐車軌跡の予測に大きく影響すること,3) 環境の意味的表現について考察した。
論文 参考訳(メタデータ) (2020-04-21T20:46:32Z) - Intelligent Roundabout Insertion using Deep Reinforcement Learning [68.8204255655161]
本稿では,多忙なラウンドアバウンドの入場を交渉できる演習計画モジュールを提案する。
提案されたモジュールは、トレーニングされたニューラルネットワークに基づいて、操作の全期間にわたって、ラウンドアバウンドに入るタイミングと方法を予測する。
論文 参考訳(メタデータ) (2020-01-03T11:16:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。