論文の概要: Evaluating the Perceived Safety of Urban City via Maximum Entropy Deep
Inverse Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2211.10660v1
- Date: Sat, 19 Nov 2022 11:01:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-22 18:20:38.862332
- Title: Evaluating the Perceived Safety of Urban City via Maximum Entropy Deep
Inverse Reinforcement Learning
- Title(参考訳): 最大エントロピー深部逆強化学習による都市の安全感の評価
- Authors: Yaxuan Wang, Zhixin Zeng, Qijun Zhao
- Abstract要約: 都市安全を予測し、対応する報酬関数を回復するための逆強化学習(IRL)ベースのフレームワーク。
我々は,予測問題をマルコフ決定過程(MDP)としてモデル化するスケーラブルな状態表現法を提案し,その問題を解決するために強化学習(RL)を用いた。
われわれは、クラウドソーシングデータ収集サイトと本論文で提案したモデルについて、後にオープンソース化する。
- 参考スコア(独自算出の注目度): 10.605168966435981
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Inspired by expert evaluation policy for urban perception, we proposed a
novel inverse reinforcement learning (IRL) based framework for predicting urban
safety and recovering the corresponding reward function. We also presented a
scalable state representation method to model the prediction problem as a
Markov decision process (MDP) and use reinforcement learning (RL) to solve the
problem. Additionally, we built a dataset called SmallCity based on the
crowdsourcing method to conduct the research. As far as we know, this is the
first time the IRL approach has been introduced to the urban safety perception
and planning field to help experts quantitatively analyze perceptual features.
Our results showed that IRL has promising prospects in this field. We will
later open-source the crowdsourcing data collection site and the model proposed
in this paper.
- Abstract(参考訳): 都市感に対する専門家評価政策に触発されて,都市安全を予測し,それに対応する報酬関数を回復するための新しい逆強化学習(IRL)フレームワークを提案した。
また,予測問題をマルコフ決定過程(mdp)としてモデル化するスケーラブルな状態表現法を提案し,その解法として強化学習(rl)を用いた。
さらに,クラウドソーシング手法に基づくsmallcityというデータセットを構築し,研究を行った。
私たちが知る限り、専門家が知覚的特徴を定量的に分析するために、都市安全の認識と計画分野にIRLアプローチが導入されたのはこれが初めてです。
その結果、IRLはこの分野で有望な見通しを示した。
クラウドソーシングデータ収集サイトと本論文で提案したモデルについて,後にオープンソース化する。
関連論文リスト
- A graph-based multimodal framework to predict gentrification [4.429604861456339]
本稿では,トラクタと必須施設の都市ネットワークに基づくジェントリフィケーションを予測するための,グラフに基づくマルチモーダル深層学習フレームワークを提案する。
シカゴ、ニューヨーク、ロサンゼルスのデータを使って提案されたフレームワークをトレーニングし、テストする。
このモデルは平均0.9倍の精度で国勢調査水準のジェントリフィケーションを予測できる。
論文 参考訳(メタデータ) (2023-12-25T08:20:50Z) - Sample Complexity of Preference-Based Nonparametric Off-Policy
Evaluation with Deep Networks [58.469818546042696]
我々は、OPEのサンプル効率を人間の好みで研究し、その統計的保証を確立する。
ReLUネットワークのサイズを適切に選択することにより、マルコフ決定過程において任意の低次元多様体構造を活用できることが示される。
論文 参考訳(メタデータ) (2023-10-16T16:27:06Z) - A Bayesian Approach to Robust Inverse Reinforcement Learning [57.48221522174114]
我々は、オフラインモデルに基づく逆強化学習(IRL)に対するベイズ的アプローチを考える。
提案フレームワークは,専門家の報酬関数と環境力学の主観的モデルとを同時推定することにより,既存のオフラインモデルベースIRLアプローチとは異なる。
本分析は, 専門家が環境の高精度なモデルを持つと考えられる場合, 評価政策が堅牢な性能を示すという新たな知見を提示する。
論文 参考訳(メタデータ) (2023-09-15T17:37:09Z) - Semi-supervised Learning from Street-View Images and OpenStreetMap for
Automatic Building Height Estimation [59.6553058160943]
本稿では,Mapillary SVIとOpenStreetMapのデータから建物の高さを自動的に推定する半教師付き学習(SSL)手法を提案する。
提案手法は, 平均絶対誤差(MAE)が約2.1mである建物の高さを推定する上で, 明らかな性能向上につながる。
予備結果は,低コストなVGIデータに基づく提案手法のスケールアップに向けた今後の取り組みを期待し,動機づけるものである。
論文 参考訳(メタデータ) (2023-07-05T18:16:30Z) - Massively Scalable Inverse Reinforcement Learning in Google Maps [3.1244966374281544]
逆強化学習は、ルートレコメンデーションにおいて人間の潜在的嗜好を学習するための強力で一般的な枠組みを提供する。
数億の州と実証軌道で惑星規模の問題に対処したアプローチはない。
我々は、ルーティングコンテキストにおける古典的IRL手法を再検討し、安価で決定論的プランナーと高価で堅牢なポリシーとの間にトレードオフがあることを重要視する。
Receding Horizon Inverse Planning (RHIP)は、従来のIRLアルゴリズムの新たな一般化であり、その計画的地平を通したパフォーマンストレードオフのきめ細かい制御を提供する。
論文 参考訳(メタデータ) (2023-05-18T20:14:28Z) - When Demonstrations Meet Generative World Models: A Maximum Likelihood
Framework for Offline Inverse Reinforcement Learning [62.00672284480755]
本稿では, 専門家エージェントから, 一定の有限個の実演において観測された動作を過小評価する報酬と環境力学の構造を復元することを目的とする。
タスクを実行するための正確な専門知識モデルは、臨床的意思決定や自律運転のような安全に敏感な応用に応用できる。
論文 参考訳(メタデータ) (2023-02-15T04:14:20Z) - Detecting Neighborhood Gentrification at Scale via Street-level Visual
Data [13.43323482272063]
そこで本研究では,近隣住民の身体的外観に基づいて,近隣住民のジェントリフィケーションを大規模に検出する手法を提案する。
提案手法の有効性を,従来の文献やケーススタディのジェントリフィケーション手法と比較し,提案手法の有効性を示す。
論文 参考訳(メタデータ) (2023-01-04T22:52:29Z) - CPPF++: Uncertainty-Aware Sim2Real Object Pose Estimation by Vote
Aggregation [71.13049562721085]
CPPF++は、sim-to-realのポーズ推定のために設計されている。
カテゴリレベルのポーズ推定データセットであるDiversePose 300を提案する。
論文 参考訳(メタデータ) (2022-11-24T03:27:00Z) - A Novel CNN-LSTM-based Approach to Predict Urban Expansion [1.2233362977312943]
時系列リモートセンシングデータは、幅広いアプリケーションで使用できる豊富な情報ソースを提供します。
本稿では,時系列衛星画像を用いた都市拡大予測の課題について論じる。
都市の拡大を予測するためのセマンティックイメージ分割に基づく新しい2ステップアプローチを提案する。
論文 参考訳(メタデータ) (2021-03-02T12:58:05Z) - SAMBA: Safe Model-Based & Active Reinforcement Learning [59.01424351231993]
SAMBAは、確率論的モデリング、情報理論、統計学といった側面を組み合わせた安全な強化学習のためのフレームワークである。
我々は,低次元および高次元の状態表現を含む安全な力学系ベンチマークを用いて,アルゴリズムの評価を行った。
アクティブなメトリクスと安全性の制約を詳細に分析することで,フレームワークの有効性を直感的に評価する。
論文 参考訳(メタデータ) (2020-06-12T10:40:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。