論文の概要: Evaluating the Perceived Safety of Urban City via Maximum Entropy Deep
Inverse Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2211.10660v1
- Date: Sat, 19 Nov 2022 11:01:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-22 18:20:38.862332
- Title: Evaluating the Perceived Safety of Urban City via Maximum Entropy Deep
Inverse Reinforcement Learning
- Title(参考訳): 最大エントロピー深部逆強化学習による都市の安全感の評価
- Authors: Yaxuan Wang, Zhixin Zeng, Qijun Zhao
- Abstract要約: 都市安全を予測し、対応する報酬関数を回復するための逆強化学習(IRL)ベースのフレームワーク。
我々は,予測問題をマルコフ決定過程(MDP)としてモデル化するスケーラブルな状態表現法を提案し,その問題を解決するために強化学習(RL)を用いた。
われわれは、クラウドソーシングデータ収集サイトと本論文で提案したモデルについて、後にオープンソース化する。
- 参考スコア(独自算出の注目度): 10.605168966435981
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Inspired by expert evaluation policy for urban perception, we proposed a
novel inverse reinforcement learning (IRL) based framework for predicting urban
safety and recovering the corresponding reward function. We also presented a
scalable state representation method to model the prediction problem as a
Markov decision process (MDP) and use reinforcement learning (RL) to solve the
problem. Additionally, we built a dataset called SmallCity based on the
crowdsourcing method to conduct the research. As far as we know, this is the
first time the IRL approach has been introduced to the urban safety perception
and planning field to help experts quantitatively analyze perceptual features.
Our results showed that IRL has promising prospects in this field. We will
later open-source the crowdsourcing data collection site and the model proposed
in this paper.
- Abstract(参考訳): 都市感に対する専門家評価政策に触発されて,都市安全を予測し,それに対応する報酬関数を回復するための新しい逆強化学習(IRL)フレームワークを提案した。
また,予測問題をマルコフ決定過程(mdp)としてモデル化するスケーラブルな状態表現法を提案し,その解法として強化学習(rl)を用いた。
さらに,クラウドソーシング手法に基づくsmallcityというデータセットを構築し,研究を行った。
私たちが知る限り、専門家が知覚的特徴を定量的に分析するために、都市安全の認識と計画分野にIRLアプローチが導入されたのはこれが初めてです。
その結果、IRLはこの分野で有望な見通しを示した。
クラウドソーシングデータ収集サイトと本論文で提案したモデルについて,後にオープンソース化する。
関連論文リスト
- Revolutionizing Urban Safety Perception Assessments: Integrating Multimodal Large Language Models with Street View Images [5.799322786332704]
都市の安全知覚を測定することは、伝統的に人的資源に大きく依存する重要かつ複雑な作業である。
マルチモーダル大規模言語モデル(MLLM)の最近の進歩は、強力な推論と分析能力を示している。
都市全体の安全指標を迅速に評価するための,CLIP機能とK-Nearest Neighbors(K-NN)検索に基づく手法を提案する。
論文 参考訳(メタデータ) (2024-07-29T06:03:13Z) - Offline Imitation Learning with Model-based Reverse Augmentation [48.64791438847236]
本稿では,自己ペースの逆拡張によるオフラインImitation Learningという,新しいモデルベースフレームワークを提案する。
具体的には、オフラインのデモからリバース・ダイナミック・モデルを構築し、専門家が観察した状態につながる軌道を効率的に生成する。
後続の強化学習法を用いて,拡張軌道から学習し,未観測状態から未観測状態へ移行する。
論文 参考訳(メタデータ) (2024-06-18T12:27:02Z) - Defending against Data Poisoning Attacks in Federated Learning via User Elimination [0.0]
本稿では,フェデレーションモデルにおける敵ユーザの戦略的排除に焦点を当てた,新たなフレームワークを提案する。
我々は、ローカルトレーニングインスタンスが収集したメタデータと差分プライバシー技術を統合することにより、フェデレートアルゴリズムのアグリゲーションフェーズにおける異常を検出する。
提案手法の有効性を実証し,ユーザのプライバシとモデル性能を維持しながらデータ汚染のリスクを大幅に軽減する。
論文 参考訳(メタデータ) (2024-04-19T10:36:00Z) - A graph-based multimodal framework to predict gentrification [4.429604861456339]
本稿では,トラクタと必須施設の都市ネットワークに基づくジェントリフィケーションを予測するための,グラフに基づくマルチモーダル深層学習フレームワークを提案する。
シカゴ、ニューヨーク、ロサンゼルスのデータを使って提案されたフレームワークをトレーニングし、テストする。
このモデルは平均0.9倍の精度で国勢調査水準のジェントリフィケーションを予測できる。
論文 参考訳(メタデータ) (2023-12-25T08:20:50Z) - Sample Complexity of Preference-Based Nonparametric Off-Policy
Evaluation with Deep Networks [58.469818546042696]
我々は、OPEのサンプル効率を人間の好みで研究し、その統計的保証を確立する。
ReLUネットワークのサイズを適切に選択することにより、マルコフ決定過程において任意の低次元多様体構造を活用できることが示される。
論文 参考訳(メタデータ) (2023-10-16T16:27:06Z) - A Bayesian Approach to Robust Inverse Reinforcement Learning [54.24816623644148]
我々は、オフラインモデルに基づく逆強化学習(IRL)に対するベイズ的アプローチを考える。
提案フレームワークは,専門家の報酬関数と環境力学の主観的モデルとを同時推定することにより,既存のオフラインモデルベースIRLアプローチとは異なる。
本分析は, 専門家が環境の高精度なモデルを持つと考えられる場合, 評価政策が堅牢な性能を示すという新たな知見を提示する。
論文 参考訳(メタデータ) (2023-09-15T17:37:09Z) - Semi-supervised Learning from Street-View Images and OpenStreetMap for
Automatic Building Height Estimation [59.6553058160943]
本稿では,Mapillary SVIとOpenStreetMapのデータから建物の高さを自動的に推定する半教師付き学習(SSL)手法を提案する。
提案手法は, 平均絶対誤差(MAE)が約2.1mである建物の高さを推定する上で, 明らかな性能向上につながる。
予備結果は,低コストなVGIデータに基づく提案手法のスケールアップに向けた今後の取り組みを期待し,動機づけるものである。
論文 参考訳(メタデータ) (2023-07-05T18:16:30Z) - Massively Scalable Inverse Reinforcement Learning in Google Maps [3.1244966374281544]
逆強化学習は、ルートレコメンデーションにおいて人間の潜在的嗜好を学習するための強力で一般的な枠組みを提供する。
数億の州と実証軌道で惑星規模の問題に対処したアプローチはない。
我々は、ルーティングコンテキストにおける古典的IRL手法を再検討し、安価で決定論的プランナーと高価で堅牢なポリシーとの間にトレードオフがあることを重要視する。
Receding Horizon Inverse Planning (RHIP)は、従来のIRLアルゴリズムの新たな一般化であり、その計画的地平を通したパフォーマンストレードオフのきめ細かい制御を提供する。
論文 参考訳(メタデータ) (2023-05-18T20:14:28Z) - When Demonstrations Meet Generative World Models: A Maximum Likelihood
Framework for Offline Inverse Reinforcement Learning [62.00672284480755]
本稿では, 専門家エージェントから, 一定の有限個の実演において観測された動作を過小評価する報酬と環境力学の構造を復元することを目的とする。
タスクを実行するための正確な専門知識モデルは、臨床的意思決定や自律運転のような安全に敏感な応用に応用できる。
論文 参考訳(メタデータ) (2023-02-15T04:14:20Z) - A Novel CNN-LSTM-based Approach to Predict Urban Expansion [1.2233362977312943]
時系列リモートセンシングデータは、幅広いアプリケーションで使用できる豊富な情報ソースを提供します。
本稿では,時系列衛星画像を用いた都市拡大予測の課題について論じる。
都市の拡大を予測するためのセマンティックイメージ分割に基づく新しい2ステップアプローチを提案する。
論文 参考訳(メタデータ) (2021-03-02T12:58:05Z) - SAMBA: Safe Model-Based & Active Reinforcement Learning [59.01424351231993]
SAMBAは、確率論的モデリング、情報理論、統計学といった側面を組み合わせた安全な強化学習のためのフレームワークである。
我々は,低次元および高次元の状態表現を含む安全な力学系ベンチマークを用いて,アルゴリズムの評価を行った。
アクティブなメトリクスと安全性の制約を詳細に分析することで,フレームワークの有効性を直感的に評価する。
論文 参考訳(メタデータ) (2020-06-12T10:40:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。