Fugu-MT 論文翻訳(概要): Evaluating the Perceived Safety of Urban City via Maximum Entropy Deep Inverse Reinforcement Learning

論文の概要: Evaluating the Perceived Safety of Urban City via Maximum Entropy Deep Inverse Reinforcement Learning

arxiv url: http://arxiv.org/abs/2211.10660v1
Date: Sat, 19 Nov 2022 11:01:08 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-22 18:20:38.862332
Title: Evaluating the Perceived Safety of Urban City via Maximum Entropy Deep Inverse Reinforcement Learning
Title（参考訳）: 最大エントロピー深部逆強化学習による都市の安全感の評価
Authors: Yaxuan Wang, Zhixin Zeng, Qijun Zhao
Abstract要約: 都市安全を予測し、対応する報酬関数を回復するための逆強化学習(IRL)ベースのフレームワーク。我々は,予測問題をマルコフ決定過程(MDP)としてモデル化するスケーラブルな状態表現法を提案し,その問題を解決するために強化学習(RL)を用いた。われわれは、クラウドソーシングデータ収集サイトと本論文で提案したモデルについて、後にオープンソース化する。
参考スコア（独自算出の注目度）: 10.605168966435981
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Inspired by expert evaluation policy for urban perception, we proposed a novel inverse reinforcement learning (IRL) based framework for predicting urban safety and recovering the corresponding reward function. We also presented a scalable state representation method to model the prediction problem as a Markov decision process (MDP) and use reinforcement learning (RL) to solve the problem. Additionally, we built a dataset called SmallCity based on the crowdsourcing method to conduct the research. As far as we know, this is the first time the IRL approach has been introduced to the urban safety perception and planning field to help experts quantitatively analyze perceptual features. Our results showed that IRL has promising prospects in this field. We will later open-source the crowdsourcing data collection site and the model proposed in this paper.
Abstract（参考訳）: 都市感に対する専門家評価政策に触発されて,都市安全を予測し,それに対応する報酬関数を回復するための新しい逆強化学習(IRL)フレームワークを提案した。また,予測問題をマルコフ決定過程(mdp)としてモデル化するスケーラブルな状態表現法を提案し,その解法として強化学習(rl)を用いた。さらに,クラウドソーシング手法に基づくsmallcityというデータセットを構築し,研究を行った。私たちが知る限り、専門家が知覚的特徴を定量的に分析するために、都市安全の認識と計画分野にIRLアプローチが導入されたのはこれが初めてです。その結果、IRLはこの分野で有望な見通しを示した。クラウドソーシングデータ収集サイトと本論文で提案したモデルについて,後にオープンソース化する。

関連論文リスト

Urban-R1: Reinforced MLLMs Mitigate Geospatial Biases for Urban General Intelligence [64.36291202666212]
アーバン・ジェネラル・インテリジェンス(UGI)とは、複雑な都市環境を理解し、推論できるAIシステムである。近年, LLM と MLLM の教師付き微調整 (SFT) を用いた都市基盤モデルの構築が進められている。 MLLMをUGIの目的と整合させる強化学習に基づくポストトレーニングフレームワークであるUrban-R1を提案する。
論文参考訳（メタデータ） (2025-10-18T15:59:09Z)
Saffron-1: Safety Inference Scaling [69.61130284742353]
SAFFRONは、安全保証のために明示的に調整された、新しい推論スケーリングパラダイムである。我々のアプローチの中心は、要求される報酬モデルの評価を著しく削減する乗算報酬モデル(MRM)の導入である。トレーニング済みの多機能報酬モデル(Saffron-1)とそれに伴うトークンレベルの安全報酬データセット(Safety4M)を公開します。
論文参考訳（メタデータ） (2025-06-06T18:05:45Z)
From Street Views to Urban Science: Discovering Road Safety Factors with Multimodal Large Language Models [18.69630838520861]
都市・交通研究は長い間、重要な変数と道路安全のような社会的結果の間の統計的に意味のある関係を明らかにすることを模索してきた。解釈可能な仮説推論のためのマルチモーダル大言語モデル(MLLM)に基づくアプローチを提案する。
論文参考訳（メタデータ） (2025-06-02T20:40:56Z)
Risk Analysis and Design Against Adversarial Actions [1.9573380763700716]
本稿では,多種多様なタイプや強度の攻撃に対するモデルの堅牢性を評価するための,多種多様で先進的なフレームワークを提案する。その結果、追加のテストデータを必要としないモデル脆弱性の評価が可能になり、配布不要のセットアップで運用される。
論文参考訳（メタデータ） (2025-05-02T09:16:44Z)
The Urban Impact of AI: Modeling Feedback Loops in Next-Venue Recommendation [1.4467930374568725]
次世代のレコメンデータシステムは、ロケーションベースのサービスにますます組み込まれている。我々は,次世代の勧告を支える人間とAIのフィードバックループをモデル化するためのシミュレーションフレームワークを提案する。当社のフレームワークは,次回の勧告でフィードバックループを運用し,AI支援モビリティの社会的影響を評価するための新たなレンズを提供する。
論文参考訳（メタデータ） (2025-04-10T17:15:50Z)
Representation-based Reward Modeling for Efficient Safety Alignment of Large Language Model [84.00480999255628]
大規模言語モデル(LLM)の安全性アライメントのための強化学習アルゴリズムは,分散シフトの課題に直面している。現在のアプローチでは、ターゲットポリシーからのオンラインサンプリングを通じてこの問題に対処するのが一般的である。モデル固有の安全判断能力を活用して報酬信号を抽出する新しいフレームワークを提案する。
論文参考訳（メタデータ） (2025-03-13T06:40:34Z)
Out-of-Distribution Recovery with Object-Centric Keypoint Inverse Policy for Visuomotor Imitation Learning [2.6696199945489534]
本稿では,自覚的政策学習におけるOCR(object-centric recovery)フレームワークを提案し,アウト・オブ・ディストリビューション(OOD)シナリオの課題に対処する。連続学習のためのデモンストレーションを自律的に収集するOCRの能力を示す。
論文参考訳（メタデータ） (2024-11-05T17:41:14Z)
Revolutionizing Urban Safety Perception Assessments: Integrating Multimodal Large Language Models with Street View Images [5.799322786332704]
都市の安全知覚を測定することは、伝統的に人的資源に大きく依存する重要かつ複雑な作業である。マルチモーダル大規模言語モデル(MLLM)の最近の進歩は、強力な推論と分析能力を示している。都市全体の安全指標を迅速に評価するための,CLIP機能とK-Nearest Neighbors(K-NN)検索に基づく手法を提案する。
論文参考訳（メタデータ） (2024-07-29T06:03:13Z)
Offline Imitation Learning with Model-based Reverse Augmentation [48.64791438847236]
本稿では,自己ペースの逆拡張によるオフラインImitation Learningという,新しいモデルベースフレームワークを提案する。具体的には、オフラインのデモからリバース・ダイナミック・モデルを構築し、専門家が観察した状態につながる軌道を効率的に生成する。後続の強化学習法を用いて,拡張軌道から学習し,未観測状態から未観測状態へ移行する。
論文参考訳（メタデータ） (2024-06-18T12:27:02Z)
Defending against Data Poisoning Attacks in Federated Learning via User Elimination [0.0]
本稿では,フェデレーションモデルにおける敵ユーザの戦略的排除に焦点を当てた,新たなフレームワークを提案する。我々は、ローカルトレーニングインスタンスが収集したメタデータと差分プライバシー技術を統合することにより、フェデレートアルゴリズムのアグリゲーションフェーズにおける異常を検出する。提案手法の有効性を実証し,ユーザのプライバシとモデル性能を維持しながらデータ汚染のリスクを大幅に軽減する。
論文参考訳（メタデータ） (2024-04-19T10:36:00Z)
Enhanced Urban Region Profiling with Adversarial Self-Supervised Learning for Robust Forecasting and Security [12.8405655328298]
既存のメソッドは、ノイズ、データ不完全性、セキュリティ脆弱性といった問題に悩まされることが多い。本稿では,EUPAS(Adversarial Self-Supervised Learning)を用いた都市域プロファイリング手法を提案する。 EUPASは、犯罪予測、チェックイン予測、土地利用分類などの様々な予測タスクにおいて、堅牢なパフォーマンスを保証する。
論文参考訳（メタデータ） (2024-02-02T06:06:45Z)
A graph-based multimodal framework to predict gentrification [4.429604861456339]
本稿では,トラクタと必須施設の都市ネットワークに基づくジェントリフィケーションを予測するための,グラフに基づくマルチモーダル深層学習フレームワークを提案する。シカゴ、ニューヨーク、ロサンゼルスのデータを使って提案されたフレームワークをトレーニングし、テストする。このモデルは平均0.9倍の精度で国勢調査水準のジェントリフィケーションを予測できる。
論文参考訳（メタデータ） (2023-12-25T08:20:50Z)
Sample Complexity of Preference-Based Nonparametric Off-Policy Evaluation with Deep Networks [58.469818546042696]
我々は、OPEのサンプル効率を人間の好みで研究し、その統計的保証を確立する。 ReLUネットワークのサイズを適切に選択することにより、マルコフ決定過程において任意の低次元多様体構造を活用できることが示される。
論文参考訳（メタデータ） (2023-10-16T16:27:06Z)
A Bayesian Approach to Robust Inverse Reinforcement Learning [54.24816623644148]
我々は、オフラインモデルに基づく逆強化学習(IRL)に対するベイズ的アプローチを考える。提案フレームワークは,専門家の報酬関数と環境力学の主観的モデルとを同時推定することにより,既存のオフラインモデルベースIRLアプローチとは異なる。本分析は, 専門家が環境の高精度なモデルを持つと考えられる場合, 評価政策が堅牢な性能を示すという新たな知見を提示する。
論文参考訳（メタデータ） (2023-09-15T17:37:09Z)
Semi-supervised Learning from Street-View Images and OpenStreetMap for Automatic Building Height Estimation [59.6553058160943]
本稿では,Mapillary SVIとOpenStreetMapのデータから建物の高さを自動的に推定する半教師付き学習(SSL)手法を提案する。提案手法は, 平均絶対誤差(MAE)が約2.1mである建物の高さを推定する上で, 明らかな性能向上につながる。予備結果は,低コストなVGIデータに基づく提案手法のスケールアップに向けた今後の取り組みを期待し,動機づけるものである。
論文参考訳（メタデータ） (2023-07-05T18:16:30Z)
Massively Scalable Inverse Reinforcement Learning in Google Maps [3.1244966374281544]
逆強化学習は、ルートレコメンデーションにおいて人間の潜在的嗜好を学習するための強力で一般的な枠組みを提供する。数億の州と実証軌道で惑星規模の問題に対処したアプローチはない。我々は、ルーティングコンテキストにおける古典的IRL手法を再検討し、安価で決定論的プランナーと高価で堅牢なポリシーとの間にトレードオフがあることを重要視する。 Receding Horizon Inverse Planning (RHIP)は、従来のIRLアルゴリズムの新たな一般化であり、その計画的地平を通したパフォーマンストレードオフのきめ細かい制御を提供する。
論文参考訳（メタデータ） (2023-05-18T20:14:28Z)
When Demonstrations Meet Generative World Models: A Maximum Likelihood Framework for Offline Inverse Reinforcement Learning [62.00672284480755]
本稿では, 専門家エージェントから, 一定の有限個の実演において観測された動作を過小評価する報酬と環境力学の構造を復元することを目的とする。タスクを実行するための正確な専門知識モデルは、臨床的意思決定や自律運転のような安全に敏感な応用に応用できる。
論文参考訳（メタデータ） (2023-02-15T04:14:20Z)
A Novel CNN-LSTM-based Approach to Predict Urban Expansion [1.2233362977312943]
時系列リモートセンシングデータは、幅広いアプリケーションで使用できる豊富な情報ソースを提供します。本稿では,時系列衛星画像を用いた都市拡大予測の課題について論じる。都市の拡大を予測するためのセマンティックイメージ分割に基づく新しい2ステップアプローチを提案する。
論文参考訳（メタデータ） (2021-03-02T12:58:05Z)
SAMBA: Safe Model-Based & Active Reinforcement Learning [59.01424351231993]
SAMBAは、確率論的モデリング、情報理論、統計学といった側面を組み合わせた安全な強化学習のためのフレームワークである。我々は,低次元および高次元の状態表現を含む安全な力学系ベンチマークを用いて,アルゴリズムの評価を行った。アクティブなメトリクスと安全性の制約を詳細に分析することで,フレームワークの有効性を直感的に評価する。
論文参考訳（メタデータ） (2020-06-12T10:40:46Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。