論文の概要: Urban Safety Perception Through the Lens of Large Multimodal Models: A Persona-based Approach
- arxiv url: http://arxiv.org/abs/2503.00610v1
- Date: Sat, 01 Mar 2025 20:34:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-05 19:25:51.863858
- Title: Urban Safety Perception Through the Lens of Large Multimodal Models: A Persona-based Approach
- Title(参考訳): 大規模マルチモーダルモデルのレンズによる都市安全の認識--ペルソナによるアプローチ
- Authors: Ciro Beneduce, Bruno Lepri, Massimiliano Luca,
- Abstract要約: 本研究では,Llava 1.6 7Bと呼ばれるLarge Multimodal Models(LMM)を,都市空間の安全知覚を評価する新しいアプローチとして紹介する。
このモデルの平均F1スコアは59.21%に達し、都市のシナリオを安全または安全でないものとして分類した。
ペルソナをベースとしたプロンプトを取り入れた結果,年齢,性別,国籍の社会デノグラフィーグループにおいて,安全性の認知に有意な変化が認められた。
- 参考スコア(独自算出の注目度): 4.315451628809687
- License:
- Abstract: Understanding how urban environments are perceived in terms of safety is crucial for urban planning and policymaking. Traditional methods like surveys are limited by high cost, required time, and scalability issues. To overcome these challenges, this study introduces Large Multimodal Models (LMMs), specifically Llava 1.6 7B, as a novel approach to assess safety perceptions of urban spaces using street-view images. In addition, the research investigated how this task is affected by different socio-demographic perspectives, simulated by the model through Persona-based prompts. Without additional fine-tuning, the model achieved an average F1-score of 59.21% in classifying urban scenarios as safe or unsafe, identifying three key drivers of perceived unsafety: isolation, physical decay, and urban infrastructural challenges. Moreover, incorporating Persona-based prompts revealed significant variations in safety perceptions across the socio-demographic groups of age, gender, and nationality. Elder and female Personas consistently perceive higher levels of unsafety than younger or male Personas. Similarly, nationality-specific differences were evident in the proportion of unsafe classifications ranging from 19.71% in Singapore to 40.15% in Botswana. Notably, the model's default configuration aligned most closely with a middle-aged, male Persona. These findings highlight the potential of LMMs as a scalable and cost-effective alternative to traditional methods for urban safety perceptions. While the sensitivity of these models to socio-demographic factors underscores the need for thoughtful deployment, their ability to provide nuanced perspectives makes them a promising tool for AI-driven urban planning.
- Abstract(参考訳): 安全の観点から都市環境がどのように認識されるかを理解することは、都市計画と政策立案に不可欠である。
調査のような従来の手法は、コスト、必要な時間、スケーラビリティの問題によって制限されています。
これらの課題を克服するために、街路ビュー画像を用いた都市空間の安全性知覚を評価する新しいアプローチとしてLlava 1.6 7Bと呼ばれるLMM(Large Multimodal Models)を導入する。
さらに,この課題が,ペルソナをベースとしたプロンプトを通じてモデルによってシミュレートされた,異なる社会デマトグラフィー的視点の影響について検討した。
追加の微調整なしに、このモデルは、都市のシナリオを安全または安全でないものとして分類し、孤立、物理的崩壊、都市インフラ上の課題という3つの重要要因を特定し、平均59.21%のF1スコアを達成した。
さらに、ペルソナをベースとしたプロンプトを取り入れたことにより、年齢、性別、国籍の社会デコグラフィーグループにおいて、安全性の認知に有意な変化が認められた。
高齢者や女性のペルソナは、若年者や男性のペルソナよりも安全でないことを常に認識している。
同様に、シンガポールの19.71%からボツワナの40.15%まで、安全でない分類の比率において、国籍固有の違いが明らかであった。
特に、モデルのデフォルト設定は、中年の男性ペルソナと最も密接に一致している。
これらの知見は,従来の都市安全認識手法に代わる,スケーラブルで費用効果の高い代替手段としてのLMMの可能性を強調した。
これらのモデルが社会デコグラフィー的要因に敏感であることは、思慮深い展開の必要性を浮き彫りにしている一方で、微妙な視点を提供する能力は、AI駆動の都市計画のための有望なツールである。
関連論文リスト
- Can't See the Forest for the Trees: Benchmarking Multimodal Safety Awareness for Multimodal LLMs [56.440345471966666]
MLLM(Multimodal Large Language Models)は、テキストと画像の両方を通して対話を可能にすることで、従来の言語モデルの能力を拡大した。
MMSafeAwareは,安全シナリオ29のMLLMを評価するために設計された,初の総合的マルチモーダル安全意識ベンチマークである。
MMSafeAwareには安全でないサブセットと安全でないサブセットの両方が含まれており、安全でないコンテンツを正しく識別するモデルの評価と、有用性を阻害する過敏性を回避することができる。
論文 参考訳(メタデータ) (2025-02-16T16:12:40Z) - New Emerged Security and Privacy of Pre-trained Model: a Survey and Outlook [54.24701201956833]
セキュリティとプライバシーの問題は、事前訓練されたモデルに対するユーザーの信頼を損なう。
現在の文献は、事前訓練されたモデルに対する攻撃と防御の明確な分類を欠いている。
この分類法は、攻撃と防御をNo-Change、Input-Change、Model-Changeアプローチに分類する。
論文 参考訳(メタデータ) (2024-11-12T10:15:33Z) - FFAA: Multimodal Large Language Model based Explainable Open-World Face Forgery Analysis Assistant [59.2438504610849]
FFAA: Face Forgery Analysis Assistant(MLLM)とMIDS(Multi-Awer Intelligent Decision System)について紹介する。
提案手法は,ユーザフレンドリで説明可能な結果を提供するだけでなく,従来の手法に比べて精度と堅牢性を大幅に向上させる。
論文 参考訳(メタデータ) (2024-08-19T15:15:20Z) - Revolutionizing Urban Safety Perception Assessments: Integrating Multimodal Large Language Models with Street View Images [5.799322786332704]
都市の安全知覚を測定することは、伝統的に人的資源に大きく依存する重要かつ複雑な作業である。
マルチモーダル大規模言語モデル(MLLM)の最近の進歩は、強力な推論と分析能力を示している。
都市全体の安全指標を迅速に評価するための,CLIP機能とK-Nearest Neighbors(K-NN)検索に基づく手法を提案する。
論文 参考訳(メタデータ) (2024-07-29T06:03:13Z) - Is it safe to cross? Interpretable Risk Assessment with GPT-4V for Safety-Aware Street Crossing [8.468153670795443]
本稿では,大規模なマルチモーダルモデル(LMM)を活用し,複雑な交差点シーンを解釈する革新的な手法を提案する。
安全スコアとシーン記述を自然言語で生成することにより,視覚障害者の安全意思決定を支援する。
論文 参考訳(メタデータ) (2024-02-09T21:37:13Z) - Enhanced Urban Region Profiling with Adversarial Self-Supervised Learning for Robust Forecasting and Security [12.8405655328298]
既存のメソッドは、ノイズ、データ不完全性、セキュリティ脆弱性といった問題に悩まされることが多い。
本稿では,EUPAS(Adversarial Self-Supervised Learning)を用いた都市域プロファイリング手法を提案する。
EUPASは、犯罪予測、チェックイン予測、土地利用分類などの様々な予測タスクにおいて、堅牢なパフォーマンスを保証する。
論文 参考訳(メタデータ) (2024-02-02T06:06:45Z) - Exploring Public's Perception of Safety and Video Surveillance
Technology: A Survey Approach [2.473948454680334]
本研究は,コミュニティの一般公衆安全に関する懸念,既存の監視技術に対する見解,および都市環境における安全向上のためのAI駆動型ソリューションに対する認識を総合的に分析し,シャーロットに焦点をあてたものである。
本研究は, 年齢, 性別, 民族, 教育水準などの人口統計学的要因を調査し, 公衆の認識や公衆の安全への懸念, 解決策の可能性について考察する。
論文 参考訳(メタデータ) (2023-12-10T15:53:37Z) - Safe Model-Based Multi-Agent Mean-Field Reinforcement Learning [48.667697255912614]
平均場強化学習は、同一エージェントの無限集団と相互作用する代表エージェントのポリシーに対処する。
モデルベースの平均場強化学習アルゴリズムであるSafe-M$3$-UCRLを提案する。
本アルゴリズムは,低需要領域におけるサービスアクセシビリティを確保しつつ,重要な領域における需要を効果的に満たす。
論文 参考訳(メタデータ) (2023-06-29T15:57:07Z) - Explainable, automated urban interventions to improve pedestrian and
vehicle safety [0.8620335948752805]
本稿では,歩行者や車両の安全性にアプローチするために,公共データソース,大規模街路画像,コンピュータビジョン技術を組み合わせる。
このパイプラインに関わるステップには、各都市シーンのハザード指標を決定するために、残留畳み込みニューラルネットワークの適応とトレーニングが含まれる。
この計算手法の結果は、都市全体の危険レベルの詳細なマップであり、歩行者と車両の安全性を同時に改善する可能性がある。
論文 参考訳(メタデータ) (2021-10-22T09:17:39Z) - Methodological Foundation of a Numerical Taxonomy of Urban Form [62.997667081978825]
本稿では, 生物系統学から得られた都市形態の数値分類法を提案する。
我々は同質の都市組織タイプを導出し、それら間の全体形態的類似性を決定することにより、都市形態の階層的分類を生成する。
フレーミングとプレゼンを行った後、プラハとアムステルダムの2都市でテストを行った。
論文 参考訳(メタデータ) (2021-04-30T12:47:52Z) - Predicting Livelihood Indicators from Community-Generated Street-Level
Imagery [70.5081240396352]
本稿では,クラウドソースによるストリートレベルの画像から重要な生活指標を予測するための,安価でスケーラブルで解釈可能なアプローチを提案する。
全国的に代表される世帯調査で収集した地上データと比較することにより,貧困,人口,健康の指標を正確に予測する上でのアプローチの有効性を実証した。
論文 参考訳(メタデータ) (2020-06-15T18:12:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。