論文の概要: Assessing Greenspace Attractiveness with ChatGPT, Claude, and Gemini: Do AI Models Reflect Human Perceptions?
- arxiv url: http://arxiv.org/abs/2512.11827v2
- Date: Tue, 16 Dec 2025 07:43:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-21 14:22:08.699645
- Title: Assessing Greenspace Attractiveness with ChatGPT, Claude, and Gemini: Do AI Models Reflect Human Perceptions?
- Title(参考訳): ChatGPT, Claude, Geminiによるグリーンスペースの魅力の評価:AIモデルは人間の知覚を反映しているか?
- Authors: Milad Malekzadeh, Magdalena Biernacka, Elias Willberg, Jussi Torkko, Edyta Łaszkiewicz, Tuuli Toivonen,
- Abstract要約: 本研究では,Googleストリートビュー画像を用いたマルチモーダル大規模言語モデル(MLLM)による緑地魅力の評価について検討した。
ポーランドのロズ地区の住民のジオクエシオネアからの回答とモデル出力を比較した。
結果は、魅力的な形式的緑地と、魅力ある形式的緑地と、魅力ある形式的緑地と、魅力ある形式的緑地と、魅力ある非魅力ある形式的緑地との、高いAI人間的合意を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding greenspace attractiveness is essential for designing livable and inclusive urban environments, yet existing assessment approaches often overlook informal or transient spaces and remain too resource intensive to capture subjective perceptions at scale. This study examines the ability of multimodal large language models (MLLMs), ChatGPT GPT-4o, Claude 3.5 Haiku, and Gemini 2.0 Flash, to assess greenspace attractiveness similarly to humans using Google Street View imagery. We compared model outputs with responses from a geo-questionnaire of residents in Lodz, Poland, across both formal (for example, parks and managed greenspaces) and informal (for example, meadows and wastelands) greenspaces. Survey respondents and models indicated whether each greenspace was attractive or unattractive and provided up to three free text explanations. Analyses examined how often their attractiveness judgments aligned and compared their explanations after classifying them into shared reasoning categories. Results show high AI human agreement for attractive formal greenspaces and unattractive informal spaces, but low alignment for attractive informal and unattractive formal greenspaces. Models consistently emphasized aesthetic and design oriented features, underrepresenting safety, functional infrastructure, and locally embedded qualities valued by survey respondents. While these findings highlight the potential for scalable pre-assessment, they also underscore the need for human oversight and complementary participatory approaches. We conclude that MLLMs can support, but not replace, context sensitive greenspace evaluation in planning practice.
- Abstract(参考訳): グリーンスペースの魅力を理解することは、自由で包括的な都市環境の設計に不可欠であるが、既存のアセスメントアプローチは、しばしば非公式または過渡的な空間を見落とし、大規模に主観的な知覚を捉えるには資源が集中しすぎている。
本研究では,マルチモーダル大言語モデル (MLLM) , ChatGPT GPT-4o, Claude 3.5 Haiku, Gemini 2.0 Flash を用いて,Google Street View 画像を用いた緑地魅力の評価を行った。
本研究は,ポーランドのロドス市住民の緑地と緑地の緑地,緑地の緑地,緑地の緑地,緑地の緑地,緑地の緑地,緑地の緑地,緑地の緑地,緑地の緑地,緑地の緑地,緑地の緑地,緑地の緑地,緑地,緑地の緑地,緑地,緑地,緑地,緑地,緑地,緑地,緑地,緑地,緑地,緑地,緑地,緑地,緑地,緑地,緑地,緑地,緑地,緑地,緑地,緑地,緑地,緑地,緑地,緑地,緑地,緑地,緑地,緑地,緑地,緑地,緑地,緑地,
調査の回答者とモデルは、それぞれの緑地が魅力的か魅力がないかを示し、最大3つの無料テキスト説明を提供した。
分析は、彼らの魅力判断が、それらの説明を共通の推論カテゴリに分類した後、どのように一致し、比較したかを検討した。
結果は、魅力的な形式的緑地と、魅力ある形式的緑地と、魅力ある形式的緑地に対する高いAI人間的合意を示すが、魅力ある形式的緑地と非魅力ある形式的緑地に対する低いアライメントを示す。
モデルは、安全性、機能的インフラ、および調査回答者が評価する局所的な組込み品質を低く表現し、審美性と設計指向の特徴を一貫して強調した。
これらの発見は、スケーラブルな事前評価の可能性を浮き彫りにしているが、人間の監視と補完的な参加的アプローチの必要性も浮き彫りにしている。
MLLMは、計画実践において、コンテキストに敏感な緑地評価をサポートすることができるが、置き換えることはできないと結論付けている。
関連論文リスト
- MINGLE: VLMs for Semantically Complex Region Detection in Urban Scenes [49.89767522399176]
公共空間におけるグループレベルの社会的相互作用は都市計画に不可欠である。
対人関係によって定義された視覚領域の推測と空間的接地を必要とする社会集団領域検出タスクを導入する。
本稿では,人間検出と深度推定を統合したモジュール型3段階パイプラインであるMINGLEと,ソーシャルアフィリエイトを相互に分類するVLMベースの推論と,ソーシャルに連結したグループを局所化する軽量な空間アグリゲーションアルゴリズムを提案する。
そこで本稿では,個人と社会的に相互作用するグループの両方に対して,境界ボックスとラベルを付加した100万の街路ビュー画像のデータセットを提案する。
論文 参考訳(メタデータ) (2025-09-16T19:31:40Z) - Teaching Language Models To Gather Information Proactively [53.85419549904644]
大規模言語モデル(LLM)は、ますます協力的なパートナーとして機能することが期待されている。
本研究では,アクティブな情報収集という新たなタスクパラダイムを導入する。
キー情報をマスキングする、部分的に特定された現実世界のタスクを生成するスケーラブルなフレームワークを設計する。
このセットアップの中核となるイノベーションは、真に新しい暗黙のユーザー情報を引き出す質問に報酬を与える、強化された微調整戦略です。
論文 参考訳(メタデータ) (2025-07-28T23:50:09Z) - SITE: towards Spatial Intelligence Thorough Evaluation [121.1493852562597]
空間知能 (Spatial Intelligence, SI) は、空間的関係の可視化、操作、推論を含む認知能力を表す。
SI Thorough Evaluationに向けたベンチマークデータセットであるSITEを紹介する。
ベンチマークの計算には、31の既存のデータセットに関するボトムアップ調査と、認知科学の3つの分類システムに基づくトップダウン戦略を組み合わせる。
論文 参考訳(メタデータ) (2025-05-08T17:45:44Z) - Seeing with Partial Certainty: Conformal Prediction for Robotic Scene Recognition in Built Environments [6.295098866364597]
本稿では,VLMを用いた位置認識における不確実性の測定・調整を目的としたフレームワークであるSeing with partial Certainty(SwPC)を紹介する。
SwPCは、人間の助けを求めるリクエストを最小限に抑えつつ、位置認識に関する統計的保証を提供するために、共形予測の理論に基づいて構築されている。
論文 参考訳(メタデータ) (2025-01-09T03:50:00Z) - SPHERE: Unveiling Spatial Blind Spots in Vision-Language Models Through Hierarchical Evaluation [7.659514491338669]
現在の視覚言語モデルは、基本的な空間的手がかりを把握できるが、人間のような理解や現実世界の応用に必要な多次元空間的推論に苦慮している。
我々は,新しい人間注釈付きデータセットをサポートする階層的評価フレームワークであるSPHEREを開発した。
最先端モデルのベンチマーク評価では、特に距離と近接性についての推論において、重大な欠陥が示される。
論文 参考訳(メタデータ) (2024-12-17T09:10:55Z) - On the Fairness, Diversity and Reliability of Text-to-Image Generative Models [68.62012304574012]
マルチモーダル生成モデルは 信頼性 公正性 誤用の可能性について 批判的な議論を巻き起こしました
埋め込み空間におけるグローバルおよびローカルな摂動に対する応答を解析し、モデルの信頼性を評価するための評価フレームワークを提案する。
提案手法は, 信頼できない, バイアス注入されたモデルを検出し, 組込みバイアスの証明をトレースするための基礎となる。
論文 参考訳(メタデータ) (2024-11-21T09:46:55Z) - Understanding Hybrid Spaces: Designing a Spacetime Model to Represent
Dynamic Topologies of Hybrid Spaces [0.0]
本研究では,ハイブリッド空間の動的位相の可視化のための時間モデルを開発した。
既存のハイブリッド空間の概念と表現のタイプを示す。
ハイブリッド空間の様々な動的トポロジーがうまく可視化された。
論文 参考訳(メタデータ) (2024-03-08T11:18:27Z) - Interactive Natural Language Processing [67.87925315773924]
対話型自然言語処理(iNLP)は,NLP分野における新しいパラダイムとして登場した。
本稿では,iNLPの概念の統一的定義と枠組みを提案することから,iNLPに関する包括的調査を行う。
論文 参考訳(メタデータ) (2023-05-22T17:18:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。