論文の概要: Modeling Subjective Urban Perception with Human Gaze
- arxiv url: http://arxiv.org/abs/2605.00764v1
- Date: Fri, 01 May 2026 16:25:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 17:43:29.012802
- Title: Modeling Subjective Urban Perception with Human Gaze
- Title(参考訳): 人間の視線による主観的都市認識のモデル化
- Authors: Lin Che, Xi Wang, Marc Pollefeys, Konrad Schindler, Martin Raubal, Peter Kiefer,
- Abstract要約: そこで我々はPlace Pulse-Gazeを紹介した。Place Pulse-Gazeは、街路ビューの画像に同期した視線追跡記録と個人認識ラベルを付加する都市認識データセットである。
本研究では,視線行動が主観的都市感のモデル化にどのように貢献するかを考察するために,ガゼ誘導型都市知覚フレームワークを提案する。
- 参考スコア(独自算出の注目度): 60.73742038237224
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Urban perception describes how people subjectively evaluate urban environments, shaping how cities are experienced and understood. Existing computational approaches primarily model urban perception directly from street view images, but largely ignore the human perceptual process through which such judgments are formed. In this paper, we introduce Place Pulse-Gaze, an urban perception dataset that augments street view images with synchronized eye-tracking recordings and individual perception labels. Based on this dataset, we propose a Gaze-Guided Urban Perception Framework to study how gaze behavior contributes to the modeling of subjective urban perception. The framework systematically investigates three complementary settings: gaze-only modeling, gaze fusion with explicit semantic scene representations, and gaze fusion with implicit richer visual representations. Experiments show that gaze alone already carries useful predictive signals for subjective urban perception, and that integrating gaze with scene representations further improves prediction under both semantic and richer visual representations. Overall, our findings highlight the importance of incorporating human perceptual processes into urban scene understanding and open a direction for gaze-guided multimodal urban computing.
- Abstract(参考訳): 都市認識は、人々が都市環境を主観的に評価し、都市がどのように経験され、理解されるかを形成する。
既存の計算手法は、主にストリートビュー画像から直接都市感をモデル化するが、そのような判断が形成される人間の知覚過程をほとんど無視する。
本稿では,街路画像に同期した視線追跡記録と個人認識ラベルを付加した都市認識データセットであるPlace Pulse-Gazeを紹介する。
本データセットに基づいて,ガゼ誘導型都市知覚フレームワークを提案し,視線行動が主観的都市認識のモデル化にどのように貢献するかを考察する。
このフレームワークは、視線のみのモデリング、明示的な意味的シーン表現による視線融合、暗黙的な豊かな視覚表現による視線融合という3つの補完的な設定を体系的に研究している。
実験により、視線だけでは、主観的都市認識に有用な予測信号がすでに存在しており、視線をシーン表現と統合することで、意味的およびよりリッチな視覚表現の両方の下での予測がさらに改善されることが示されている。
以上の結果から,人間の知覚過程を都市環境理解に取り入れることの重要性と,視線誘導型マルチモーダル都市コンピューティングの方向性を明らかにすることの重要性が示唆された。
関連論文リスト
- From Pixels to Predicates Structuring urban perception with scene graphs [4.7912190748710515]
本研究では,ストリートビュー画像(SVI)を6つの知覚的指標を予測するための構造化表現に変換する3段階パイプラインを提案する。
第1段階では、各画像はオープンセットのPanoptic Scene Graph Model(OpenPSG)を使用して解析され、オブジェクト述語三重項オブジェクトを抽出する。
第2段階では、ヘテロジニアスグラフオートエンコーダ(GraphMAE)により、コンパクトなシーンレベルの埋め込みが学習される。
第3段階では、ニューラルネットワークがこれらの埋め込みから知覚のスコアを予測する。
論文 参考訳(メタデータ) (2025-12-22T10:02:53Z) - Do Street View Imagery and Public Participation GIS align: Comparative Analysis of Urban Attractiveness [0.0]
SVI(Street View Imagery)とPPGIS(Public Participation GIS)は、場所に基づく知覚を捉えるための2つの重要なアプローチである。
本研究では,フィンランドのヘルシンキにおける都市全体でのPSGIS調査を通じて,SVIによる知覚的魅力と住民の体験との整合性について検討した。
論文 参考訳(メタデータ) (2025-11-04T12:40:12Z) - AerialGo: Walking-through City View Generation from Aerial Perspectives [48.53976414257845]
AerialGoは、空中画像からリアルな街並みを生成するフレームワークである。
AerialGoは、アクセス可能な航空データに地上視合成を条件付けすることで、地上レベルの画像に固有のプライバシーリスクを回避できる。
実験により、AerialGoは地上レベルのリアリズムと構造的コヒーレンスを著しく向上させることが示された。
論文 参考訳(メタデータ) (2024-11-29T08:14:07Z) - When Does Perceptual Alignment Benefit Vision Representations? [76.32336818860965]
視覚モデル表現と人間の知覚的判断との整合がユーザビリティに与える影響について検討する。
モデルと知覚的判断を一致させることで、多くの下流タスクで元のバックボーンを改善する表現が得られることがわかった。
その結果,人間の知覚的知識に関する帰納バイアスを視覚モデルに注入することは,より良い表現に寄与することが示唆された。
論文 参考訳(メタデータ) (2024-10-14T17:59:58Z) - Urban Scene Diffusion through Semantic Occupancy Map [49.20779809250597]
UrbanDiffusionは、Bird's-Eye View (BEV)マップに条件付き3次元拡散モデルである。
我々のモデルは,潜在空間内のシーンレベルの構造の分布を学習する。
実世界の運転データセットをトレーニングした後、我々のモデルは多様な都市シーンを生成することができる。
論文 参考訳(メタデータ) (2024-03-18T11:54:35Z) - City-Wide Perceptions of Neighbourhood Quality using Street View Images [5.340189314359048]
本稿では,ロンドンに拠点を置き,画像とレーティングの収集,Web開発,モデルトレーニング,マッピングなどの手法について述べる。
住民の社会的結束、コミュニティの感覚、安全、活動、メンタルヘルスに影響を与える。
論文 参考訳(メタデータ) (2022-11-22T10:16:35Z) - GIMO: Gaze-Informed Human Motion Prediction in Context [75.52839760700833]
本研究では、高品質なボディポーズシーケンス、シーンスキャン、目視によるエゴ中心のビューを提供する大規模な人体動作データセットを提案する。
私たちのデータ収集は特定のシーンに縛られません。
視線の全可能性を実現するために,視線と運動枝の双方向通信を可能にする新しいネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-04-20T13:17:39Z) - Indexical Cities: Articulating Personal Models of Urban Preference with
Geotagged Data [0.0]
本研究は,都市空間における個人の嗜好を特徴付け,特定の観測者に対する未知の好ましくない場所のスペクトルを予測する。
多くの都市認識研究とは異なり、我々の意図は都市品質の客観的な尺度を提供する手段ではなく、都市や都市についての個人的な見解を表現することである。
論文 参考訳(メタデータ) (2020-01-23T11:00:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。