論文の概要: Image-based Visibility Analysis Replacing Line-of-Sight Simulation: An Urban Landmark Perspective
- arxiv url: http://arxiv.org/abs/2505.11809v1
- Date: Sat, 17 May 2025 03:41:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:10.859794
- Title: Image-based Visibility Analysis Replacing Line-of-Sight Simulation: An Urban Landmark Perspective
- Title(参考訳): 視線シミュレーションを応用した画像ベース視認性分析:都市景観の展望
- Authors: Zicheng Fan, Kunihiko Fujiwara, Pengyuan Liu, Fan Zhang, Filip Biljecki,
- Abstract要約: この研究は、新しい画像ベースの可視性分析手法を導入することで、従来のLoSベースのアプローチに挑戦する。
最初のケーススタディでは、大都市における6つの高いランドマーク構造物の視認性を検出するための信頼性を87%の精度で証明した。
第二のケースでは、提案された可視グラフは、ロンドンのテムズ川に沿った複数のランドマークの接続形態と強度を明らかにする。
- 参考スコア(独自算出の注目度): 2.3315115235829342
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visibility analysis is one of the fundamental analytics methods in urban planning and landscape research, traditionally conducted through computational simulations based on the Line-of-Sight (LoS) principle. However, when assessing the visibility of named urban objects such as landmarks, geometric intersection alone fails to capture the contextual and perceptual dimensions of visibility as experienced in the real world. The study challenges the traditional LoS-based approaches by introducing a new, image-based visibility analysis method. Specifically, a Vision Language Model (VLM) is applied to detect the target object within a direction-zoomed Street View Image (SVI). Successful detection represents the object's visibility at the corresponding SVI location. Further, a heterogeneous visibility graph is constructed to address the complex interaction between observers and target objects. In the first case study, the method proves its reliability in detecting the visibility of six tall landmark constructions in global cities, with an overall accuracy of 87%. Furthermore, it reveals broader contextual differences when the landmarks are perceived and experienced. In the second case, the proposed visibility graph uncovers the form and strength of connections for multiple landmarks along the River Thames in London, as well as the places where these connections occur. Notably, bridges on the River Thames account for approximately 30% of total connections. Our method complements and enhances traditional LoS-based visibility analysis, and showcases the possibility of revealing the prevalent connection of any visual objects in the urban environment. It opens up new research perspectives for urban planning, heritage conservation, and computational social science.
- Abstract(参考訳): 可視性分析は、伝統的にLine-of-Sight(LoS)原理に基づいた計算シミュレーションによって行われる都市計画と景観研究の基本的な分析手法の1つである。
しかし、ランドマークなどの名付けられた都市オブジェクトの可視性を評価する場合、幾何学的交差点だけでは、現実世界で経験した文脈的・知覚的視界の次元を捉えることができない。
この研究は、新しい画像ベースの可視性分析手法を導入することで、従来のLoSベースのアプローチに挑戦する。
具体的には、方向対応ストリートビュー画像(SVI)内の対象物を検出するために、視覚言語モデル(VLM)を適用する。
成功した検出は、対応するSVI位置におけるオブジェクトの可視性を表す。
さらに、オブザーバと対象オブジェクトの間の複雑な相互作用に対処するために、異種可視グラフを構築する。
最初のケーススタディでは、大都市における6つの高いランドマーク構造物の視認性を検出するための信頼性を87%の精度で証明した。
さらに、ランドマークが認識され、経験されたとき、より広い文脈の違いを明らかにする。
第二のケースでは、提案された可視グラフは、ロンドンのテムズ川に沿った複数のランドマークの接続形態と強度、およびこれらの接続が発生する場所を明らかにする。
特にテムズ川に架かる橋は総接続数の約30%を占めている。
本手法は従来のLoSに基づく可視性解析を補完・強化し,都市環境における視覚的物体の関連性を明らかにする。
都市計画、遺産保存、計算社会科学の新しい研究の視点を開く。
関連論文リスト
- Coverage and Bias of Street View Imagery in Mapping the Urban Environment [0.0]
ストリートビュー画像(SVI)は、都市研究において貴重なデータ形式として出現し、都市環境を地図化し、知覚する新しい方法を可能にしている。
しかし、SVIの代表性、品質、信頼性に関する根本的な懸念はいまだに未解決のままである。
本研究は, 都市環境におけるSVIの要素レベルカバレッジを推定するための, 新規かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2024-09-22T02:58:43Z) - ELEV-VISION-SAM: Integrated Vision Language and Foundation Model for Automated Estimation of Building Lowest Floor Elevation [1.2070884166650049]
本研究では,セグメンテーション基礎モデルであるセグメンテーションモデルと視覚言語モデルを統合し,LFE推定のためのストリートビューイメージ上でテキストプロンプト画像セグメンテーションを行う。
提案手法は,ストリートビュー画像に正面扉が見えるほぼすべての特性に対して,LFE推定の可用性を著しく向上させる。
論文 参考訳(メタデータ) (2024-04-19T03:16:08Z) - RadOcc: Learning Cross-Modality Occupancy Knowledge through Rendering
Assisted Distillation [50.35403070279804]
マルチビュー画像を用いた3次元シーンの占有状況とセマンティクスを推定することを目的とした,新たな課題である3D占有予測手法を提案する。
本稿では,RandOccを提案する。Rendering Assisted distillation paradigm for 3D Occupancy prediction。
論文 参考訳(メタデータ) (2023-12-19T03:39:56Z) - How To Not Train Your Dragon: Training-free Embodied Object Goal
Navigation with Semantic Frontiers [94.46825166907831]
Embodied AIにおけるオブジェクトゴールナビゲーション問題に対処するためのトレーニング不要のソリューションを提案する。
本手法は,古典的な視覚的同時ローカライゼーションとマッピング(V-SLAM)フレームワークに基づく,構造化されたシーン表現を構築する。
本手法は,言語先行情報とシーン統計に基づいてシーングラフのセマンティクスを伝搬し,幾何学的フロンティアに意味知識を導入する。
論文 参考訳(メタデータ) (2023-05-26T13:38:33Z) - Point-Level Region Contrast for Object Detection Pre-Training [147.47349344401806]
本稿では,物体検出作業のための自己教師付き事前学習手法である点レベル領域コントラストを提案する。
提案手法は,異なる領域から個々の点対を直接抽出することにより,コントラスト学習を行う。
領域ごとの集約表現と比較すると,入力領域の品質の変化に対して,我々のアプローチはより堅牢である。
論文 参考訳(メタデータ) (2022-02-09T18:56:41Z) - Adding Visibility to Visibility Graphs: Weighting Visibility Analysis
with Attenuation Coefficients [0.0]
本稿では,気象条件に基づいて可視性グラフを重み付けする新しい手法を提案する。
新しい因子は可視性グラフに統合され、サンプル環境に適用され、視線の直線を仮定することと視界の減少の間のばらつきを示す。
論文 参考訳(メタデータ) (2021-07-28T18:36:56Z) - Bayesian Eye Tracking [63.21413628808946]
モデルに基づく視線追跡は、目の特徴検出エラーの影響を受けやすい。
モデルベースアイトラッキングのためのベイズフレームワークを提案する。
提案手法は,最先端のモデルベースおよび学習ベースの手法と比較して,一般化能力の大幅な向上を示す。
論文 参考訳(メタデータ) (2021-06-25T02:08:03Z) - City-Scale Visual Place Recognition with Deep Local Features Based on
Multi-Scale Ordered VLAD Pooling [5.274399407597545]
本稿では,コンテンツに基づく画像検索に基づいて,都市規模で位置認識を行うシステムを提案する。
まず,視覚的位置認識の包括的分析を行い,その課題を概観する。
次に,画像表現ベクトルに空間情報を埋め込むために,畳み込み型ニューラルネットワークアクティベーションを用いた単純なプーリング手法を提案する。
論文 参考訳(メタデータ) (2020-09-19T15:21:59Z) - 3D Shape Reconstruction from Vision and Touch [62.59044232597045]
3次元形状再構成では、視覚と触覚の相補的な融合はほとんど未解明のままである。
本稿では,ロボットハンドと多数の3Dオブジェクトの相互作用から,触覚と視覚信号のシミュレーションデータセットを提案する。
論文 参考訳(メタデータ) (2020-07-07T20:20:33Z) - Neural Topological SLAM for Visual Navigation [112.73876869904]
意味論を生かし、近似幾何学的推論を行う空間のトポロジ的表現を設計する。
本稿では,ノイズのあるアクティベーションの下でそのような表現を構築し,維持し,使用することができる教師付き学習ベースアルゴリズムについて述べる。
論文 参考訳(メタデータ) (2020-05-25T17:56:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。