論文の概要: ZenSVI: An Open-Source Software for the Integrated Acquisition, Processing and Analysis of Street View Imagery Towards Scalable Urban Science
- arxiv url: http://arxiv.org/abs/2412.18641v1
- Date: Tue, 24 Dec 2024 07:13:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-30 17:26:46.894946
- Title: ZenSVI: An Open-Source Software for the Integrated Acquisition, Processing and Analysis of Street View Imagery Towards Scalable Urban Science
- Title(参考訳): ZenSVI: スケーラブルな都市科学に向けたストリートビュー画像の統合的獲得・処理・分析のためのオープンソースソフトウェア
- Authors: Koichi Ito, Yihan Zhu, Mahmoud Abdelrahman, Xiucheng Liang, Zicheng Fan, Yujun Hou, Tianhong Zhao, Rui Ma, Kunihiko Fujiwara, Jiani Ouyang, Matias Quintana, Filip Biljecki,
- Abstract要約: ストリートビューイメージ(SVI)は、街路の特徴や構築環境を理解し、特徴付けるために、過去10年間に多くの研究で役立っている。
我々は,フリーでオープンソースのPythonパッケージであるZenSVIを開発し,SVI解析の全プロセスを統合し実装する。
- 参考スコア(独自算出の注目度): 1.5494074223643037
- License:
- Abstract: Street view imagery (SVI) has been instrumental in many studies in the past decade to understand and characterize street features and the built environment. Researchers across a variety of domains, such as transportation, health, architecture, human perception, and infrastructure have employed different methods to analyze SVI. However, these applications and image-processing procedures have not been standardized, and solutions have been implemented in isolation, often making it difficult for others to reproduce existing work and carry out new research. Using SVI for research requires multiple technical steps: accessing APIs for scalable data collection, preprocessing images to standardize formats, implementing computer vision models for feature extraction, and conducting spatial analysis. These technical requirements create barriers for researchers in urban studies, particularly those without extensive programming experience. We develop ZenSVI, a free and open-source Python package that integrates and implements the entire process of SVI analysis, supporting a wide range of use cases. Its end-to-end pipeline includes downloading SVI from multiple platforms (e.g., Mapillary and KartaView) efficiently, analyzing metadata of SVI, applying computer vision models to extract target features, transforming SVI into different projections (e.g., fish-eye and perspective) and different formats (e.g., depth map and point cloud), visualizing analyses with maps and plots, and exporting outputs to other software tools. We demonstrate its use in Singapore through a case study of data quality assessment and clustering analysis in a streamlined manner. Our software improves the transparency, reproducibility, and scalability of research relying on SVI and supports researchers in conducting urban analyses efficiently. Its modular design facilitates extensions and unlocking new use cases.
- Abstract(参考訳): ストリートビューイメージ(SVI)は、街路の特徴や構築環境を理解し、特徴付けるために、過去10年間に多くの研究で役立っている。
輸送、健康、建築、人間の知覚、インフラなど、さまざまな分野の研究者がSVIの分析にさまざまな方法を採用している。
しかし、これらのアプリケーションや画像処理手順は標準化されておらず、ソリューションは単独で実装されているため、既存の作業の再現や新たな研究の実施が困難になることが多い。
スケーラブルなデータ収集のためのAPIへのアクセス、フォーマットの標準化のための事前処理、特徴抽出のためのコンピュータビジョンモデルの実装、空間分析の実行。
これらの技術的要件は、都市研究、特に広範なプログラミング経験のない研究者にとって障壁となる。
我々はフリーでオープンソースのPythonパッケージであるZenSVIを開発し、SVI分析の全プロセスを統合し実装し、幅広いユースケースをサポートする。
エンドツーエンドパイプラインには、複数のプラットフォーム(例えばMapillaryやKartaView)からSVIを効率的にダウンロードすること、SVIのメタデータの分析、ターゲット特徴の抽出にコンピュータビジョンモデルを適用すること、SVIを異なるプロジェクション(例えば、魚眼と視点)と異なるフォーマット(例えば、深度マップと点クラウド)に変換すること、マップとプロットによる分析を可視化すること、他のソフトウェアツールに出力をエクスポートすることが含まれる。
シンガポールにおけるデータ品質評価とクラスタリング分析のケーススタディを合理化して実演する。
本ソフトウェアは,SVIに依存した研究の透明性,再現性,拡張性を向上し,都市分析の効率化を支援する。
そのモジュラーデザインは、拡張と新しいユースケースのアンロックを容易にする。
関連論文リスト
- Cambrian-1: A Fully Open, Vision-Centric Exploration of Multimodal LLMs [61.143381152739046]
視覚中心のアプローチで設計したマルチモーダルLLM(MLLM)のファミリーであるCambrian-1を紹介する。
本研究は,様々な視覚表現を評価するためのインタフェースとして,LLMとビジュアルインストラクションチューニングを用いた。
モデルウェイト、コード、サポートツール、データセット、詳細なインストラクションチューニングと評価のレシピを提供しています。
論文 参考訳(メタデータ) (2024-06-24T17:59:42Z) - A Comprehensive Survey on Underwater Image Enhancement Based on Deep Learning [51.7818820745221]
水中画像強調(UIE)はコンピュータビジョン研究において重要な課題である。
多数のUIEアルゴリズムが開発されているにもかかわらず、網羅的で体系的なレビューはいまだに欠落している。
論文 参考訳(メタデータ) (2024-05-30T04:46:40Z) - BEHAVIOR Vision Suite: Customizable Dataset Generation via Simulation [57.40024206484446]
我々は、コンピュータビジョンモデルの体系的評価のために、完全にカスタマイズされた合成データを生成するためのツールと資産のセットであるBEHAVIOR Vision Suite(BVS)を紹介する。
BVSはシーンレベルで多数の調整可能なパラメータをサポートする。
アプリケーションシナリオを3つ紹介する。
論文 参考訳(メタデータ) (2024-05-15T17:57:56Z) - A citizen science toolkit to collect human perceptions of urban environments using open street view images [0.20999222360659603]
ストリートビュー画像(SVI)は、研究(環境評価、緑地識別、土地被覆分類など)に有用なデータソースである。
オープンなSVIデータセットは、Mapillaryのような制限の少ないソースから容易に利用できる。
オープンなSVIを自動ダウンロード、処理、収穫、フィルタリングする効率的な方法を提案する。
論文 参考訳(メタデータ) (2024-02-29T22:58:13Z) - Amirkabir campus dataset: Real-world challenges and scenarios of Visual
Inertial Odometry (VIO) for visually impaired people [3.7998592843098336]
上記の問題に対処し,ナビゲーションシステムを改善するために,Amirkabirキャンパスデータセット(AUT-VI)を導入する。
AUT-VIは17の異なる場所で126の異なる配列を持つ、新しくて超混成的なデータセットである。
進行中の開発作業のサポートとして、データキャプチャ用のAndroidアプリケーションを一般向けにリリースしました。
論文 参考訳(メタデータ) (2024-01-07T23:13:51Z) - SeeBel: Seeing is Believing [0.9790236766474201]
本稿では,全画像のセグメンテーションにおけるデータセット統計とAI性能を比較するための3つの可視化手法を提案する。
我々のプロジェクトは、画像の注意重みを可視化することで、セグメンテーションのための訓練されたAIモデルの解釈可能性をさらに高めようとしている。
我々は,コンピュータビジョンとAI領域における可視化ツールの有効性を検討するために,実際のユーザを対象に調査を行うことを提案する。
論文 参考訳(メタデータ) (2023-12-18T05:11:00Z) - Deep Learning Techniques for Video Instance Segmentation: A Survey [19.32547752428875]
ビデオインスタンスセグメンテーションは、2019年に導入された新しいコンピュータビジョン研究分野である。
ディープラーニング技術は、様々なコンピュータビジョン領域において支配的な役割を担っている。
このサーベイは、ビデオインスタンスセグメンテーションのためのディープラーニングスキームの多面的なビューを提供する。
論文 参考訳(メタデータ) (2023-10-19T00:27:30Z) - Slideflow: Deep Learning for Digital Histopathology with Real-Time
Whole-Slide Visualization [49.62449457005743]
われわれはSlideflowと呼ばれる病理組織学のための柔軟なディープラーニングライブラリを開発した。
デジタル病理学のための幅広い深層学習手法をサポートしている。
トレーニングされたモデルをデプロイするための、高速な全スライドインターフェースが含まれている。
論文 参考訳(メタデータ) (2023-04-09T02:49:36Z) - Automatic Image Content Extraction: Operationalizing Machine Learning in
Humanistic Photographic Studies of Large Visual Archives [81.88384269259706]
本稿では,機械学習による大規模画像アーカイブの検索と解析のための自動画像コンテンツ抽出フレームワークを提案する。
提案する枠組みは、人文科学と社会科学のいくつかの分野に適用できる。
論文 参考訳(メタデータ) (2022-04-05T12:19:24Z) - SCENIC: A JAX Library for Computer Vision Research and Beyond [44.21002948898551]
ScenicはオープンソースのJAXライブラリで、コンピュータビジョン研究などのためのTransformerベースのモデルにフォーカスしている。
このツールキットの目的は、新しい視覚アーキテクチャとモデルの迅速な実験、プロトタイピング、研究を促進することである。
論文 参考訳(メタデータ) (2021-10-18T08:41:17Z) - Image Segmentation Using Deep Learning: A Survey [58.37211170954998]
イメージセグメンテーションは、画像処理とコンピュータビジョンにおいて重要なトピックである。
深層学習モデルを用いた画像セグメンテーション手法の開発を目的とした研究が,これまでに数多く行われている。
論文 参考訳(メタデータ) (2020-01-15T21:37:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。