論文の概要: EMPLACE: Self-Supervised Urban Scene Change Detection
- arxiv url: http://arxiv.org/abs/2503.17716v1
- Date: Sat, 22 Mar 2025 10:20:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-25 14:36:48.890131
- Title: EMPLACE: Self-Supervised Urban Scene Change Detection
- Title(参考訳): EMPLACE:自己監視型都市景観変化検出
- Authors: Tim Alpherts, Sennay Ghebreab, Nanne van Noord,
- Abstract要約: 都市景観変化検出(Urban Scene Change Detection, USCD)は、コンピュータビジョンによる街路景観の変化を捉えることを目的としている。
我々は、視覚変換器を訓練する自己監督方法EMPLACEとともに、1.1M以上の画像で最大のUSCDデータセットであるAC-1Mを紹介した。
アムステルダムのケーススタディでは、市内の小さな変化と大きな変化の両方を検知でき、EMPLACEによって発見された変化は、サイズによって住宅価格と相関していることを示す。
- 参考スコア(独自算出の注目度): 6.250018240133604
- License:
- Abstract: Urban change is a constant process that influences the perception of neighbourhoods and the lives of the people within them. The field of Urban Scene Change Detection (USCD) aims to capture changes in street scenes using computer vision and can help raise awareness of changes that make it possible to better understand the city and its residents. Traditionally, the field of USCD has used supervised methods with small scale datasets. This constrains methods when applied to new cities, as it requires labour-intensive labeling processes and forces a priori definitions of relevant change. In this paper we introduce AC-1M the largest USCD dataset by far of over 1.1M images, together with EMPLACE, a self-supervising method to train a Vision Transformer using our adaptive triplet loss. We show EMPLACE outperforms SOTA methods both as a pre-training method for linear fine-tuning as well as a zero-shot setting. Lastly, in a case study of Amsterdam, we show that we are able to detect both small and large changes throughout the city and that changes uncovered by EMPLACE, depending on size, correlate with housing prices - which in turn is indicative of inequity.
- Abstract(参考訳): 都市の変化は、近隣住民の認識と住民の生活に影響を与える絶え間ないプロセスである。
都市景観変化検出(USCD)の分野は、コンピュータビジョンを用いて街路景観の変化を捉え、都市とその住民をよりよく理解するための変化の認識を高めることを目的としている。
伝統的に、USCDの分野は、小さなデータセットを持つ教師付き手法を用いてきた。
これは、労働集約的なラベル付けプロセスを必要とするため、新しい都市に適用された場合の手法を制約し、関連する変更の優先順位定義を強制する。
本稿では,適応三重項損失を用いた視覚変換器の自己監督手法EMPLACEとともに,1.1M以上の画像で最大のUSCDデータセットであるAC-1Mを紹介する。
EMPLACEは, 線形微調整のための事前学習法およびゼロショット設定法として, SOTA法より優れていることを示す。
最後に、アムステルダムのケーススタディにおいて、我々は市内の小さな変化と大きな変化の両方を検知でき、EMPLACEが発見した変化は、規模によって住宅価格と相関し、不平等を示すことを示している。
関連論文リスト
- CityPulse: Fine-Grained Assessment of Urban Change with Street View Time
Series [12.621355888239359]
都市変革は、個人と地域社会の両方に大きな社会的影響を及ぼす。
本研究では,大規模に構築された環境における物理的変化を効果的に捉えるために,エンドツーエンドの変更検出モデルを提案する。
我々のアプローチは既存のデータセットを補完し、都市の変化をきめ細やかに正確に評価する可能性がある。
論文 参考訳(メタデータ) (2024-01-02T08:57:09Z) - Self-supervised learning unveils change in urban housing from
street-level images [2.0971479389679337]
Street2Vecは、手動のアノテーションなしで季節や日々の変更に不変ながら、都市構造を組み込む。
ロンドンの住宅供給の点レベルの変化をストリートレベルの画像から特定し、主要な変化とマイナーな変化を区別した。
この能力は、より活気があり、公平で持続可能な都市に向けた都市計画や政策決定のためのタイムリーな情報を提供することができる。
論文 参考訳(メタデータ) (2023-09-20T14:35:23Z) - CityTrack: Improving City-Scale Multi-Camera Multi-Target Tracking by
Location-Aware Tracking and Box-Grained Matching [15.854610268846562]
Multi-Camera Multi-Target Tracking (MCMT)は、複数のカメラを同時に追跡するコンピュータビジョン技術である。
そこで我々は,都市交通シーンがもたらす課題を克服するために,CityTrackと呼ばれるMCMTフレームワークを提案する。
MCMTタスクにおいて,様々な高度な手法を取り入れた位置認識SCMTトラッカーを提案する。
論文 参考訳(メタデータ) (2023-07-06T03:25:37Z) - Vicinity Vision Transformer [53.43198716947792]
線形複雑度を有する視覚変換器に局所性バイアスを導入するビシニティ注意法を提案する。
提案手法は,従来の手法よりも50%少ないパラメータで,最先端の画像分類精度を実現する。
論文 参考訳(メタデータ) (2022-06-21T17:33:53Z) - Congested Crowd Instance Localization with Dilated Convolutional Swin
Transformer [119.72951028190586]
クラウドローカライゼーションは、クラウドカウントから進化した新しいコンピュータビジョンタスクである。
本稿では,高密度群集シーンにおける高精度なインスタンスローカライズを実現する方法について述べる。
混雑した群集シーンを対象とした拡張畳み込みスイム変換器 (DCST) を提案する。
論文 参考訳(メタデータ) (2021-08-02T01:27:53Z) - Safety-Oriented Pedestrian Motion and Scene Occupancy Forecasting [91.69900691029908]
我々は、個々の動きとシーン占有マップの両方を予測することを提唱する。
歩行者の相対的な空間情報を保存するScene-Actor Graph Neural Network (SA-GNN)を提案する。
2つの大規模な実世界のデータセットで、我々のシーン占有率予測が最先端のモーション予測手法よりも正確でより校正されていることを示した。
論文 参考訳(メタデータ) (2021-01-07T06:08:21Z) - Hi-UCD: A Large-scale Dataset for Urban Semantic Change Detection in
Remote Sensing Imagery [5.151973524974052]
Hi-UCDは、都市変化検出のための大規模なベンチマークデータセットである。
精巧な都市変化の検出と分析に使用できる。
バイナリとマルチクラスの変更検出において,古典的な手法を用いてデータセットをベンチマークする。
論文 参考訳(メタデータ) (2020-11-06T09:20:54Z) - Toward Accurate Person-level Action Recognition in Videos of Crowded
Scenes [131.9067467127761]
我々は、シーンの情報を完全に活用し、新しいデータを集めることで、アクション認識を改善することに集中する。
具体的には、各フレームの空間的位置を検出するために、強い人間の検出器を採用する。
そして、行動認識モデルを適用して、HIEデータセットとインターネットから多様なシーンを持つ新しいデータの両方でビデオフレームから時間情報を学ぶ。
論文 参考訳(メタデータ) (2020-10-16T13:08:50Z) - A Flow Base Bi-path Network for Cross-scene Video Crowd Understanding in
Aerial View [93.23947591795897]
本稿では,これらの課題に対処し,ドローンから収集した視覚的データから参加者を自動的に理解する。
クロスシーンテストで発生する背景雑音を軽減するために, 二重ストリーム群カウントモデルを提案する。
極暗環境下での集団密度推定問題に対処するために,ゲームグランドセフトオートV(GTAV)によって生成された合成データを導入する。
論文 参考訳(メタデータ) (2020-09-29T01:48:24Z) - BoMuDANet: Unsupervised Adaptation for Visual Scene Understanding in
Unstructured Driving Environments [54.22535063244038]
非構造交通環境における視覚的シーン理解のための教師なし適応手法を提案する。
本手法は,車,トラック,二輪車,三輪車,歩行者からなる密集・異種交通を伴う非構造現実シナリオを対象としたものである。
論文 参考訳(メタデータ) (2020-09-22T08:25:44Z) - Unsupervised Vehicle Counting via Multiple Camera Domain Adaptation [9.730985797769764]
市民の生活の質と都市環境を改善するためには, 都市内の車両流のモニタリングが不可欠である。
画像のヒンジを大量の注釈付きデータにカウントする現在の技術は、新しいカメラがシステムに追加されるにつれて、都市規模へのスケーラビリティを損なう。
我々は,複数のカメラ領域を適応させてラベル付きデータが少ない画像に基づく車両密度推定器を設計するための新しい手法を提案し,議論する。
論文 参考訳(メタデータ) (2020-04-20T13:00:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。