論文の概要: Multimodal Urban Tree Detection from Satellite and Street-Level Imagery via Annotation-Efficient Deep Learning Strategies
- arxiv url: http://arxiv.org/abs/2604.03505v1
- Date: Fri, 03 Apr 2026 23:05:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:18.614489
- Title: Multimodal Urban Tree Detection from Satellite and Street-Level Imagery via Annotation-Efficient Deep Learning Strategies
- Title(参考訳): 注釈効率のよい深層学習手法による衛星画像とストリートレベル画像からのマルチモーダル都市木検出
- Authors: In Seon Kim, Ali Moghimi,
- Abstract要約: 本研究では,高解像度衛星画像と地上のGoogleストリートビューを統合し,スケーラブルで詳細な都市木検出を可能にするフレームワークを提案する。
このフレームワークはまず、衛星画像を利用してツリー候補をローカライズし、ターゲットとなる地上レベルのビューを取得して詳細な検出を行う。
アノテーションのボトルネックに対処するために、既存の注釈付きデータセットから新しい関心領域への知識の転送にドメイン適応を用いる。
- 参考スコア(独自算出の注目度): 0.7734726150561086
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Beyond the immediate biophysical benefits, urban trees play a foundational role in environmental sustainability and disaster mitigation. Precise mapping of urban trees is essential for environmental monitoring, post-disaster assessment, and strengthening policy. However, the transition from traditional, labor-intensive field surveys to scalable automated systems remains limited by high annotation costs and poor generalization across diverse urban scenarios. This study introduces a multimodal framework that integrates high-resolution satellite imagery with ground-level Google Street View to enable scalable and detailed urban tree detection under limited-annotation conditions. The framework first leverages satellite imagery to localize tree candidates and then retrieves targeted ground-level views for detailed detection, significantly reducing inefficient street-level sampling. To address the annotation bottleneck, domain adaptation is used to transfer knowledge from an existing annotated dataset to a new region of interest. To further minimize human effort, we evaluated three learning strategies: semi-supervised learning, active learning, and a hybrid approach combining both, using a transformer-based detection model. The hybrid strategy achieved the best performance with an F1-score of 0.90, representing a 12% improvement over the baseline model. In contrast, semi-supervised learning exhibited progressive performance degradation due to confirmation bias in pseudo-labeling, while active learning steadily improved results through targeted human intervention to label uncertain or incorrect predictions. Error analysis further showed that active and hybrid strategies reduced both false positives and false negatives. Our findings highlight the importance of a multimodal approach and guided annotation for scalable, annotation-efficient urban tree mapping to strengthen sustainable city planning.
- Abstract(参考訳): 直近の生物物理学的利益の他に、都市木は環境の持続可能性や災害の軽減に基礎的な役割を果たしている。
都市樹の精密マッピングは, 環境モニタリング, 災害後の評価, 政策強化に不可欠である。
しかし、従来の労働集約型フィールドサーベイからスケーラブルな自動化システムへの移行は、様々な都市シナリオにおける高いアノテーションコストと低い一般化によって制限されている。
本研究では,高解像度衛星画像と地上のGoogleストリートビューを統合したマルチモーダルフレームワークを導入し,限定アノテーション条件下でのスケーラブルで詳細な都市木検出を実現する。
このフレームワークは、まず衛星画像を利用してツリー候補をローカライズし、ターゲットとなる地上レベルのビューを詳細な検出のために検索し、非効率な街路レベルのサンプリングを著しく削減する。
アノテーションのボトルネックに対処するために、既存の注釈付きデータセットから新しい関心領域への知識の転送にドメイン適応を用いる。
人間の努力を最小化するために,半教師付き学習,能動学習,ハイブリッドアプローチの3つの学習戦略を,トランスフォーマーに基づく検出モデルを用いて評価した。
ハイブリッド戦略はF1スコア0.90で最高の性能を達成し、ベースラインモデルよりも12%改善した。
これとは対照的に,半教師付き学習では疑似ラベルの確認バイアスによる進行的性能劣化がみられ,アクティブラーニングでは,不確実または誤予測のラベル付けによる人為的介入による結果が着実に改善された。
さらに, 誤り分析により, 偽陽性と偽陰性の両方を減少させる活性およびハイブリッド戦略が示された。
本研究は, 持続的都市計画を強化するため, 拡張性, アノテーション効率のよい都市樹図作成のためのマルチモーダルアプローチとガイド付きアノテーションの重要性を強調した。
関連論文リスト
- Learning to Explore: Policy-Guided Outlier Synthesis for Graph Out-of-Distribution Detection [51.93878677594561]
教師なしグラフレベルのOOD検出では、モデルは通常、IDデータのみを使用して訓練される。
本稿では,スタティックスを学習した探索戦略に置き換える政策誘導型アウトリア合成フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-28T11:40:18Z) - Habitat Classification from Ground-Level Imagery Using Deep Neural Networks [1.3408365072149797]
本研究では、現在最先端の深層ニューラルネットワークアーキテクチャを地上レベルの生息地画像に適用する。
我々は、畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)の2つのモデルのファミリーを評価する。
我々の結果は、ViTsがキー分類基準の最先端CNNベースラインを一貫して上回っていることを示している。
論文 参考訳(メタデータ) (2025-07-05T12:07:13Z) - Landslide Detection and Mapping Using Deep Learning Across Multi-Source Satellite Data and Geographic Regions [0.0]
地すべりはインフラ、経済、生活に深刻な脅威をもたらす。
深層学習とリモートセンシングの進歩により、自動地すべり検出がますます効果的になっている。
本研究では,多ソース衛星画像と深層学習モデルを統合し,地すべりの識別と予測を強化する包括的アプローチを提案する。
論文 参考訳(メタデータ) (2025-07-01T18:34:42Z) - Data Augmentation and Resolution Enhancement using GANs and Diffusion Models for Tree Segmentation [49.13393683126712]
都市森林は、環境の質を高め、都市における生物多様性を支援する上で重要な役割を担っている。
複雑な地形と異なる衛星センサーやUAV飛行高度による画像解像度の変化により、正確に木を検知することは困難である。
低解像度空中画像の品質を高めるため,GANと拡散モデルとドメイン適応を統合した新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2025-05-21T03:57:10Z) - ACTRESS: Active Retraining for Semi-supervised Visual Grounding [52.08834188447851]
前回の研究であるRefTeacherは、疑似自信と注意に基づく監督を提供するために教師学生の枠組みを採用することで、この課題に取り組むための最初の試みである。
このアプローチは、Transformerベースのパイプラインに従う現在の最先端のビジュアルグラウンドモデルと互換性がない。
本稿では, ACTRESS を略したセミスーパービジョン視覚グラウンドのためのアクティブ・リトレーニング手法を提案する。
論文 参考訳(メタデータ) (2024-07-03T16:33:31Z) - Towards Efficient Disaster Response via Cost-effective Unbiased Class Rate Estimation through Neyman Allocation Stratified Sampling Active Learning [11.697034536189094]
本稿では,二分分類のためのランダムサンプリング木を構築する革新的なアルゴリズムを提案する。
その結果,本手法は受動的および従来の能動的学習手法を超越していることが判明した。
従来のアクティブな学習戦略における「サンプルバイアス」の課題に効果的に対処する。
論文 参考訳(メタデータ) (2024-05-28T01:34:35Z) - Granularity at Scale: Estimating Neighborhood Socioeconomic Indicators
from High-Resolution Orthographic Imagery and Hybrid Learning [1.8369448205408005]
オーバーヘッド画像は、コミュニティ情報が不足しているギャップを埋めるのに役立つ。
機械学習とコンピュータビジョンの最近の進歩により、画像データのパターンから素早く特徴を抽出し、検出することが可能になった。
本研究では, 人口密度, 中央値世帯所得, 教育達成率の2つのアプローチ, 教師付き畳み込みニューラルネットワークと半教師付きクラスタリングについて検討する。
論文 参考訳(メタデータ) (2023-09-28T19:30:26Z) - View Consistent Purification for Accurate Cross-View Localization [59.48131378244399]
本稿では,屋外ロボットのための微細な自己局在化手法を提案する。
提案手法は,既存のクロスビューローカライゼーション手法の限界に対処する。
これは、動的環境における知覚を増強する初めての疎視のみの手法である。
論文 参考訳(メタデータ) (2023-08-16T02:51:52Z) - Unsupervised Domain Adaptation in Person re-ID via k-Reciprocal
Clustering and Large-Scale Heterogeneous Environment Synthesis [76.46004354572956]
個人再識別のための教師なし領域適応手法を提案する。
実験結果から,ktCUDA法とSHRED法は,再同定性能において,+5.7 mAPの平均的改善を実現することがわかった。
論文 参考訳(メタデータ) (2020-01-14T17:43:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。