論文の概要: Enhanced Rooftop Solar Panel Detection by Efficiently Aggregating Local Features
- arxiv url: http://arxiv.org/abs/2501.02840v1
- Date: Mon, 06 Jan 2025 08:36:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-07 17:09:49.432401
- Title: Enhanced Rooftop Solar Panel Detection by Efficiently Aggregating Local Features
- Title(参考訳): 局所的特徴の効率的な集約による屋根上ソーラーパネルの検出
- Authors: Kuldeep Kurte, Kedar Kulkarni,
- Abstract要約: 衛星画像を用いた屋上太陽光発電パネル検出手法を改良したCNN(Convolutional Neural Network)を提案する。
本稿では,屋根面の局所的な畳み込み特徴を抽出するために,事前学習したCNNモデルを提案する。
これらのローカル機能は、屋上レベルのグローバルな特徴を得るために、Vectors of Locally Aggregated Descriptors (VLAD)技術を使って結合される。
- 参考スコア(独自算出の注目度): 0.07366405857677226
- License:
- Abstract: In this paper, we present an enhanced Convolutional Neural Network (CNN)-based rooftop solar photovoltaic (PV) panel detection approach using satellite images. We propose to use pre-trained CNN-based model to extract the local convolutional features of rooftops. These local features are then combined using the Vectors of Locally Aggregated Descriptors (VLAD) technique to obtain rooftop-level global features, which are then used to train traditional Machine Learning (ML) models to identify rooftop images that do and do not contain PV panels. On the dataset used in this study, the proposed approach achieved rooftop-PV classification scores exceeding the predefined threshold of 0.9 across all three cities for each of the feature extractor networks evaluated. Moreover, we propose a 3-phase approach to enable efficient utilization of the previously trained models on a new city or region with limited labelled data. We illustrate the effectiveness of this 3-phase approach for multi-city rooftop-PV detection task.
- Abstract(参考訳): 本稿では,衛星画像を用いた屋上太陽光発電パネル検出手法について述べる。
本稿では,屋根面の局所的な畳み込み特徴を抽出するために,事前学習したCNNモデルを提案する。
これらのローカル機能は、Vectors of Locally Aggregated Descriptors(VLAD)技術を使用して、屋上レベルのグローバル機能を取得し、従来の機械学習(ML)モデルをトレーニングして、PVパネルを含まない屋上イメージを特定するために使用される。
提案手法は, 提案手法を用いて, 屋上PV分類スコアを, 特徴抽出器ネットワークの評価を行った3つの都市で, 0.9のしきい値を超える結果を得た。
さらに,ラベル付きデータしか持たない新都市や地域において,事前訓練したモデルを効率的に活用するための3段階のアプローチを提案する。
マルチシティー屋上PV検出作業におけるこの3相アプローチの有効性について述べる。
関連論文リスト
- PVAFN: Point-Voxel Attention Fusion Network with Multi-Pooling Enhancing for 3D Object Detection [59.355022416218624]
点とボクセルの表現の統合は、LiDARベースの3Dオブジェクト検出においてより一般的になりつつある。
PVAFN(Point-Voxel Attention Fusion Network)と呼ばれる新しい2段3次元物体検出器を提案する。
PVAFNはマルチプール戦略を使用して、マルチスケールとリージョン固有の情報を効果的に統合する。
論文 参考訳(メタデータ) (2024-08-26T19:43:01Z) - Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - Background Activation Suppression for Weakly Supervised Object
Localization and Semantic Segmentation [84.62067728093358]
弱教師付きオブジェクトローカライゼーションとセマンティックセグメンテーションは、画像レベルのラベルのみを使用してオブジェクトをローカライズすることを目的としている。
画素レベルのローカライゼーションを実現するために,フォアグラウンド予測マップを生成することで,新たなパラダイムが誕生した。
本稿では,物体の局在化学習過程に関する2つの驚くべき実験結果を示す。
論文 参考訳(メタデータ) (2023-09-22T15:44:10Z) - Semi-supervised Learning from Street-View Images and OpenStreetMap for
Automatic Building Height Estimation [59.6553058160943]
本稿では,Mapillary SVIとOpenStreetMapのデータから建物の高さを自動的に推定する半教師付き学習(SSL)手法を提案する。
提案手法は, 平均絶対誤差(MAE)が約2.1mである建物の高さを推定する上で, 明らかな性能向上につながる。
予備結果は,低コストなVGIデータに基づく提案手法のスケールアップに向けた今後の取り組みを期待し,動機づけるものである。
論文 参考訳(メタデータ) (2023-07-05T18:16:30Z) - Learning to Generate 3D Representations of Building Roofs Using
Single-View Aerial Imagery [68.3565370706598]
本研究では,空撮画像から建物屋根メッシュの条件分布を学習するための新しいパイプラインを提案する。
同一物体の複数の画像を必要とする代替手法とは違って,本手法では,一つの画像のみを用いて予測を行う3次元屋根メッシュを推定できる。
論文 参考訳(メタデータ) (2023-03-20T15:47:05Z) - Cross-layer Attention Network for Fine-grained Visual Categorization [12.249254142531381]
微妙な局部的詳細のための離散表現の学習は、きめ細かい視覚分類(FGVC)において重要な役割を果たす
提案するクロス層注意ネットワーク(CLAN)により,中間層特徴写像と上位層特徴写像の相互改善機構を構築する。
実験結果から,本手法は3つの一般公開された微粒化認識データセットの最先端化を図っている。
論文 参考訳(メタデータ) (2022-10-17T06:57:51Z) - SphereVLAD++: Attention-based and Signal-enhanced Viewpoint Invariant
Descriptor [6.326554177747699]
SphereVLAD++ は注目度が高められた視点不変位置認識手法である。
SphereVLAD++は、小さな視点や完全に逆の視点差の下で、最先端の3D位置認識手法をすべて上回ることを示す。
論文 参考訳(メタデータ) (2022-07-06T20:32:43Z) - Vegetation Stratum Occupancy Prediction from Airborne LiDAR 3D Point
Clouds [5.7047887413125276]
本研究では,空中プラットフォームから取得した3次元点雲から植生成層域の占有度を推定する新しい深層学習手法を提案する。
我々のネットワークは、ピクセルワイドやポイントワイドアノテーションよりも簡単に生成できる円筒状のプロットに集約された値で重畳されている。
本手法は,視覚的および解釈可能な予測を同時に提供しながら,手工芸と深層学習のベースラインを精度で上回る。
論文 参考訳(メタデータ) (2021-12-27T09:33:08Z) - PC-RGNN: Point Cloud Completion and Graph Neural Network for 3D Object
Detection [57.49788100647103]
LiDARベースの3Dオブジェクト検出は、自動運転にとって重要なタスクです。
現在のアプローチでは、遠方および閉ざされた物体の偏りと部分的な点雲に苦しむ。
本稿では,この課題を2つの解決法で解決する新しい二段階アプローチ,pc-rgnnを提案する。
論文 参考訳(メタデータ) (2020-12-18T18:06:43Z) - A Nearest Neighbor Network to Extract Digital Terrain Models from 3D
Point Clouds [1.6249267147413524]
本稿では,3Dポイントのクラウド上で動作し,エンド・ツー・エンドのアプローチを用いてシーンの基盤となるDTMを推定するアルゴリズムを提案する。
我々のモデルは近隣情報を学習し、これをポイントワイドでブロックワイドなグローバルな特徴とシームレスに統合する。
論文 参考訳(メタデータ) (2020-05-21T15:54:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。