論文の概要: Solar Potential Assessment using Multi-Class Buildings Segmentation from
Aerial Images
- arxiv url: http://arxiv.org/abs/2111.11397v1
- Date: Mon, 22 Nov 2021 18:16:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-23 16:11:35.464060
- Title: Solar Potential Assessment using Multi-Class Buildings Segmentation from
Aerial Images
- Title(参考訳): 航空画像からの多層建物セグメンテーションによるソーラーポテンシャル評価
- Authors: Hasan Nasrallah, Abed Ellatif Samhat, Ghaleb Faour, Yilei Shi and Ali
J. Ghandour
- Abstract要約: 出力に余分なクラスを追加することで、インスタンスセグメンテーションタスクに対して完全な畳み込みニューラルネットワークのパワーを利用する。
また,CutMix混合データ拡張とOne-Cycle学習率ポリシが,トレーニングデータに適合するより優れた正規化手法であることを示す。
- 参考スコア(独自算出の注目度): 3.180674374101366
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Semantic Segmentation of buildings present in satellite images using
encoder-decoder like convolutional neural networks is being achieved with
relatively high pixel-wise metric scores. In this paper, we aim to exploit the
power of fully convolutional neural networks for an instance segmentation task
using extra added classes to the output along with the watershed processing
technique to leverage better object-wise metric results. We also show that
CutMix mixed data augmentations and the One-Cycle learning rate policy are
greater regularization methods to achieve a better fit on the training data and
increase performance. Furthermore, Mixed Precision Training provided more
flexibility to experiment with bigger networks and batches while maintaining
stability and convergence during training. We compare and show the effect of
these additional changes throughout our whole pipeline to finally provide a set
a tuned hyper-parameters that are proven to perform better.
- Abstract(参考訳): 畳み込みニューラルネットワークのようなエンコーダデコーダを用いた衛星画像に存在する建物のセマンティックセグメンテーションは、比較的高いピクセル単位のメトリックスコアで達成されている。
本稿では,畳み込み型ニューラルネットワークのインスタンスセグメンテーションタスクのパワーを,出力に余分なクラスを付加し,流域処理手法を活用し,オブジェクト毎のメトリック結果を改善することを目的としている。
また,CutMix混合データ拡張とOne-Cycle学習率ポリシが,トレーニングデータに適合し,性能を向上させるためのより優れた正規化手法であることを示す。
さらに、混合精度トレーニングは、トレーニング中に安定性と収束を維持しながら、より大きなネットワークやバッチで実験するための柔軟性を高めた。
これらの追加変更がパイプライン全体に与える影響を比較して、最終的にパフォーマンスが向上することが証明されたチューニングされたハイパーパラメータセットを提供するようにします。
関連論文リスト
- DynaSeg: A Deep Dynamic Fusion Method for Unsupervised Image Segmentation Incorporating Feature Similarity and Spatial Continuity [0.5755004576310334]
我々は、革新的な教師なしイメージセグメンテーションアプローチであるDynaSegを紹介する。
従来の方法とは異なり、DynaSegは画像の特徴に柔軟に対応する動的重み付け方式を採用している。
DynaSegは、予測されたクラスタ数が1つに収束する可能性のある、過小評価の失敗を防ぐ。
論文 参考訳(メタデータ) (2024-05-09T00:30:45Z) - Rethinking Transformers Pre-training for Multi-Spectral Satellite
Imagery [78.43828998065071]
教師なし学習の最近の進歩は、下流タスクにおける有望な結果を達成するための大きな視覚モデルの可能性を示している。
このような事前学習技術は、大量の未学習データが利用可能であることから、リモートセンシング領域でも最近研究されている。
本稿では,マルチモーダルで効果的に活用されるマルチスケール情報の事前学習と活用について述べる。
論文 参考訳(メタデータ) (2024-03-08T16:18:04Z) - Image edge enhancement for effective image classification [7.470763273994321]
ニューラルネットワークの精度とトレーニング速度を両立させるエッジ拡張に基づく手法を提案する。
我々のアプローチは、利用可能なデータセット内の画像からエッジなどの高周波特徴を抽出し、元の画像と融合させることである。
論文 参考訳(メタデータ) (2024-01-13T10:01:34Z) - Online Convolutional Re-parameterization [51.97831675242173]
2段階のパイプラインであるオンライン畳み込み再パラメータ化(OREPA)は、複雑なトレーニング時間ブロックを単一の畳み込みに絞ることで、巨大なトレーニングオーバーヘッドを低減することを目的としている。
最先端のre-paramモデルと比較して、OREPAはトレーニング時間のメモリコストを約70%削減し、トレーニング速度を約2倍向上させることができる。
また、オブジェクト検出とセマンティックセグメンテーションの実験を行い、下流タスクに一貫した改善を示す。
論文 参考訳(メタデータ) (2022-04-02T09:50:19Z) - Combining Image Features and Patient Metadata to Enhance Transfer
Learning [0.0]
画像特徴のみを用いる場合の分類作業における6つの最先端ディープニューラルネットワークの性能と,これらを患者のメタデータと組み合わせた場合の比較を行った。
以上の結果から,この性能向上はディープネットワークの一般的な特性である可能性が示唆され,他の分野での探索が望まれる。
論文 参考訳(メタデータ) (2021-10-08T15:43:31Z) - Fusion of CNNs and statistical indicators to improve image
classification [65.51757376525798]
畳み込みネットワークは過去10年間、コンピュータビジョンの分野を支配してきた。
この傾向を長引かせる主要な戦略は、ネットワーク規模の拡大によるものだ。
我々は、異種情報ソースを追加することは、より大きなネットワークを構築するよりもCNNにとって費用対効果が高いと仮定している。
論文 参考訳(メタデータ) (2020-12-20T23:24:31Z) - Mixup-Transformer: Dynamic Data Augmentation for NLP Tasks [75.69896269357005]
Mixupは、入力例と対応するラベルを線形に補間する最新のデータ拡張技術である。
本稿では,自然言語処理タスクにmixupを適用する方法について検討する。
我々は、様々なNLPタスクに対して、mixup-transformerと呼ばれる、トランスフォーマーベースの事前学習アーキテクチャにmixupを組み込んだ。
論文 参考訳(メタデータ) (2020-10-05T23:37:30Z) - Memory-efficient training with streaming dimensionality reduction [14.198224213972173]
本稿では,Deep Neural Networkトレーニングのための更新アルゴリズムとして,ストリーミングバッチコンポーネント分析を導入する。
ストリーミングバッチコンポーネント分析により、さまざまな共通データセット上で畳み込みニューラルネットワークを効果的にトレーニングできることが示される。
論文 参考訳(メタデータ) (2020-04-25T02:13:43Z) - Understanding the Effects of Data Parallelism and Sparsity on Neural
Network Training [126.49572353148262]
ニューラルネットワークトレーニングにおける2つの要因として,データ並列性と疎性について検討する。
有望なメリットにもかかわらず、ニューラルネットワークトレーニングに対する彼らの影響を理解することは、依然として明白である。
論文 参考訳(メタデータ) (2020-03-25T10:49:22Z) - Curriculum By Smoothing [52.08553521577014]
畳み込みニューラルネットワーク(CNN)は、画像分類、検出、セグメンテーションなどのコンピュータビジョンタスクにおいて顕著な性能を示している。
アンチエイリアスフィルタやローパスフィルタを用いてCNNの機能埋め込みを円滑化するエレガントなカリキュラムベースのスキームを提案する。
トレーニング中に特徴マップ内の情報量が増加するにつれて、ネットワークはデータのより優れた表現を徐々に学習することができる。
論文 参考訳(メタデータ) (2020-03-03T07:27:44Z) - Improving the Resolution of CNN Feature Maps Efficiently with
Multisampling [8.655380837944188]
我々の手法の1つのバージョンはサブサンプリングと呼ばれ、追加のパラメータなしでDenseNetやResNetのような最先端アーキテクチャの精度を大幅に向上させる。
データ拡張の性質について可能な洞察を与え、粗い特徴マップが画像分類におけるニューラルネットワークのパフォーマンスをボトルネックにしていることを実験的に実証する。
論文 参考訳(メタデータ) (2018-05-28T04:29:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。