論文の概要: Object-Based Augmentation Improves Quality of Remote SensingSemantic
Segmentation
- arxiv url: http://arxiv.org/abs/2105.05516v1
- Date: Wed, 12 May 2021 08:54:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-13 12:23:28.808054
- Title: Object-Based Augmentation Improves Quality of Remote SensingSemantic
Segmentation
- Title(参考訳): オブジェクトベースの拡張はリモートセンシングセマンティックセマンティックセグメンテーションの品質を改善する
- Authors: Svetlana Illarionova, Sergey Nesteruk, Dmitrii Shadrin, Vladimir
Ignatiev, Mariia Pukalchik, Ivan Oseledets
- Abstract要約: 本研究では,オブジェクトベース拡張の開発とテストに焦点をあてる。
本研究では,トレーニングサンプル数を大幅に増加させるジオリファレンス画像拡張のための新しいパイプラインを提案する。
提示されたパイプラインはオブジェクトベースの拡張(OBA)と呼ばれ、オブジェクトのセグメンテーションマスクを利用して新しい現実的なトレーニングシーンを生成します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Today deep convolutional neural networks (CNNs) push the limits for most
computer vision problems, define trends, and set state-of-the-art results. In
remote sensing tasks such as object detection and semantic segmentation, CNNs
reach the SotA performance. However, for precise performance, CNNs require much
high-quality training data. Rare objects and the variability of environmental
conditions strongly affect prediction stability and accuracy. To overcome these
data restrictions, it is common to consider various approaches including data
augmentation techniques. This study focuses on the development and testing of
object-based augmentation. The practical usefulness of the developed
augmentation technique is shown in the remote sensing domain, being one of the
most demanded ineffective augmentation techniques. We propose a novel pipeline
for georeferenced image augmentation that enables a significant increase in the
number of training samples. The presented pipeline is called object-based
augmentation (OBA) and exploits objects' segmentation masks to produce new
realistic training scenes using target objects and various label-free
backgrounds. We test the approach on the buildings segmentation dataset with
six different CNN architectures and show that the proposed method benefits for
all the tested models. We also show that further augmentation strategy
optimization can improve the results. The proposed method leads to the
meaningful improvement of U-Net model predictions from 0.78 to 0.83 F1-score.
- Abstract(参考訳): 今日、ディープ畳み込みニューラルネットワーク(CNN)は、ほとんどのコンピュータビジョン問題の限界を押し上げ、トレンドを定義し、最先端の結果を設定する。
オブジェクト検出やセマンティックセグメンテーションなどのリモートセンシングタスクでは、CNNはSotAのパフォーマンスに達する。
しかし、正確な性能を得るためには、CNNは高い品質のトレーニングデータを必要とする。
希少物体と環境条件の変動は予測安定性と精度に強く影響を及ぼす。
これらのデータ制限を克服するために、データ拡張技術を含む様々なアプローチを検討することが一般的である。
本研究では,オブジェクトベース拡張の開発とテストに焦点をあてる。
この手法の実用性はリモートセンシング領域で示され、最も要求された非効率的な拡張技術の一つである。
本研究では,トレーニングサンプル数を大幅に増加させるジオリファレンス画像拡張のための新しいパイプラインを提案する。
提示されたパイプラインはオブジェクトベースの拡張(OBA)と呼ばれ、オブジェクトのセグメンテーションマスクを利用して、ターゲットオブジェクトとさまざまなラベルのないバックグラウンドを使用して、新しいリアルなトレーニングシーンを生成する。
6つの異なるCNNアーキテクチャを用いたビルディングセグメンテーションデータセットのアプローチを検証し、提案手法が全テストモデルに有効であることを示す。
また,さらなる強化戦略の最適化により,結果が向上することを示す。
提案手法はU-Netモデル予測を0.78から0.83F1スコアに有意義に改善する。
関連論文リスト
- SIRST-5K: Exploring Massive Negatives Synthesis with Self-supervised
Learning for Robust Infrared Small Target Detection [53.19618419772467]
単一フレーム赤外線小ターゲット検出(SIRST)は、乱雑な背景から小さなターゲットを認識することを目的としている。
Transformerの開発に伴い、SIRSTモデルのスケールは常に増大している。
赤外線小ターゲットデータの多彩な多様性により,本アルゴリズムはモデル性能と収束速度を大幅に改善する。
論文 参考訳(メタデータ) (2024-03-08T16:14:54Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Robustifying Deep Vision Models Through Shape Sensitization [19.118696557797957]
そこで本研究では,ネットワークの全体像を学習するためのインセンティブを明示的に付与する,シンプルで軽量な対向拡張手法を提案する。
我々の拡張は、ランダムに決定された混合比を用いて、シャッフルパッチで、ある画像から別の画像へのエッジマップを重畳する。
この拡張により,データセットやニューラルアーキテクチャの分類精度とロバストネスが大幅に向上することを示す。
論文 参考訳(メタデータ) (2022-11-14T11:17:46Z) - Exploring Data Aggregation and Transformations to Generalize across
Visual Domains [0.0]
この論文は、ドメイン一般化(DG)、ドメイン適応(DA)およびそれらのバリエーションの研究に寄与する。
本稿では,機能集約戦略と視覚変換を利用するドメイン一般化とドメイン適応の新しいフレームワークを提案する。
提案手法が確立したDGおよびDAベンチマークにおいて,最先端の競争的アプローチよりも優れていることを示す。
論文 参考訳(メタデータ) (2021-08-20T14:58:14Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - Retrieval Augmentation to Improve Robustness and Interpretability of
Deep Neural Networks [3.0410237490041805]
本研究では,深層ニューラルネットワークの堅牢性と解釈性を改善するために,トレーニングデータを積極的に活用する。
具体的には、LSTMモデルのメモリ状態を初期化したり、注意機構を誘導するために、最も近い入力例のターゲットを用いる。
その結果,Flickr8 と IMDB の2つのタスクに対して提案したモデルの有効性が示された。
論文 参考訳(メタデータ) (2021-02-25T17:38:31Z) - Fusion of CNNs and statistical indicators to improve image
classification [65.51757376525798]
畳み込みネットワークは過去10年間、コンピュータビジョンの分野を支配してきた。
この傾向を長引かせる主要な戦略は、ネットワーク規模の拡大によるものだ。
我々は、異種情報ソースを追加することは、より大きなネットワークを構築するよりもCNNにとって費用対効果が高いと仮定している。
論文 参考訳(メタデータ) (2020-12-20T23:24:31Z) - Improving the Performance of Fine-Grain Image Classifiers via Generative
Data Augmentation [0.5161531917413706]
我々は、ロバスト生成アドリアルネットワーク(DAPPER GAN)の熟練した事前学習からデータ拡張を開発する。
DAPPER GANは、トレーニングイメージの新しいビューを自動的に生成するML分析支援ツールである。
本手法をStanford Carsデータセット上で実験的に評価し,車体形状とモデル分類精度の向上を実証した。
論文 参考訳(メタデータ) (2020-08-12T15:29:11Z) - Regularizing Deep Networks with Semantic Data Augmentation [44.53483945155832]
従来の手法を補完する新しい意味データ拡張アルゴリズムを提案する。
提案手法はディープネットワークが線形化特徴の学習に有効であるという興味深い性質に着想を得たものである。
提案した暗黙的セマンティックデータ拡張(ISDA)アルゴリズムは,新たなロバストCE損失を最小限に抑える。
論文 参考訳(メタデータ) (2020-07-21T00:32:44Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z) - Diversity inducing Information Bottleneck in Model Ensembles [73.80615604822435]
本稿では,予測の多様性を奨励することで,ニューラルネットワークの効果的なアンサンブルを生成する問題をターゲットにする。
そこで本研究では,潜伏変数の学習における逆損失の多様性を明示的に最適化し,マルチモーダルデータのモデリングに必要な出力予測の多様性を得る。
最も競争力のあるベースラインと比較して、データ分布の変化の下で、分類精度が大幅に向上した。
論文 参考訳(メタデータ) (2020-03-10T03:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。