論文の概要: Object-Based Augmentation Improves Quality of Remote SensingSemantic
Segmentation
- arxiv url: http://arxiv.org/abs/2105.05516v1
- Date: Wed, 12 May 2021 08:54:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-13 12:23:28.808054
- Title: Object-Based Augmentation Improves Quality of Remote SensingSemantic
Segmentation
- Title(参考訳): オブジェクトベースの拡張はリモートセンシングセマンティックセマンティックセグメンテーションの品質を改善する
- Authors: Svetlana Illarionova, Sergey Nesteruk, Dmitrii Shadrin, Vladimir
Ignatiev, Mariia Pukalchik, Ivan Oseledets
- Abstract要約: 本研究では,オブジェクトベース拡張の開発とテストに焦点をあてる。
本研究では,トレーニングサンプル数を大幅に増加させるジオリファレンス画像拡張のための新しいパイプラインを提案する。
提示されたパイプラインはオブジェクトベースの拡張(OBA)と呼ばれ、オブジェクトのセグメンテーションマスクを利用して新しい現実的なトレーニングシーンを生成します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Today deep convolutional neural networks (CNNs) push the limits for most
computer vision problems, define trends, and set state-of-the-art results. In
remote sensing tasks such as object detection and semantic segmentation, CNNs
reach the SotA performance. However, for precise performance, CNNs require much
high-quality training data. Rare objects and the variability of environmental
conditions strongly affect prediction stability and accuracy. To overcome these
data restrictions, it is common to consider various approaches including data
augmentation techniques. This study focuses on the development and testing of
object-based augmentation. The practical usefulness of the developed
augmentation technique is shown in the remote sensing domain, being one of the
most demanded ineffective augmentation techniques. We propose a novel pipeline
for georeferenced image augmentation that enables a significant increase in the
number of training samples. The presented pipeline is called object-based
augmentation (OBA) and exploits objects' segmentation masks to produce new
realistic training scenes using target objects and various label-free
backgrounds. We test the approach on the buildings segmentation dataset with
six different CNN architectures and show that the proposed method benefits for
all the tested models. We also show that further augmentation strategy
optimization can improve the results. The proposed method leads to the
meaningful improvement of U-Net model predictions from 0.78 to 0.83 F1-score.
- Abstract(参考訳): 今日、ディープ畳み込みニューラルネットワーク(CNN)は、ほとんどのコンピュータビジョン問題の限界を押し上げ、トレンドを定義し、最先端の結果を設定する。
オブジェクト検出やセマンティックセグメンテーションなどのリモートセンシングタスクでは、CNNはSotAのパフォーマンスに達する。
しかし、正確な性能を得るためには、CNNは高い品質のトレーニングデータを必要とする。
希少物体と環境条件の変動は予測安定性と精度に強く影響を及ぼす。
これらのデータ制限を克服するために、データ拡張技術を含む様々なアプローチを検討することが一般的である。
本研究では,オブジェクトベース拡張の開発とテストに焦点をあてる。
この手法の実用性はリモートセンシング領域で示され、最も要求された非効率的な拡張技術の一つである。
本研究では,トレーニングサンプル数を大幅に増加させるジオリファレンス画像拡張のための新しいパイプラインを提案する。
提示されたパイプラインはオブジェクトベースの拡張(OBA)と呼ばれ、オブジェクトのセグメンテーションマスクを利用して、ターゲットオブジェクトとさまざまなラベルのないバックグラウンドを使用して、新しいリアルなトレーニングシーンを生成する。
6つの異なるCNNアーキテクチャを用いたビルディングセグメンテーションデータセットのアプローチを検証し、提案手法が全テストモデルに有効であることを示す。
また,さらなる強化戦略の最適化により,結果が向上することを示す。
提案手法はU-Netモデル予測を0.78から0.83F1スコアに有意義に改善する。
関連論文リスト
- How Important are Data Augmentations to Close the Domain Gap for Object Detection in Orbit? [15.550663626482903]
宇宙空間におけるコンピュータビジョンの領域ギャップを埋めるためのデータ拡張の有効性について検討する。
本稿では,軌道画像に観察される視覚効果をエミュレートするために開発された2つの新しいデータ拡張法を提案する。
論文 参考訳(メタデータ) (2024-10-21T08:24:46Z) - Adaptive Masking Enhances Visual Grounding [12.793586888511978]
ローショット学習シナリオにおける語彙接地を改善するために,ガウス放射変調を用いた画像解釈型マスキングを提案する。
我々はCOCOやODinWを含むベンチマークデータセットに対するアプローチの有効性を評価し、ゼロショットタスクや少数ショットタスクにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2024-10-04T05:48:02Z) - A Simple Background Augmentation Method for Object Detection with Diffusion Model [53.32935683257045]
コンピュータビジョンでは、データの多様性の欠如がモデル性能を損なうことはよく知られている。
本稿では, 生成モデルの進歩を生かして, 単純かつ効果的なデータ拡張手法を提案する。
背景強化は、特にモデルの堅牢性と一般化能力を大幅に改善する。
論文 参考訳(メタデータ) (2024-08-01T07:40:00Z) - SIRST-5K: Exploring Massive Negatives Synthesis with Self-supervised
Learning for Robust Infrared Small Target Detection [53.19618419772467]
単一フレーム赤外線小ターゲット検出(SIRST)は、乱雑な背景から小さなターゲットを認識することを目的としている。
Transformerの開発に伴い、SIRSTモデルのスケールは常に増大している。
赤外線小ターゲットデータの多彩な多様性により,本アルゴリズムはモデル性能と収束速度を大幅に改善する。
論文 参考訳(メタデータ) (2024-03-08T16:14:54Z) - SeiT++: Masked Token Modeling Improves Storage-efficient Training [36.95646819348317]
近年のDeep Neural Network(DNN)モデルでは,コンピュータビジョンタスクのパフォーマンスが大幅に向上している。
高度に一般化可能で高性能なビジョンモデルを実現するには、拡張データセットが必要である。
SeiTによる最近のブレークスルーは、Vector-Quantized (VQ)特徴ベクトル(トークン)を視覚分類のためのネットワーク入力として使用することを提案した。
本稿では,自己指導型事前学習のためのMasked Token Modeling (MTM)を統合し,SeyTを拡張した。
論文 参考訳(メタデータ) (2023-12-15T04:11:34Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - Fusion of CNNs and statistical indicators to improve image
classification [65.51757376525798]
畳み込みネットワークは過去10年間、コンピュータビジョンの分野を支配してきた。
この傾向を長引かせる主要な戦略は、ネットワーク規模の拡大によるものだ。
我々は、異種情報ソースを追加することは、より大きなネットワークを構築するよりもCNNにとって費用対効果が高いと仮定している。
論文 参考訳(メタデータ) (2020-12-20T23:24:31Z) - Improving the Performance of Fine-Grain Image Classifiers via Generative
Data Augmentation [0.5161531917413706]
我々は、ロバスト生成アドリアルネットワーク(DAPPER GAN)の熟練した事前学習からデータ拡張を開発する。
DAPPER GANは、トレーニングイメージの新しいビューを自動的に生成するML分析支援ツールである。
本手法をStanford Carsデータセット上で実験的に評価し,車体形状とモデル分類精度の向上を実証した。
論文 参考訳(メタデータ) (2020-08-12T15:29:11Z) - Diversity inducing Information Bottleneck in Model Ensembles [73.80615604822435]
本稿では,予測の多様性を奨励することで,ニューラルネットワークの効果的なアンサンブルを生成する問題をターゲットにする。
そこで本研究では,潜伏変数の学習における逆損失の多様性を明示的に最適化し,マルチモーダルデータのモデリングに必要な出力予測の多様性を得る。
最も競争力のあるベースラインと比較して、データ分布の変化の下で、分類精度が大幅に向上した。
論文 参考訳(メタデータ) (2020-03-10T03:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。