論文の概要: Centralized Copy-Paste: Enhanced Data Augmentation Strategy for Wildland Fire Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2507.06321v1
- Date: Tue, 08 Jul 2025 18:17:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-10 17:37:43.355812
- Title: Centralized Copy-Paste: Enhanced Data Augmentation Strategy for Wildland Fire Semantic Segmentation
- Title(参考訳): 集中型コピーペースト:森林火災セマンティックセマンティックセグメンテーションのためのデータ強化戦略
- Authors: Joon Tai Kim, Tianle Chen, Ziyu Dong, Nishanth Kunchala, Alexander Guller, Daniel Ospina Acero, Roger Williams, Mrinal Kumar,
- Abstract要約: 本稿では,深層学習型マルチクラスセグメンテーションモデルのトレーニングを支援するために,Copy-Paste Data Augmentation (CCPDA)法を提案する。
CCPDAには3つの主要なステップがある: (i) 原画像中の火のクラスターを識別し、 (ii) 火の領域のコアに集中するために集中化技術を適用し、 (iii) 精製した火のクラスターを目標画像に貼り付ける。
この拡張手法の有効性は, 数値解析と他の拡張手法との比較によって実証される。
- 参考スコア(独自算出の注目度): 37.327688766875895
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Collecting and annotating images for the purpose of training segmentation models is often cost prohibitive. In the domain of wildland fire science, this challenge is further compounded by the scarcity of reliable public datasets with labeled ground truth. This paper presents the Centralized Copy-Paste Data Augmentation (CCPDA) method, for the purpose of assisting with the training of deep-learning multiclass segmentation models, with special focus on improving segmentation outcomes for the fire-class. CCPDA has three main steps: (i) identify fire clusters in the source image, (ii) apply a centralization technique to focus on the core of the fire area, and (iii) paste the refined fire clusters onto a target image. This method increases dataset diversity while preserving the essential characteristics of the fire class. The effectiveness of this augmentation technique is demonstrated via numerical analysis and comparison against various other augmentation methods using a weighted sum-based multi-objective optimization approach. This approach helps elevate segmentation performance metrics specific to the fire class, which carries significantly more operational significance than other classes (fuel, ash, or background). Numerical performance assessment validates the efficacy of the presented CCPDA method in alleviating the difficulties associated with small, manually labeled training datasets. It also illustrates that CCPDA outperforms other augmentation strategies in the application scenario considered, particularly in improving fire-class segmentation performance.
- Abstract(参考訳): セグメンテーションモデルのトレーニングを目的とした画像の収集と注釈付けは、しばしば費用がかかる。
森林火災科学の分野において、この課題は、信頼できる公共データセットの不足によってさらに複雑化されている。
本稿では, 深層学習型マルチクラスセグメンテーションモデルの訓練を支援するために, 集中型コピー・ペーストデータ拡張(CCPDA)法を提案する。
CCPDAには3つの主要なステップがある。
i) 原画像中の火災群を識別する。
(二)集中化技術を適用して消防署の中核に焦点を合わせ、
三 精製した火団を対象画像に貼り付けること。
本手法は, 火災クラスの本質的特徴を保ちながら, データセットの多様性を向上させる。
本手法の有効性は, 加重和に基づく多目的最適化手法を用いて, その他の拡張法との比較と数値解析により実証される。
このアプローチは、他のクラス(燃料、灰、バックグラウンド)よりもはるかに運用上の重要性を持つファイアクラス固有のセグメンテーションパフォーマンスメトリクスを向上するのに役立つ。
数値的性能評価は,手動でラベル付けした小さなトレーニングデータセットの難易度を緩和するCCPDA法の有効性を検証した。
また、CCPDAは、特にファイアクラスセグメンテーション性能の改善において、アプリケーションシナリオにおける他の拡張戦略よりも優れています。
関連論文リスト
- Attention-guided Feature Distillation for Semantic Segmentation [8.344263189293578]
本稿では,改良された特徴写像を用いて注目を伝達するための簡易かつ強力な手法の有効性を示す。
CBAM(Convolutional Block Attention Module)を用いたAttnFD(AttnFD)法の提案
これはPascalVoc 2012、Cityscapes、COCO、CamVidデータセット上の学生ネットワークの平均的相互接続(mIoU)を改善するという観点から、最先端の結果を達成する。
論文 参考訳(メタデータ) (2024-03-08T16:57:47Z) - Data Augmentation for Traffic Classification [54.92823760790628]
Data Augmentation (DA) はコンピュータビジョン(CV)と自然言語処理(NLP)に広く採用されている技術である。
DAはネットワークのコンテキスト、特にトラフィック分類(TC)タスクにおいて、牽引力を得るのに苦労しています。
論文 参考訳(メタデータ) (2024-01-19T15:25:09Z) - Robust Burned Area Delineation through Multitask Learning [1.1470070927586018]
森林火災はその頻度と重大さの増大のために重大な課題を提起してきた。
バイナリセグメンテーションモデルに依存する従来のアプローチは、堅牢で正確な結果を達成するのに苦労することが多い。
本稿では,土地被覆分類を補助課題として組み込んだマルチタスク学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-15T12:49:17Z) - Joint Optimization of Class-Specific Training- and Test-Time Data
Augmentation in Segmentation [35.41274775082237]
本稿では,医用画像セグメンテーションのための有効で汎用的なデータ拡張フレームワークを提案する。
我々は、学習データと検証データの分布を整合させるために、計算効率が高く、データ効率のよい勾配に基づくメタラーニング手法を採用する。
本稿では,DeepMedic と nnU-Net の2つの最先端セグメンテーションモデルを用いた4つの医用画像セグメンテーション課題に対する提案手法の有効性を示す。
論文 参考訳(メタデータ) (2023-05-30T14:48:45Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - Towards Fair Cross-Domain Adaptation via Generative Learning [50.76694500782927]
ドメイン適応(DA)は、よくラベル付けされたソースドメイン上でトレーニングされたモデルを、異なる分散に横たわる未ラベルのターゲットドメインに適応することを目的としています。
本研究では,新規な生成的Few-shot Cross-Domain Adaptation (GFCA) アルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-03-04T23:25:09Z) - Towards High Performance Human Keypoint Detection [87.1034745775229]
文脈情報は人体構成や見えないキーポイントを推論する上で重要な役割を担っている。
そこで我々は,空間とチャネルのコンテキスト情報を効率的に統合するカスケードコンテキストミキサー(CCM)を提案する。
CCMの表現能力を最大化するために、我々は、強陰性な人検出マイニング戦略と共同訓練戦略を開発する。
検出精度を向上させるために,キーポイント予測を後処理するためのいくつかのサブピクセル改良手法を提案する。
論文 参考訳(メタデータ) (2020-02-03T02:24:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。