論文の概要: KeepOriginalAugment: Single Image-based Better Information-Preserving Data Augmentation Approach
- arxiv url: http://arxiv.org/abs/2405.06354v1
- Date: Fri, 10 May 2024 09:37:36 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-13 16:07:56.579530
- Title: KeepOriginalAugment: Single Image-based Better Information-Preserving Data Augmentation Approach
- Title(参考訳): KeepOriginal Augment: 単一イメージベースの優れた情報保存データ拡張アプローチ
- Authors: Teerath Kumar, Alessandra Mileo, Malika Bendechache,
- Abstract要約: 高度な画像データ拡張技術は、多様なコンピュータビジョンタスクのためのモデルのトレーニングを強化する上で重要な役割を果たす。
本研究では,新しいデータ拡張手法であるKeepOriginalAugmentを紹介する。
データの多様性と情報保存のバランスを保ちながら、KeepOriginalAugmentはモデルが多様な正当性と非正当性の両方を活用することを可能にする。
- 参考スコア(独自算出の注目度): 46.74201905814679
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Advanced image data augmentation techniques play a pivotal role in enhancing the training of models for diverse computer vision tasks. Notably, SalfMix and KeepAugment have emerged as popular strategies, showcasing their efficacy in boosting model performance. However, SalfMix reliance on duplicating salient features poses a risk of overfitting, potentially compromising the model's generalization capabilities. Conversely, KeepAugment, which selectively preserves salient regions and augments non-salient ones, introduces a domain shift that hinders the exchange of crucial contextual information, impeding overall model understanding. In response to these challenges, we introduce KeepOriginalAugment, a novel data augmentation approach. This method intelligently incorporates the most salient region within the non-salient area, allowing augmentation to be applied to either region. Striking a balance between data diversity and information preservation, KeepOriginalAugment enables models to leverage both diverse salient and non-salient regions, leading to enhanced performance. We explore three strategies for determining the placement of the salient region minimum, maximum, or random and investigate swapping perspective strategies to decide which part (salient or non-salient) undergoes augmentation. Our experimental evaluations, conducted on classification datasets such as CIFAR-10, CIFAR-100, and TinyImageNet, demonstrate the superior performance of KeepOriginalAugment compared to existing state-of-the-art techniques.
- Abstract(参考訳): 高度な画像データ拡張技術は、多様なコンピュータビジョンタスクのためのモデルのトレーニングを強化する上で重要な役割を果たす。
特に、SalfMixとKeepAugmentは一般的な戦略として登場し、モデルパフォーマンスを向上させる効果を示している。
しかし、SalfMixは有能な機能の重複に頼っているため、過度に適合するリスクがあり、モデルの一般化能力を損なう可能性がある。
逆に、KeepAugmentは、正常なリージョンを選択的に保存し、非正則なリージョンを拡張し、重要なコンテキスト情報の交換を妨げるドメインシフトを導入し、全体的なモデル理解を妨げる。
これらの課題に対応するために、新しいデータ拡張アプローチであるKeepOriginalAugmentを紹介します。
この方法は、非塩分領域内で最も健全な領域をインテリジェントに組み込んでおり、どちらの領域にも拡張が適用できる。
データの多様性と情報保存のバランスを保ちながら、KeepOriginalAugmentは、さまざまな正当性と非正当性の両方をモデルに活用することで、パフォーマンスの向上を実現している。
本研究は, 極小, 最大, ランダムな領域配置を決定するための3つの戦略を探索し, 視点交換戦略を検証し, どちらの部分(塩分, 非塩分)が増大するかを判断する。
CIFAR-10, CIFAR-100, TinyImageNetなどの分類データセットを用いて, 既存の最先端技術と比較して, KeepOriginalAugmentの優れた性能を示した。
関連論文リスト
- Advances in Diffusion Models for Image Data Augmentation: A Review of Methods, Models, Evaluation Metrics and Future Research Directions [6.2719115566879236]
拡散モデル(DM)は画像データ拡張のための強力なツールとして登場した。
DMは、基礎となるデータ分布を学習することで、現実的で多様な画像を生成する。
この分野における現在の課題と今後の研究方向性について論じる。
論文 参考訳(メタデータ) (2024-07-04T18:06:48Z) - Adaptive Affinity-Based Generalization For MRI Imaging Segmentation Across Resource-Limited Settings [1.5703963908242198]
本稿では,適応親和性に基づく蒸留とカーネルベースの蒸留をシームレスに組み合わせた,新しい関係に基づく知識フレームワークを提案する。
革新的アプローチを検証するために,我々は公開されている複数ソースのMRIデータについて実験を行った。
論文 参考訳(メタデータ) (2024-04-03T13:35:51Z) - A Novel Cross-Perturbation for Single Domain Generalization [54.612933105967606]
単一ドメインの一般化は、モデルが単一のソースドメインでトレーニングされたときに未知のドメインに一般化する能力を高めることを目的としている。
トレーニングデータの限られた多様性は、ドメイン不変の特徴の学習を妨げ、結果として一般化性能を損なう。
トレーニングデータの多様性を高めるために,CPerbを提案する。
論文 参考訳(メタデータ) (2023-08-02T03:16:12Z) - ARHNet: Adaptive Region Harmonization for Lesion-aware Augmentation to
Improve Segmentation Performance [61.04246102067351]
本研究では,合成画像をよりリアルに見せるために,前景調和フレームワーク(ARHNet)を提案する。
実画像と合成画像を用いたセグメンテーション性能の向上に本手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-07-02T10:39:29Z) - Local Magnification for Data and Feature Augmentation [53.04028225837681]
LOMA(Local Magnification)と呼ばれる,実装が容易かつモデルフリーなデータ拡張手法を提案する。
LOMAは、画像の局所領域をランダムに拡大することにより、追加のトレーニングデータを生成する。
実験の結果,提案するLOMAと標準データ拡張を組み合わせることで,画像分類や物体検出の性能を大幅に向上させることができることがわかった。
論文 参考訳(メタデータ) (2022-11-15T02:51:59Z) - Learning Diversified Feature Representations for Facial Expression
Recognition in the Wild [97.14064057840089]
本稿では,CNN層が抽出した顔表情認識アーキテクチャの特徴を多様化する機構を提案する。
AffectNet,FER+,RAF-DBの3つの顔表情認識実験の結果,本手法の有効性が示された。
論文 参考訳(メタデータ) (2022-10-17T19:25:28Z) - KeepAugment: A Simple Information-Preserving Data Augmentation Approach [42.164438736772134]
本稿では,強調画像の忠実度を高めるために,emphKeepAugmentと呼ばれるシンプルかつ高効率なアプローチを提案する。
このアイデアはまず、元の画像上の重要な領域を検出し、拡張中にこれらの情報的領域を保存するために、サリエンシマップを使用する。
実験により,提案手法は,先行技術データ拡張方式において著しく改善されていることを示す。
論文 参考訳(メタデータ) (2020-11-23T22:43:04Z) - Contextual Fusion For Adversarial Robustness [0.0]
ディープニューラルネットワークは、通常、1つの特定の情報ストリームを処理し、様々な種類の敵の摂動に影響を受けやすいように設計されている。
そこで我々はPlaces-CNNとImagenet-CNNから並列に抽出した背景特徴と前景特徴を組み合わせた融合モデルを開発した。
グラデーションをベースとした攻撃では,フュージョンは乱れのないデータの性能を低下させることなく,分類の大幅な改善を可能にする。
論文 参考訳(メタデータ) (2020-11-18T20:13:23Z) - The Many Faces of Robustness: A Critical Analysis of Out-of-Distribution
Generalization [64.61630743818024]
画像スタイルの変化,画像のぼやけ度,地理的位置,カメラ操作などの4つの新しい現実分布シフトデータセットを導入する。
より大規模なモデルと人工的なデータ拡張を用いることで,先行研究の主張に反して,実世界の分散シフトの堅牢性を向上させることができることがわかった。
また,1000倍のラベル付きデータで事前訓練されたモデルに対して,最先端のモデルと性能を向上する新たなデータ拡張手法を提案する。
論文 参考訳(メタデータ) (2020-06-29T17:59:10Z) - DeshuffleGAN: A Self-Supervised GAN to Improve Structure Learning [0.0]
我々は、GAN性能を改善する上で重要なポイントの1つは、データ内の空間構造を学習する能力を備えたモデルを提供することであると主張している。
ランダムにシャッフルされた画像タイルのパズルを解くデシャッフルタスクを導入し、デシャッフルGANが空間構造と現実的な外観の表現能力を向上させるのに役立つ。
論文 参考訳(メタデータ) (2020-06-15T19:06:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。