論文の概要: KeepOriginalAugment: Single Image-based Better Information-Preserving Data Augmentation Approach
- arxiv url: http://arxiv.org/abs/2405.06354v1
- Date: Fri, 10 May 2024 09:37:36 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-13 16:07:56.579530
- Title: KeepOriginalAugment: Single Image-based Better Information-Preserving Data Augmentation Approach
- Title(参考訳): KeepOriginal Augment: 単一イメージベースの優れた情報保存データ拡張アプローチ
- Authors: Teerath Kumar, Alessandra Mileo, Malika Bendechache,
- Abstract要約: 高度な画像データ拡張技術は、多様なコンピュータビジョンタスクのためのモデルのトレーニングを強化する上で重要な役割を果たす。
本研究では,新しいデータ拡張手法であるKeepOriginalAugmentを紹介する。
データの多様性と情報保存のバランスを保ちながら、KeepOriginalAugmentはモデルが多様な正当性と非正当性の両方を活用することを可能にする。
- 参考スコア(独自算出の注目度): 46.74201905814679
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Advanced image data augmentation techniques play a pivotal role in enhancing the training of models for diverse computer vision tasks. Notably, SalfMix and KeepAugment have emerged as popular strategies, showcasing their efficacy in boosting model performance. However, SalfMix reliance on duplicating salient features poses a risk of overfitting, potentially compromising the model's generalization capabilities. Conversely, KeepAugment, which selectively preserves salient regions and augments non-salient ones, introduces a domain shift that hinders the exchange of crucial contextual information, impeding overall model understanding. In response to these challenges, we introduce KeepOriginalAugment, a novel data augmentation approach. This method intelligently incorporates the most salient region within the non-salient area, allowing augmentation to be applied to either region. Striking a balance between data diversity and information preservation, KeepOriginalAugment enables models to leverage both diverse salient and non-salient regions, leading to enhanced performance. We explore three strategies for determining the placement of the salient region minimum, maximum, or random and investigate swapping perspective strategies to decide which part (salient or non-salient) undergoes augmentation. Our experimental evaluations, conducted on classification datasets such as CIFAR-10, CIFAR-100, and TinyImageNet, demonstrate the superior performance of KeepOriginalAugment compared to existing state-of-the-art techniques.
- Abstract(参考訳): 高度な画像データ拡張技術は、多様なコンピュータビジョンタスクのためのモデルのトレーニングを強化する上で重要な役割を果たす。
特に、SalfMixとKeepAugmentは一般的な戦略として登場し、モデルパフォーマンスを向上させる効果を示している。
しかし、SalfMixは有能な機能の重複に頼っているため、過度に適合するリスクがあり、モデルの一般化能力を損なう可能性がある。
逆に、KeepAugmentは、正常なリージョンを選択的に保存し、非正則なリージョンを拡張し、重要なコンテキスト情報の交換を妨げるドメインシフトを導入し、全体的なモデル理解を妨げる。
これらの課題に対応するために、新しいデータ拡張アプローチであるKeepOriginalAugmentを紹介します。
この方法は、非塩分領域内で最も健全な領域をインテリジェントに組み込んでおり、どちらの領域にも拡張が適用できる。
データの多様性と情報保存のバランスを保ちながら、KeepOriginalAugmentは、さまざまな正当性と非正当性の両方をモデルに活用することで、パフォーマンスの向上を実現している。
本研究は, 極小, 最大, ランダムな領域配置を決定するための3つの戦略を探索し, 視点交換戦略を検証し, どちらの部分(塩分, 非塩分)が増大するかを判断する。
CIFAR-10, CIFAR-100, TinyImageNetなどの分類データセットを用いて, 既存の最先端技術と比較して, KeepOriginalAugmentの優れた性能を示した。
関連論文リスト
- Where Do We Stand with Implicit Neural Representations? A Technical and Performance Survey [16.89460694470542]
Inlicit Neural Representation (INR) は知識表現のパラダイムとして登場した。
INRは、データを連続的な暗黙の関数としてモデル化するために多層パーセプトロン(MLP)を利用する。
この調査では、アクティベーション機能、位置エンコーディング、統合戦略、ネットワーク構造という4つの重要な領域に分類する明確な分類法を紹介した。
論文 参考訳(メタデータ) (2024-11-06T06:14:24Z) - Saliency-Based diversity and fairness Metric and FaceKeepOriginalAugment: A Novel Approach for Enhancing Fairness and Diversity [46.74201905814679]
我々は、地理、性別、ステレオタイプによるコンピュータビジョンモデルにおける様々な偏見を探索する、FaceKeepOriginalAugmentと呼ばれるKeepOriginalAugment法の拡張を導入する。
データ多様性と情報保存の微妙なバランスを維持することによって、当社のアプローチは、多様な正当性と非正当性の両方を活用するモデルに力を与える。
Flickr Faces HQ(FFHQ)、WIKI、IMDB、Labelled Faces in the Wild(LFW)、UTK Faces、Diverseデータセットなど、さまざまなデータセットのデータセットの多様性を定量化しています。
論文 参考訳(メタデータ) (2024-10-29T13:49:23Z) - Assessing Open-world Forgetting in Generative Image Model Customization [17.219815694562993]
新しいクラスで拡散モデルをカスタマイズすると、しばしば意図しない結果につながり、信頼性を損なう。
本研究は,拡散モデルにおけるオープンワールドの忘れ方に関する総合的研究である。
本稿では,機能的正規化に基づく緩和戦略を提案する。
論文 参考訳(メタデータ) (2024-10-18T03:58:29Z) - Data Augmentation via Latent Diffusion for Saliency Prediction [67.88936624546076]
残差予測モデルはラベル付きデータの限られた多様性と量によって制約される。
本研究では,実世界のシーンの複雑さと変動性を保ちながら,自然画像の編集を行うディープ・サリエンシ・予測のための新しいデータ拡張手法を提案する。
論文 参考訳(メタデータ) (2024-09-11T14:36:24Z) - A Review of Image Retrieval Techniques: Data Augmentation and Adversarial Learning Approaches [0.0]
本稿では,検索性能向上におけるデータ強化と対人学習技術の役割について概説する。
データ拡張は、より多様なトレーニングサンプルを生成し、現実世界のバリエーションをシミュレートし、オーバーフィッティングを減らすことで、モデルの一般化能力と堅牢性を高める。
敵の攻撃と防衛は 訓練中に混乱をもたらす 潜在的な攻撃に対する モデルの堅牢性を改善するために
論文 参考訳(メタデータ) (2024-09-02T12:55:17Z) - A Simple Background Augmentation Method for Object Detection with Diffusion Model [53.32935683257045]
コンピュータビジョンでは、データの多様性の欠如がモデル性能を損なうことはよく知られている。
本稿では, 生成モデルの進歩を生かして, 単純かつ効果的なデータ拡張手法を提案する。
背景強化は、特にモデルの堅牢性と一般化能力を大幅に改善する。
論文 参考訳(メタデータ) (2024-08-01T07:40:00Z) - A Novel Cross-Perturbation for Single Domain Generalization [54.612933105967606]
単一ドメインの一般化は、モデルが単一のソースドメインでトレーニングされたときに未知のドメインに一般化する能力を高めることを目的としている。
トレーニングデータの限られた多様性は、ドメイン不変の特徴の学習を妨げ、結果として一般化性能を損なう。
トレーニングデータの多様性を高めるために,CPerbを提案する。
論文 参考訳(メタデータ) (2023-08-02T03:16:12Z) - The Many Faces of Robustness: A Critical Analysis of Out-of-Distribution
Generalization [64.61630743818024]
画像スタイルの変化,画像のぼやけ度,地理的位置,カメラ操作などの4つの新しい現実分布シフトデータセットを導入する。
より大規模なモデルと人工的なデータ拡張を用いることで,先行研究の主張に反して,実世界の分散シフトの堅牢性を向上させることができることがわかった。
また,1000倍のラベル付きデータで事前訓練されたモデルに対して,最先端のモデルと性能を向上する新たなデータ拡張手法を提案する。
論文 参考訳(メタデータ) (2020-06-29T17:59:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。