論文の概要: MoireMix: A Formula-Based Data Augmentation for Improving Image Classification Robustness
- arxiv url: http://arxiv.org/abs/2603.25109v1
- Date: Thu, 26 Mar 2026 07:29:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-27 20:52:48.155156
- Title: MoireMix: A Formula-Based Data Augmentation for Improving Image Classification Robustness
- Title(参考訳): MoireMix: 画像分類ロバストネスを改善するフォーミュラベースのデータ拡張
- Authors: Yuto Matsuo, Yoshihiro Fukuhara, Yuki M. Asano, Rintaro Yanagi, Hirokatsu Kataoka, Akio Nakamura,
- Abstract要約: 本稿では, クローズドフォームの数学的定式化を用いて, フライ時のモアレテクスチャを手続き的に生成する軽量化手法を提案する。
提案手法は,ImageNet-C, ImageNet-R, および逆数ベンチマークを含む複数のベンチマーク間の堅牢性を一貫して改善する。
これらの結果から,解析的干渉パターンはデータ駆動生成法に代わる実用的で効率的な代替手段となることが示唆された。
- 参考スコア(独自算出の注目度): 37.507208770129296
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Data augmentation is a key technique for improving the robustness of image classification models. However, many recent approaches rely on diffusion-based synthesis or complex feature mixing strategies, which introduce substantial computational overhead or require external datasets. In this work, we explore a different direction: procedural augmentation based on analytic interference patterns. Unlike conventional augmentation methods that rely on stochastic noise, feature mixing, or generative models, our approach exploits Moire interference to generate structured perturbations spanning a wide range of spatial frequencies. We propose a lightweight augmentation method that procedurally generates Moire textures on-the-fly using a closed-form mathematical formulation. The patterns are synthesized directly in memory with negligible computational cost (0.0026 seconds per image), mixed with training images during training, and immediately discarded, enabling a storage-free augmentation pipeline without external data. Extensive experiments with Vision Transformers demonstrate that the proposed method consistently improves robustness across multiple benchmarks, including ImageNet-C, ImageNet-R, and adversarial benchmarks, outperforming standard augmentation baselines and existing external-data-free augmentation approaches. These results suggest that analytic interference patterns provide a practical and efficient alternative to data-driven generative augmentation methods.
- Abstract(参考訳): データ拡張は、画像分類モデルの堅牢性を改善するための重要なテクニックである。
しかし、近年の多くのアプローチは拡散に基づく合成や複雑な特徴混合戦略に依存しており、これは計算オーバーヘッドを大幅に増加させるか、外部データセットを必要とする。
本研究では,解析的干渉パターンに基づく手続き的拡張(Procedural augmentation)という,異なる方向を探索する。
確率ノイズ,特徴混合,生成モデルに依存する従来の拡張法とは異なり,本手法はモアレ干渉を利用して広い空間周波数にまたがる構造的摂動を生成する。
本稿では, クローズドフォームの数学的定式化を用いて, フライ時のモアレテクスチャを手続き的に生成する軽量化手法を提案する。
これらのパターンは、無視可能な計算コスト(イメージ当たり0.0026秒)でメモリ内で直接合成され、トレーニング中のトレーニングイメージと混合され、すぐに破棄され、外部データなしでストレージ不要の拡張パイプラインが実現される。
Vision Transformersによる大規模な実験により、提案手法はImageNet-C、ImageNet-R、および逆数ベンチマークを含む複数のベンチマークにおけるロバスト性を一貫して改善し、標準拡張ベースラインと既存の外部データフリー拡張アプローチより優れていることが示された。
これらの結果から,解析的干渉パターンはデータ駆動型生成拡張法に代わる実用的で効率的な代替手段となることが示唆された。
関連論文リスト
- Prototype-Guided Diffusion: Visual Conditioning without External Memory [2.1155908599769764]
プロトタイプ拡散モデルでは、外部メモリなしで効率的な視覚条件付けを行うために、プロトタイプ学習を直接拡散プロセスに統合する。
PDMは、計算とストレージのオーバーヘッドを低減しつつ、高速な品質を維持し、拡散モデルにおける検索ベースの条件付けに代わるスケーラブルな代替手段を提供する。
論文 参考訳(メタデータ) (2025-08-13T16:18:35Z) - Oscillation Inversion: Understand the structure of Large Flow Model through the Lens of Inversion Method [60.88467353578118]
実世界のイメージを逆転させる固定点インスパイアされた反復的アプローチは収束を達成せず、異なるクラスタ間で振動することを示す。
本稿では,画像強調,ストロークベースのリカラー化,および視覚的プロンプト誘導画像編集を容易にする,シンプルで高速な分布転送手法を提案する。
論文 参考訳(メタデータ) (2024-11-17T17:45:37Z) - Scaling Rectified Flow Transformers for High-Resolution Image Synthesis [22.11487736315616]
整流流(rectified flow)は、データとノイズを直線で接続する最近の生成モデルである。
我々は,既存のノイズサンプリング手法を改良し,それらを知覚的に関係のあるスケールに偏りを持たせることにより,整流モデルの訓練を行う。
本稿では,2つのモードの重みを分離したテキスト・画像生成のためのトランスフォーマー・ベースアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-03-05T18:45:39Z) - Blue noise for diffusion models [50.99852321110366]
本稿では,画像内および画像間の相関雑音を考慮した拡散モデルを提案する。
我々のフレームワークは、勾配流を改善するために、1つのミニバッチ内に画像間の相関を導入することができる。
本手法を用いて,各種データセットの質的,定量的な評価を行う。
論文 参考訳(メタデータ) (2024-02-07T14:59:25Z) - ExposureDiffusion: Learning to Expose for Low-light Image Enhancement [87.08496758469835]
この研究は、拡散モデルと物理ベースの露光モデルとをシームレスに統合することで、この問題に対処する。
提案手法は,バニラ拡散モデルと比較して性能が大幅に向上し,推論時間を短縮する。
提案するフレームワークは、実際のペア付きデータセット、SOTAノイズモデル、および異なるバックボーンネットワークの両方で動作する。
論文 参考訳(メタデータ) (2023-07-15T04:48:35Z) - Hierarchical Integration Diffusion Model for Realistic Image Deblurring [71.76410266003917]
拡散モデル (DM) は画像劣化に導入され, 有望な性能を示した。
本稿では,階層型統合拡散モデル(HI-Diff)を提案する。
人工的および実世界のぼかしデータセットの実験は、HI-Diffが最先端の手法より優れていることを示した。
論文 参考訳(メタデータ) (2023-05-22T12:18:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。