論文の概要: FreeAugment: Data Augmentation Search Across All Degrees of Freedom
- arxiv url: http://arxiv.org/abs/2409.04820v1
- Date: Sat, 7 Sep 2024 13:26:12 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-10 20:31:31.337532
- Title: FreeAugment: Data Augmentation Search Across All Degrees of Freedom
- Title(参考訳): FreeAugment: 自由のあらゆる領域におけるデータ拡張検索
- Authors: Tom Bekor, Niv Nayman, Lihi Zelnik-Manor,
- Abstract要約: FreeAugmentは、4つの自由度すべてを同時にグローバルに最適化した最初の企業である。
実験の結果, あらゆる自由度に関する共同学習は, 性能を著しく向上させることがわかった。
- 参考スコア(独自算出の注目度): 8.532815944726721
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data augmentation has become an integral part of deep learning, as it is known to improve the generalization capabilities of neural networks. Since the most effective set of image transformations differs between tasks and domains, automatic data augmentation search aims to alleviate the extreme burden of manually finding the optimal image transformations. However, current methods are not able to jointly optimize all degrees of freedom: (1) the number of transformations to be applied, their (2) types, (3) order, and (4) magnitudes. Many existing methods risk picking the same transformation more than once, limit the search to two transformations only, or search for the number of transformations exhaustively or iteratively in a myopic manner. Our approach, FreeAugment, is the first to achieve global optimization of all four degrees of freedom simultaneously, using a fully differentiable method. It efficiently learns the number of transformations and a probability distribution over their permutations, inherently refraining from redundant repetition while sampling. Our experiments demonstrate that this joint learning of all degrees of freedom significantly improves performance, achieving state-of-the-art results on various natural image benchmarks and beyond across other domains. Project page at https://tombekor.github.io/FreeAugment-web
- Abstract(参考訳): データ拡張は、ニューラルネットワークの一般化能力を改善することで知られており、ディープラーニングの不可欠な部分となっている。
画像変換の最も効果的なセットはタスクとドメインによって異なるため、自動データ拡張検索は、最適な画像変換を手作業で見つける際の極端な負担を軽減することを目的としている。
しかし、現在の手法では、(1)適用すべき変換の数、(2)タイプ、(3)オーダー、(4)マグニチュードなど、すべての自由度を共同で最適化することはできない。
既存の多くの手法では、同じ変換を1回以上選択したり、2つの変換のみに限定したり、あるいは、抜本的または反復的にミオピックな方法で変換の数を探索するリスクがある。
当社のアプローチであるFreeAugmentは,完全微分可能な手法を用いて,全4次自由度を同時にグローバルに最適化する最初の方法である。
サンプリング中に冗長な繰り返しを控えて、効率よく変換の数と置換の確率分布を学習する。
実験により,任意の自由度を共同学習することで,様々な自然画像のベンチマークや,他の領域をまたがる最先端の成果が得られ,性能が大幅に向上することが示された。
Project page at https://tombekor.github.io/FreeAugment-web
関連論文リスト
- Learning to Transform Dynamically for Better Adversarial Transferability [32.267484632957576]
人間に知覚できない摂動を加えることで構築された敵対的な例は、ニューラルネットワークを欺く可能性がある。
我々はL2T(Learning to Transform)という新しいアプローチを導入する。
L2Tは、候補プールからの操作の最適な組み合わせを選択することにより、変換された画像の多様性を高める。
論文 参考訳(メタデータ) (2024-05-23T00:46:53Z) - MGAug: Multimodal Geometric Augmentation in Latent Spaces of Image
Deformations [2.711740183729759]
本稿では,幾何変形の多モード潜在空間における拡張変換を生成する新しいモデルを提案する。
実験結果から,提案手法は予測精度を大幅に向上させることで,全てのベースラインよりも優れた性能を示すことがわかった。
論文 参考訳(メタデータ) (2023-12-20T21:30:55Z) - ELRA: Exponential learning rate adaption gradient descent optimization
method [83.88591755871734]
我々は, 高速(指数率), ab initio(超自由)勾配に基づく適応法を提案する。
本手法の主な考え方は,状況認識による$alphaの適応である。
これは任意の次元 n の問題に適用でき、線型にしかスケールできない。
論文 参考訳(メタデータ) (2023-09-12T14:36:13Z) - Effective Data Augmentation With Diffusion Models [65.09758931804478]
我々は、事前訓練されたテキスト・画像拡散モデルによりパラメータ化された画像・画像変換によるデータ拡張の多様性の欠如に対処する。
本手法は,市販の拡散モデルを用いて画像のセマンティクスを編集し,いくつかのラベル付き例から新しい視覚概念に一般化する。
本手法は,実世界の雑草認識タスクと数ショット画像分類タスクにおいて評価し,テスト領域における精度の向上を観察する。
論文 参考訳(メタデータ) (2023-02-07T20:42:28Z) - Soft Augmentation for Image Classification [68.71067594724663]
本稿では,変分変換による拡張の一般化とソフト拡張を提案する。
ソフトターゲットは、より攻撃的なデータ拡張を可能にすることを示す。
また,ソフト拡張が自己教師付き分類タスクに一般化されることも示している。
論文 参考訳(メタデータ) (2022-11-09T01:04:06Z) - Optimizing transformations for contrastive learning in a differentiable
framework [4.828899860513713]
本稿では,微分可能変換ネットワークを用いたコントラスト学習のための最適変換手法を提案する。
本手法は,教師の精度と収束速度の両方において,低アノテートデータ方式の性能を向上させる。
34000枚の脳磁気共鳴画像と11200枚の胸部X線画像を用いて実験を行った。
論文 参考訳(メタデータ) (2022-07-27T08:47:57Z) - A training-free recursive multiresolution framework for diffeomorphic
deformable image registration [6.929709872589039]
変形可能な画像登録のための新しい微分型学習自由アプローチを提案する。
提案するアーキテクチャは設計上は単純で,各解像度で移動像を順次ワープし,最終的に固定像に整列する。
システム全体はエンドツーエンドで、スクラッチから各2つのイメージに最適化されている。
論文 参考訳(メタデータ) (2022-02-01T15:17:17Z) - Feature transforms for image data augmentation [74.12025519234153]
画像分類において、多くの拡張アプローチは単純な画像操作アルゴリズムを利用する。
本研究では,14種類の拡張アプローチを組み合わせて生成した画像を追加することで,データレベルでのアンサンブルを構築する。
事前トレーニングされたResNet50ネットワークは、各拡張メソッドから派生した画像を含むトレーニングセットに基づいて微調整される。
論文 参考訳(メタデータ) (2022-01-24T14:12:29Z) - Recurrent Multi-view Alignment Network for Unsupervised Surface
Registration [79.72086524370819]
非厳格な登録をエンドツーエンドで学習することは、本質的に高い自由度とラベル付きトレーニングデータの欠如により困難である。
我々は、いくつかの剛性変換のポイントワイドな組み合わせで、非剛性変換を表現することを提案する。
また,投影された多視点2次元深度画像上での3次元形状の類似度を計測する可微分損失関数も導入する。
論文 参考訳(メタデータ) (2020-11-24T14:22:42Z) - FDA: Fourier Domain Adaptation for Semantic Segmentation [82.4963423086097]
本稿では,教師なし領域適応の簡易な手法について述べる。一方の低周波スペクトルを他方と交換することにより,音源と対象分布の相違を低減できる。
本手法を意味的セグメンテーション(semantic segmentation, 意味的セグメンテーション, 意味的セグメンテーション)で説明する。
以上の結果から,より高度な手法が学習に苦しむデータにおいて,単純な手順であってもニュアンス変動を低減できる可能性が示唆された。
論文 参考訳(メタデータ) (2020-04-11T22:20:48Z) - Learning Test-time Augmentation for Content-based Image Retrieval [42.188013259368766]
オフザシェルフ畳み込みニューラルネットワークは、多くの画像検索タスクにおいて優れた結果をもたらす。
既存の画像検索手法では、ターゲットデータ特有のバリエーションに適応するために、事前訓練されたネットワークを微調整または修正する必要がある。
本手法は, テスト時に強調した画像から抽出した特徴を, 強化学習を通じて学習したポリシーに則って集約することにより, 既製の特徴の分散を促進させる。
論文 参考訳(メタデータ) (2020-02-05T05:08:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。