論文の概要: T-ADAF: Adaptive Data Augmentation Framework for Image Classification
Network based on Tensor T-product Operator
- arxiv url: http://arxiv.org/abs/2306.04240v1
- Date: Wed, 7 Jun 2023 08:30:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-08 15:28:12.728333
- Title: T-ADAF: Adaptive Data Augmentation Framework for Image Classification
Network based on Tensor T-product Operator
- Title(参考訳): T-ADAF:Tensor T-product Operatorに基づく画像分類ネットワークのための適応データ拡張フレームワーク
- Authors: Feiyang Han, Yun Miao, Zhaoyi Sun, Yimin Wei
- Abstract要約: 本稿ではテンソルT-Product Operatorに基づくAdaptive Data Augmentation Frameworkを提案する。
1つの画像データを3倍にし、これら3つの画像から結果を得る。
数値実験により、我々のデータ拡張フレームワークは、元のニューラルネットワークモデルの性能を2%向上させることができることが示された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Image classification is one of the most fundamental tasks in Computer Vision.
In practical applications, the datasets are usually not as abundant as those in
the laboratory and simulation, which is always called as Data Hungry. How to
extract the information of data more completely and effectively is very
important. Therefore, an Adaptive Data Augmentation Framework based on the
tensor T-product Operator is proposed in this paper, to triple one image data
to be trained and gain the result from all these three images together with
only less than 0.1% increase in the number of parameters. At the same time,
this framework serves the functions of column image embedding and global
feature intersection, enabling the model to obtain information in not only
spatial but frequency domain, and thus improving the prediction accuracy of the
model. Numerical experiments have been designed for several models, and the
results demonstrate the effectiveness of this adaptive framework. Numerical
experiments show that our data augmentation framework can improve the
performance of original neural network model by 2%, which provides competitive
results to state-of-the-art methods.
- Abstract(参考訳): 画像分類はコンピュータビジョンにおける最も基本的なタスクの1つである。
実用的なアプリケーションでは、データセットは通常、実験室やシミュレーションのデータセットほど豊富ではない。
データの情報をより完全かつ効果的に抽出する方法は非常に重要です。
そこで本論文では, テンソルT積演算子に基づく適応データ拡張フレームワークを提案し, トレーニング対象とする画像データを3倍にし, パラメータ数0.1%未満の増加とともに, これら3つの画像から結果を得る。
同時に、このフレームワークは、コラム画像埋め込みとグローバル特徴交差の機能を提供し、モデルが空間領域だけでなく周波数領域でも情報を得ることができるようにし、モデルの予測精度を向上させる。
数値実験はいくつかのモデルのために設計されており、この適応フレームワークの有効性が示されている。
数値実験により、データ拡張フレームワークは、元のニューラルネットワークモデルの性能を2%向上させ、最先端の手法に競争的な結果をもたらすことを示した。
関連論文リスト
- Swin Transformer for Robust Differentiation of Real and Synthetic Images: Intra- and Inter-Dataset Analysis [0.0]
本研究では,自然画像と合成画像の正確な識別のためのSwin Transformerモデルを提案する。
モデルの性能は、3つの異なるデータセットにわたるデータセット内およびデータセット間テストによって評価された。
論文 参考訳(メタデータ) (2024-09-07T06:43:17Z) - DataDream: Few-shot Guided Dataset Generation [90.09164461462365]
実データ分布をより忠実に表現する分類データセットを合成するためのフレームワークを提案する。
DataDream fine-tunes LoRA weights for the image generation model on the few real image before generated the training data using the adapt model。
次に、合成データを用いてCLIPのLoRA重みを微調整し、様々なデータセットに対する以前のアプローチよりも下流画像の分類を改善する。
論文 参考訳(メタデータ) (2024-07-15T17:10:31Z) - Additional Look into GAN-based Augmentation for Deep Learning COVID-19
Image Classification [57.1795052451257]
我々は,GANに基づく拡張性能のデータセットサイズ依存性について,小サンプルに着目して検討した。
両方のセットでStyleGAN2-ADAをトレーニングし、生成した画像の品質を検証した後、マルチクラス分類問題における拡張アプローチの1つとしてトレーニングされたGANを使用する。
GANベースの拡張アプローチは、中規模および大規模データセットでは古典的な拡張に匹敵するが、より小さなデータセットでは不十分である。
論文 参考訳(メタデータ) (2024-01-26T08:28:13Z) - Image edge enhancement for effective image classification [7.470763273994321]
ニューラルネットワークの精度とトレーニング速度を両立させるエッジ拡張に基づく手法を提案する。
我々のアプローチは、利用可能なデータセット内の画像からエッジなどの高周波特徴を抽出し、元の画像と融合させることである。
論文 参考訳(メタデータ) (2024-01-13T10:01:34Z) - A Simple and Efficient Baseline for Data Attribution on Images [107.12337511216228]
現在の最先端のアプローチでは、モデル予測を正確に評価するために、最大30万のモデルの大規模なアンサンブルが必要となる。
本研究では、自己教師付き学習によって事前訓練されたバックボーンの特徴空間を利用して、データ帰属を行うミニマリストベースラインに焦点を当てる。
提案手法はモデルに依存しず,大規模データセットに容易にスケールできる。
論文 参考訳(メタデータ) (2023-11-03T17:29:46Z) - Performance of GAN-based augmentation for deep learning COVID-19 image
classification [57.1795052451257]
ディープラーニングを医療分野に適用する上で最大の課題は、トレーニングデータの提供である。
データ拡張は、限られたデータセットに直面した時に機械学習で使用される典型的な方法論である。
本研究は, 新型コロナウイルスの胸部X線画像セットを限定して, StyleGAN2-ADAモデルを用いて訓練するものである。
論文 参考訳(メタデータ) (2023-04-18T15:39:58Z) - Expanding Small-Scale Datasets with Guided Imagination [92.5276783917845]
データセット拡張は、新しいラベル付きサンプルを自動生成することによって、使用可能な小さなデータセットを拡張することを目的とした、新しいタスクである。
GIFは、先行モデルの意味論的意味のある空間において、シードデータの潜伏した特徴を最適化することにより、データイマジネーションを行う。
GIF-SDは、SDによる非ガイド展開よりも、自然画像データセットのモデル精度が13.5%高い。
論文 参考訳(メタデータ) (2022-11-25T09:38:22Z) - Stacking Ensemble Learning in Deep Domain Adaptation for Ophthalmic
Image Classification [61.656149405657246]
ドメイン適応は、十分なラベルデータを取得することが困難な画像分類タスクに有効である。
本稿では,3つのドメイン適応手法を拡張することで,アンサンブル学習を積み重ねるための新しい手法SELDAを提案する。
Age-Related Eye Disease Study (AREDS)ベンチマーク眼科データセットを用いた実験結果から,提案モデルの有効性が示された。
論文 参考訳(メタデータ) (2022-09-27T14:19:00Z) - Enhancing MR Image Segmentation with Realistic Adversarial Data
Augmentation [17.539828821476224]
本稿では,学習データの利用効率を向上させるために,逆データ拡張手法を提案する。
本稿では,データ拡張モデルとセグメンテーションネットワークを協調的に最適化する汎用的なタスク駆動学習フレームワークを提案する。
提案した逆データ拡張は生成ネットワークに依存しず,汎用セグメンテーションネットワークのプラグインモジュールとして使用できる。
論文 参考訳(メタデータ) (2021-08-07T11:32:37Z) - The Effect of Data Ordering in Image Classification [0.0]
本稿では,これらの機械に供給する成分であるデータに焦点をあてる。
我々は、ImageNetデータセットを用いた画像分類タスクの実験を行い、より高い分類精度を得るために、いくつかのデータ順序付けが他のデータよりも優れていることを示す。
ここでの私たちのゴールは、パラメータやモデルアーキテクチャだけでなく、データ順序付けがより良い結果を得る上で有意であることを示すことです。
論文 参考訳(メタデータ) (2020-01-08T20:34:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。