論文の概要: The Effect of Data Ordering in Image Classification
- arxiv url: http://arxiv.org/abs/2001.05857v1
- Date: Wed, 8 Jan 2020 20:34:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-13 09:50:21.025849
- Title: The Effect of Data Ordering in Image Classification
- Title(参考訳): 画像分類におけるデータ順序付けの効果
- Authors: Ethem F. Can, Aysu Ezen-Can
- Abstract要約: 本稿では,これらの機械に供給する成分であるデータに焦点をあてる。
我々は、ImageNetデータセットを用いた画像分類タスクの実験を行い、より高い分類精度を得るために、いくつかのデータ順序付けが他のデータよりも優れていることを示す。
ここでの私たちのゴールは、パラメータやモデルアーキテクチャだけでなく、データ順序付けがより良い結果を得る上で有意であることを示すことです。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The success stories from deep learning models increase every day spanning
different tasks from image classification to natural language understanding.
With the increasing popularity of these models, scientists spend more and more
time finding the optimal parameters and best model architectures for their
tasks. In this paper, we focus on the ingredient that feeds these machines: the
data. We hypothesize that the data ordering affects how well a model performs.
To that end, we conduct experiments on an image classification task using
ImageNet dataset and show that some data orderings are better than others in
terms of obtaining higher classification accuracies. Experimental results show
that independent of model architecture, learning rate and batch size, ordering
of the data significantly affects the outcome. We show these findings using
different metrics: NDCG, accuracy @ 1 and accuracy @ 5. Our goal here is to
show that not only parameters and model architectures but also the data
ordering has a say in obtaining better results.
- Abstract(参考訳): ディープラーニングモデルの成功ストーリーは、画像分類から自然言語理解まで、さまざまなタスクにまたがる毎日増加します。
これらのモデルの人気が高まる中、科学者はタスクに最適なパラメータや最良のモデルアーキテクチャを見つけるのにますます時間を費やしている。
本稿では,これらの機械に供給する成分であるデータに焦点をあてる。
データの順序付けがモデルの性能に与える影響を仮定する。
この目的のために,imagenetデータセットを用いた画像分類タスクの実験を行い,高い分類精度を得るために,データ順序付けが他よりも優れていることを示す。
実験の結果,モデルアーキテクチャや学習率,バッチサイズによらず,データの順序付けが結果に大きく影響することがわかった。
ndcg、精度@1、精度@5と異なる指標を用いて、これらの結果を示す。
ここでの目標は、パラメータやモデルアーキテクチャだけでなく、データ順序付けによってよりよい結果が得られることを示すことです。
関連論文リスト
- DataDream: Few-shot Guided Dataset Generation [90.09164461462365]
実データ分布をより忠実に表現する分類データセットを合成するためのフレームワークを提案する。
DataDream fine-tunes LoRA weights for the image generation model on the few real image before generated the training data using the adapt model。
次に、合成データを用いてCLIPのLoRA重みを微調整し、様々なデータセットに対する以前のアプローチよりも下流画像の分類を改善する。
論文 参考訳(メタデータ) (2024-07-15T17:10:31Z) - LESS: Selecting Influential Data for Targeted Instruction Tuning [64.78894228923619]
本稿では,データの影響を推定し,命令データ選択のための低ランクグレーディエント類似度探索を行うアルゴリズムであるLESSを提案する。
LESS選択したデータの5%のトレーニングは、さまざまなダウンストリームタスクにわたる完全なデータセットでのトレーニングよりも優れています。
我々の方法は、意図した下流アプリケーションに必要な推論スキルを識別するために、表面的なフォームキューを超えています。
論文 参考訳(メタデータ) (2024-02-06T19:18:04Z) - A Simple and Efficient Baseline for Data Attribution on Images [107.12337511216228]
現在の最先端のアプローチでは、モデル予測を正確に評価するために、最大30万のモデルの大規模なアンサンブルが必要となる。
本研究では、自己教師付き学習によって事前訓練されたバックボーンの特徴空間を利用して、データ帰属を行うミニマリストベースラインに焦点を当てる。
提案手法はモデルに依存しず,大規模データセットに容易にスケールできる。
論文 参考訳(メタデータ) (2023-11-03T17:29:46Z) - T-ADAF: Adaptive Data Augmentation Framework for Image Classification
Network based on Tensor T-product Operator [0.0]
本稿ではテンソルT-Product Operatorに基づくAdaptive Data Augmentation Frameworkを提案する。
1つの画像データを3倍にし、これら3つの画像から結果を得る。
数値実験により、我々のデータ拡張フレームワークは、元のニューラルネットワークモデルの性能を2%向上させることができることが示された。
論文 参考訳(メタデータ) (2023-06-07T08:30:44Z) - Delving Deeper into Data Scaling in Masked Image Modeling [145.36501330782357]
視覚認識のためのマスク付き画像モデリング(MIM)手法のスケーリング能力に関する実証的研究を行った。
具体的には、Webで収集したCoyo-700Mデータセットを利用する。
我々のゴールは、データとモデルのサイズの異なるスケールでダウンストリームタスクのパフォーマンスがどのように変化するかを調べることです。
論文 参考訳(メタデータ) (2023-05-24T15:33:46Z) - Exploring the Impact of Instruction Data Scaling on Large Language
Models: An Empirical Study on Real-World Use Cases [17.431381376675432]
本稿では,命令データのスケールの異なる命令データに対して,命令チューニングに基づく大規模言語モデルの性能について検討する。
ベースモデルとしてBloomz-7B1-mtを用いると、命令データの量を増やすだけで、オープン・エンド・ジェネレーションのようなタスクが継続的に改善されることが示される。
本稿では,高品質なトレーニングデータ,スケールベースモデル,ハードタスクに特化したトレーニング手法を効果的に選択する,といった将来的な研究方向を提案する。
論文 参考訳(メタデータ) (2023-03-26T14:49:37Z) - Exploring the Effects of Data Augmentation for Drivable Area
Segmentation [0.0]
既存の画像データセットを解析することで、データ拡張の利点を調べることに重点を置いている。
以上の結果から,既存技術(SOTA)モデルの性能とロバスト性は劇的に向上する可能性が示唆された。
論文 参考訳(メタデータ) (2022-08-06T03:39:37Z) - An Empirical Investigation of Commonsense Self-Supervision with
Knowledge Graphs [67.23285413610243]
大規模知識グラフから抽出した情報に基づく自己監督は、言語モデルの一般化を改善することが示されている。
本研究では,言語モデルに適用可能な合成データを生成するための知識サンプリング戦略とサイズの影響について検討する。
論文 参考訳(メタデータ) (2022-05-21T19:49:04Z) - Models, Pixels, and Rewards: Evaluating Design Trade-offs in Visual
Model-Based Reinforcement Learning [109.74041512359476]
視覚的MBRLアルゴリズムにおける予測モデルの設計決定について検討する。
潜在空間の使用など、しばしば重要と見なされる設計上の決定は、タスクのパフォーマンスにはほとんど影響しないことが分かりました。
我々は,この現象が探索とどのように関係しているか,および標準ベンチマークにおける下位スコーリングモデルのいくつかが,同じトレーニングデータでトレーニングされた場合のベストパフォーマンスモデルと同等の性能を発揮するかを示す。
論文 参考訳(メタデータ) (2020-12-08T18:03:21Z) - PK-GCN: Prior Knowledge Assisted Image Classification using Graph
Convolution Networks [3.4129083593356433]
クラス間の類似性は、分類のパフォーマンスに影響を与える可能性がある。
本稿では,クラス類似性の知識を畳み込みニューラルネットワークモデルに組み込む手法を提案する。
実験結果から, 利用可能なデータの量が少ない場合には, 分類精度が向上することが示唆された。
論文 参考訳(メタデータ) (2020-09-24T18:31:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。