論文の概要: Reducing Data Complexity using Autoencoders with Class-informed Loss
Functions
- arxiv url: http://arxiv.org/abs/2111.06142v1
- Date: Thu, 11 Nov 2021 10:57:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-12 14:58:51.412200
- Title: Reducing Data Complexity using Autoencoders with Class-informed Loss
Functions
- Title(参考訳): クラスインフォームド損失関数を用いたオートエンコーダによるデータ複雑性の低減
- Authors: David Charte and Francisco Charte and Francisco Herrera
- Abstract要約: 本稿では,損失関数の通知にクラスラベルを用いる,自己エンコーダに基づく複雑性低減手法を提案する。
27データセットの集合にわたる徹底的な実験により、クラスインフォームドオートエンコーダは、他の4つの一般的な教師なし特徴抽出技術よりも優れたパフォーマンスを示している。
- 参考スコア(独自算出の注目度): 14.541733758283355
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Available data in machine learning applications is becoming increasingly
complex, due to higher dimensionality and difficult classes. There exists a
wide variety of approaches to measuring complexity of labeled data, according
to class overlap, separability or boundary shapes, as well as group morphology.
Many techniques can transform the data in order to find better features, but
few focus on specifically reducing data complexity. Most data transformation
methods mainly treat the dimensionality aspect, leaving aside the available
information within class labels which can be useful when classes are somehow
complex.
This paper proposes an autoencoder-based approach to complexity reduction,
using class labels in order to inform the loss function about the adequacy of
the generated variables. This leads to three different new feature learners,
Scorer, Skaler and Slicer. They are based on Fisher's discriminant ratio, the
Kullback-Leibler divergence and least-squares support vector machines,
respectively. They can be applied as a preprocessing stage for a binary
classification problem. A thorough experimentation across a collection of 27
datasets and a range of complexity and classification metrics shows that
class-informed autoencoders perform better than 4 other popular unsupervised
feature extraction techniques, especially when the final objective is using the
data for a classification task.
- Abstract(参考訳): 機械学習アプリケーションで利用可能なデータは、より高い次元と難しいクラスのため、ますます複雑になっています。
ラベル付きデータの複雑性を測定するには、クラスオーバーラップ、分離性、境界形状、およびグループ形態に応じて、さまざまなアプローチが存在する。
多くのテクニックは、より良い機能を見つけるためにデータを変換することができるが、データ複雑さを特に削減することに注力する技術はほとんどない。
ほとんどのデータ変換メソッドは、主に次元的側面を扱い、クラスが何らかの複雑な場合に有用なクラスラベル内で利用可能な情報を残します。
本稿では,クラスラベルを用いた自動エンコーダに基づく複雑性低減手法を提案する。
これにより、Scorer、Skaler、Slicerの3つの異なる新機能学習者が生まれる。
これらはフィッシャーの判別比、クルバック・リーバーの発散、および最小二乗支援ベクトルマシンに基づいている。
それらは二項分類問題の前処理段階として適用できる。
27のデータセットの集合と、複雑性と分類のメトリクスの広範囲にわたる徹底した実験により、クラスインフォームされたオートエンコーダは、他の4つの一般的な教師なし特徴抽出テクニックよりも優れたパフォーマンスを示す。
関連論文リスト
- Few-Shot Non-Parametric Learning with Deep Latent Variable Model [50.746273235463754]
遅延変数を用いた圧縮による非パラメトリック学習(NPC-LV)を提案する。
NPC-LVは、ラベルなしデータが多いがラベル付きデータはほとんどないデータセットの学習フレームワークである。
我々は,NPC-LVが低データ構造における画像分類における3つのデータセットの教師あり手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-06-23T09:35:03Z) - Deep invariant networks with differentiable augmentation layers [87.22033101185201]
データ拡張ポリシーの学習方法は、保持データを必要とし、二段階最適化の問題に基づいている。
我々のアプローチは、現代の自動データ拡張技術よりも訓練が簡単で高速であることを示す。
論文 参考訳(メタデータ) (2022-02-04T14:12:31Z) - Latent Vector Expansion using Autoencoder for Anomaly Detection [1.370633147306388]
オートエンコーダの特徴を利用して,低次元から高次元の潜在ベクトルを訓練する。
不均衡なデータの分類性能を向上させる潜在ベクトル展開オートエンコーダモデルを提案する。
論文 参考訳(メタデータ) (2022-01-05T02:28:38Z) - CvS: Classification via Segmentation For Small Datasets [52.821178654631254]
本稿では,分類ラベルをセグメントマップの予測から導出する小型データセットのコスト効率の高い分類器であるCvSを提案する。
我々は,CvSが従来の手法よりもはるかに高い分類結果が得られることを示す多種多様な問題に対して,本フレームワークの有効性を評価する。
論文 参考訳(メタデータ) (2021-10-29T18:41:15Z) - Tensor feature hallucination for few-shot learning [17.381648488344222]
限られた監督と限られたデータによって、サンプルを分類するという課題に対処するショットは少ない。
数ショット分類のための合成データ生成に関するこれまでの研究は、複雑なモデルを活用することに重点を置いていた。
本稿では,単純かつ簡単な合成データ生成手法を効果的に利用する方法を検討する。
論文 参考訳(メタデータ) (2021-06-09T18:25:08Z) - Theoretical Insights Into Multiclass Classification: A High-dimensional
Asymptotic View [82.80085730891126]
線形多クラス分類の最初の現代的精度解析を行う。
分析の結果,分類精度は分布に依存していることがわかった。
得られた洞察は、他の分類アルゴリズムの正確な理解の道を開くかもしれない。
論文 参考訳(メタデータ) (2020-11-16T05:17:29Z) - Category-Learning with Context-Augmented Autoencoder [63.05016513788047]
実世界のデータの解釈可能な非冗長表現を見つけることは、機械学習の鍵となる問題の一つである。
本稿では,オートエンコーダのトレーニングにデータ拡張を利用する新しい手法を提案する。
このような方法で変分オートエンコーダを訓練し、補助ネットワークによって変換結果を予測できるようにする。
論文 参考訳(メタデータ) (2020-10-10T14:04:44Z) - Evaluating Nonlinear Decision Trees for Binary Classification Tasks with
Other Existing Methods [8.870380386952993]
データセットを2つ以上の異なるクラスに分類することは、機械学習の重要なタスクである。
多くのメソッドは、テストデータに対して非常に高い精度でバイナリ分類タスクを分類することができるが、容易に解釈可能な説明を提供することはできない。
我々は、最近提案された非線形決定木アプローチを、多くのデータセットでよく使われている分類手法で強調し、評価する。
論文 参考訳(メタデータ) (2020-08-25T00:00:23Z) - Revisiting Data Complexity Metrics Based on Morphology for Overlap and
Imbalance: Snapshot, New Overlap Number of Balls Metrics and Singular
Problems Prospect [9.666866159867444]
本研究は,データ形態に基づく複雑性メトリクスの再検討に焦点をあてる。
クラスによるボールのカバレッジに基づいており、オーバーラップ・ナンバー・オブ・ボールにちなんで名付けられている。
論文 参考訳(メタデータ) (2020-07-15T18:21:13Z) - Unsupervised Person Re-identification via Softened Similarity Learning [122.70472387837542]
人物再識別(re-ID)はコンピュータビジョンにおいて重要なトピックである。
本稿では,ラベル付き情報を必要としないre-IDの教師なし設定について検討する。
2つの画像ベースおよびビデオベースデータセットの実験は、最先端のパフォーマンスを示している。
論文 参考訳(メタデータ) (2020-04-07T17:16:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。