論文の概要: Missing Features Reconstruction Using a Wasserstein Generative
Adversarial Imputation Network
- arxiv url: http://arxiv.org/abs/2006.11783v1
- Date: Sun, 21 Jun 2020 11:53:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-18 11:39:46.762589
- Title: Missing Features Reconstruction Using a Wasserstein Generative
Adversarial Imputation Network
- Title(参考訳): Wasserstein Generative Adversarial Imputation Network を用いた欠失特徴再構成
- Authors: Magda Friedjungov\'a, Daniel Va\v{s}ata, Maksym Balatsko and Marcel
Ji\v{r}ina
- Abstract要約: 特徴再構成における生成モデルと非生成モデルの使用について実験的に検討した。
任意条件付き生成オートエンコーダ(VAEAC)とGAIN(Generative Adversarial Imputation Network)を生成モデルの代表として研究した。
WGAIN を GAIN のワッサースタイン修飾法として導入し,欠損度が 30% 以下である場合に最も優れた計算モデルであることが判明した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Missing data is one of the most common preprocessing problems. In this paper,
we experimentally research the use of generative and non-generative models for
feature reconstruction. Variational Autoencoder with Arbitrary Conditioning
(VAEAC) and Generative Adversarial Imputation Network (GAIN) were researched as
representatives of generative models, while the denoising autoencoder (DAE)
represented non-generative models. Performance of the models is compared to
traditional methods k-nearest neighbors (k-NN) and Multiple Imputation by
Chained Equations (MICE). Moreover, we introduce WGAIN as the Wasserstein
modification of GAIN, which turns out to be the best imputation model when the
degree of missingness is less than or equal to 30%. Experiments were performed
on real-world and artificial datasets with continuous features where different
percentages of features, varying from 10% to 50%, were missing. Evaluation of
algorithms was done by measuring the accuracy of the classification model
previously trained on the uncorrupted dataset. The results show that GAIN and
especially WGAIN are the best imputers regardless of the conditions. In
general, they outperform or are comparative to MICE, k-NN, DAE, and VAEAC.
- Abstract(参考訳): データ不足は、最も一般的な前処理問題の1つです。
本稿では,生成モデルおよび非生成モデルを用いた特徴復元について実験的に検討する。
任意条件付き変分オートエンコーダ(VAEAC)とGAIN(Generative Adversarial Imputation Network)は生成モデルの代表として研究され,DAE(Denoising Autoencoder)は生成モデルを表す。
モデルの性能は、k-nearest neighbors(k-NN)やMICE(Multiple Imputation by Chained Equations)と比較される。
さらに,WGAIN を GAIN のワッサースタイン修飾法として導入し,欠損度が 30% 以下である場合に最も優れた計算モデルであることが判明した。
実験は、10%から50%の異なる特徴の異なるパーセンテージが欠落した、実世界のデータセットと人工データセットで実施された。
アルゴリズムの評価は、以前にデータセットでトレーニングされた分類モデルの精度を測定することによって行われた。
その結果, GAIN, 特にWGAINは, 条件によらず最も優れたインパルスであることがわかった。
一般的には、MICE、k-NN、DAE、VAEACよりも優れているか、あるいは比較されている。
関連論文リスト
- Predicting Critical Heat Flux with Uncertainty Quantification and Domain Generalization Using Conditional Variational Autoencoders and Deep Neural Networks [2.517043342442487]
臨界熱流束測定データを増大させる条件付き変分オートエンコーダモデルを開発した。
微調整深層ニューラルネットワーク(DNN)回帰モデルを作成し、同じデータセットで評価した。
CVAEモデルでは, 予測的相対的標準偏差の評価後, 変動性が著しく低下し, 高い信頼度が得られた。
論文 参考訳(メタデータ) (2024-09-09T16:50:41Z) - Predictive Analytics of Varieties of Potatoes [2.336821989135698]
本研究では, 育種試験におけるサツマイモクローンの選択プロセスの向上を目的とした, 機械学習アルゴリズムの適用について検討する。
本研究は, 高収率, 耐病性, 耐気候性ポテト品種を効率的に同定することの課題に対処する。
論文 参考訳(メタデータ) (2024-04-04T00:49:05Z) - Synthetic data, real errors: how (not) to publish and use synthetic data [86.65594304109567]
生成過程が下流MLタスクにどのように影響するかを示す。
本稿では、生成プロセスモデルパラメータの後方分布を近似するために、Deep Generative Ensemble (DGE)を導入する。
論文 参考訳(メタデータ) (2023-05-16T07:30:29Z) - Boosting Differentiable Causal Discovery via Adaptive Sample Reweighting [62.23057729112182]
異なるスコアに基づく因果探索法は観測データから有向非巡回グラフを学習する。
本稿では,Reweighted Score関数ReScoreの適応重みを動的に学習することにより因果発見性能を向上させるためのモデルに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-06T14:49:59Z) - Compound Density Networks for Risk Prediction using Electronic Health
Records [1.1786249372283562]
複合密度ネットワーク(CDNet)を用いたエンドツーエンド統合手法を提案する。
CDNetは、単一のフレームワーク内で計算方法と予測モデルを調整できるようにする。
我々は,MIMIC-IIIデータセット上での死亡予測タスクにおいてCDNetを検証した。
論文 参考訳(メタデータ) (2022-08-02T09:04:20Z) - Evaluating State-of-the-Art Classification Models Against Bayes
Optimality [106.50867011164584]
正規化フローを用いて学習した生成モデルのベイズ誤差を正確に計算できることを示す。
われわれの手法を用いて、最先端の分類モデルについて徹底的な調査を行う。
論文 参考訳(メタデータ) (2021-06-07T06:21:20Z) - Contrastive Model Inversion for Data-Free Knowledge Distillation [60.08025054715192]
そこで、データ多様性を最適化可能な目的として明示的にモデル化するContrastive Model Inversionを提案します。
我々の主な観察では、同じ量のデータの制約の下では、高いデータの多様性は、通常より強いインスタンス識別を示す。
CIFAR-10, CIFAR-100, Tiny-ImageNetを用いた実験により, 生成したデータを知識蒸留に使用する場合, CMIは極めて優れた性能を示すことが示された。
論文 参考訳(メタデータ) (2021-05-18T15:13:00Z) - Cauchy-Schwarz Regularized Autoencoder [68.80569889599434]
変分オートエンコーダ(VAE)は、強力で広く使われている生成モデルのクラスである。
GMMに対して解析的に計算できるCauchy-Schwarz分散に基づく新しい制約対象を導入する。
本研究の目的は,密度推定,教師なしクラスタリング,半教師なし学習,顔分析における変分自動エンコーディングモデルの改善である。
論文 参考訳(メタデータ) (2021-01-06T17:36:26Z) - IFGAN: Missing Value Imputation using Feature-specific Generative
Adversarial Networks [14.714106979097222]
本論文では,GAN(Feature-specific Generative Adversarial Networks)に基づく欠落値インピーダンスアルゴリズムIFGANを提案する。
特徴特異的生成器は欠落した値を誘発するように訓練され、判別器は観測された値と区別することが期待される。
IFGANは、様々な不足条件下で、現在の最先端アルゴリズムよりも優れている実生活データセットを実証的に示す。
論文 参考訳(メタデータ) (2020-12-23T10:14:35Z) - PC-GAIN: Pseudo-label Conditional Generative Adversarial Imputation
Networks for Incomplete Data [19.952411963344556]
PC-GAIN(PC-GAIN)は、PC-GAIN(PC-GAIN)と呼ばれる新しい教師なしデータ計算法である。
まず,低損失率データのサブセットに含まれる潜在的なカテゴリ情報を学習するための事前学習手順を提案する。
そして、合成擬似ラベルを用いて補助分類器を決定する。
論文 参考訳(メタデータ) (2020-11-16T08:08:26Z) - Unsupervised Anomaly Detection with Adversarial Mirrored AutoEncoders [51.691585766702744]
本稿では,識別器のミラー化ワッサースタイン損失を利用して,よりセマンティックレベルの再構築を行う逆自動エンコーダの変種を提案する。
我々は,再建基準の代替として,異常スコアの代替尺度を提案した。
提案手法は,OOD検出ベンチマークにおける異常検出の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2020-03-24T08:26:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。