論文の概要: ReMasker: Imputing Tabular Data with Masked Autoencoding
- arxiv url: http://arxiv.org/abs/2309.13793v1
- Date: Mon, 25 Sep 2023 01:03:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-26 17:32:45.145158
- Title: ReMasker: Imputing Tabular Data with Masked Autoencoding
- Title(参考訳): ReMasker: Masked Autoencodingでタブラルデータを出力する
- Authors: Tianyu Du, Luca Melis, Ting Wang
- Abstract要約: ReMaskerは、マスク付き自動符号化フレームワークを拡張して、表形式のデータに欠落した値を出力する新しい方法である。
ReMaskerは、計算精度と実用性の両方の観点から最先端の手法に匹敵する性能を示す。
- 参考スコア(独自算出の注目度): 16.309069766467072
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present ReMasker, a new method of imputing missing values in tabular data
by extending the masked autoencoding framework. Compared with prior work,
ReMasker is both simple -- besides the missing values (i.e., naturally masked),
we randomly ``re-mask'' another set of values, optimize the autoencoder by
reconstructing this re-masked set, and apply the trained model to predict the
missing values; and effective -- with extensive evaluation on benchmark
datasets, we show that ReMasker performs on par with or outperforms
state-of-the-art methods in terms of both imputation fidelity and utility under
various missingness settings, while its performance advantage often increases
with the ratio of missing data. We further explore theoretical justification
for its effectiveness, showing that ReMasker tends to learn
missingness-invariant representations of tabular data. Our findings indicate
that masked modeling represents a promising direction for further research on
tabular data imputation. The code is publicly available.
- Abstract(参考訳): 本稿では,マスク付き自動エンコーディングフレームワークを拡張し,表データに欠けている値を暗示する新しい手法であるremaskerを提案する。
Compared with prior work, ReMasker is both simple -- besides the missing values (i.e., naturally masked), we randomly ``re-mask'' another set of values, optimize the autoencoder by reconstructing this re-masked set, and apply the trained model to predict the missing values; and effective -- with extensive evaluation on benchmark datasets, we show that ReMasker performs on par with or outperforms state-of-the-art methods in terms of both imputation fidelity and utility under various missingness settings, while its performance advantage often increases with the ratio of missing data.
さらに、ReMaskerはグラフデータの欠如と不変表現を学習しがちであることを示す理論的正当性についても検討する。
以上の結果から,マスキングモデリングは表データインプテーションのさらなる研究にとって有望な方向性であることが示唆された。
コードは公開されている。
関連論文リスト
- MacDiff: Unified Skeleton Modeling with Masked Conditional Diffusion [14.907473847787541]
人間の骨格モデリングのための統合フレームワークとして,Masked Diffusion Conditional (MacDiff)を提案する。
まず,拡散モデルを用いて効率的な骨格表現学習を行う。
MacDiffは、生成タスクの能力を維持しながら、表現学習ベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-09-16T17:06:10Z) - ColorMAE: Exploring data-independent masking strategies in Masked AutoEncoders [53.3185750528969]
Masked AutoEncoders (MAE)は、堅牢な自己管理フレームワークとして登場した。
データに依存しないColorMAEという手法を導入し、ランダムノイズをフィルタすることで異なる二元マスクパターンを生成する。
ランダムマスキングと比較して,下流タスクにおける戦略の優位性を示す。
論文 参考訳(メタデータ) (2024-07-17T22:04:00Z) - Understanding Masked Autoencoders via Hierarchical Latent Variable
Models [109.35382136147349]
Masked Autoencoder (MAE) は近年,様々な視覚タスクにおいて顕著な成功を収めている。
MAEに関する興味深い経験的観察の出現にもかかわらず、理論的に原理化された理解はいまだに欠如している。
論文 参考訳(メタデータ) (2023-06-08T03:00:10Z) - RARE: Robust Masked Graph Autoencoder [45.485891794905946]
Masked graph autoencoder (MGAE) は、有望な自己教師付きグラフ事前学習(SGP)パラダイムとして登場した。
本稿では,ロバストmAsked gRaph autoEncoder (RARE) と呼ばれる新しいSGP手法を提案する。
論文 参考訳(メタデータ) (2023-04-04T03:35:29Z) - Improving Masked Autoencoders by Learning Where to Mask [65.89510231743692]
マスケ画像モデリングは視覚データに対する有望な自己教師型学習手法である。
本稿では,Gumbel-Softmax を用いて,対向学習マスク生成装置とマスク誘導画像モデリングプロセスとを相互接続するフレームワーク AutoMAE を提案する。
実験の結果,AutoMAEは,標準の自己監督型ベンチマークや下流タスクに対して,効果的な事前学習モデルを提供することがわかった。
論文 参考訳(メタデータ) (2023-03-12T05:28:55Z) - Masked Autoencoding for Scalable and Generalizable Decision Making [93.84855114717062]
MaskDPは、強化学習と行動クローンのためのシンプルでスケーラブルな自己教師付き事前学習手法である。
我々は,MaskDPモデルにより,単一ゴールや複数ゴール到達といった新しいBCタスクへのゼロショット転送能力が得られることを発見した。
論文 参考訳(メタデータ) (2022-11-23T07:04:41Z) - Effectiveness of Detection-based and Regression-based Approaches for
Estimating Mask-Wearing Ratio [46.377391632446624]
保健当局が政策を迅速に分析し実施できるようにするため、公共の場でマスク着用率を推定することが重要である。
本稿では,検出に基づく手法と回帰に基づく手法を併用した2つの比推定手法を提案する。
我々はまた、17のストリートビュービデオ18,088フレームから抽出された581,108の顔アノテーションを含む最初の大規模データセットであるNFMデータセットを提示する。
論文 参考訳(メタデータ) (2021-11-25T03:32:13Z) - Representation Learning for Sequence Data with Deep Autoencoding
Predictive Components [96.42805872177067]
本稿では,シーケンスデータの有用な表現が潜在空間における単純な構造を示すべきという直感に基づく,シーケンスデータの自己教師型表現学習法を提案する。
我々は,過去と将来のウィンドウ間の相互情報である潜在特徴系列の予測情報を最大化することにより,この潜時構造を奨励する。
提案手法は,ノイズの多い動的システムの潜時空間を復元し,タスク予測のための予測特徴を抽出し,エンコーダを大量の未ラベルデータで事前訓練する場合に音声認識を改善する。
論文 参考訳(メタデータ) (2020-10-07T03:34:01Z) - Masking as an Efficient Alternative to Finetuning for Pretrained
Language Models [49.64561153284428]
我々は、微調整によって修正する代わりに、事前訓練された重量に対する選択的な二乗マスクを学習する。
内在的評価では、マスキング言語モデルによって計算された表現が、下流タスクの解決に必要な情報を符号化していることを示す。
論文 参考訳(メタデータ) (2020-04-26T15:03:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。