論文の概要: A Missing Value Filling Model Based on Feature Fusion Enhanced
Autoencoder
- arxiv url: http://arxiv.org/abs/2208.13495v2
- Date: Thu, 3 Aug 2023 05:18:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-04 17:35:29.632322
- Title: A Missing Value Filling Model Based on Feature Fusion Enhanced
Autoencoder
- Title(参考訳): 特徴融合強化オートエンコーダに基づく欠落値充足モデル
- Authors: Xinyao Liu, Shengdong Du, Tianrui Li, Fei Teng and Yan Yang
- Abstract要約: 本稿では,機能融合型オートエンコーダをベースとした不足値充足モデルを提案する。
動的クラスタリングに基づく,不足値の充足戦略を開発した。
提案手法の有効性を実験により検証した。
- 参考スコア(独自算出の注目度): 7.232232177308124
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the advent of the big data era, the data quality problem is becoming
more critical. Among many factors, data with missing values is one primary
issue, and thus developing effective imputation models is a key topic in the
research community. Recently, a major research direction is to employ neural
network models such as self-organizing mappings or automatic encoders for
filling missing values. However, these classical methods can hardly discover
interrelated features and common features simultaneously among data attributes.
Especially, it is a very typical problem for classical autoencoders that they
often learn invalid constant mappings, which dramatically hurts the filling
performance. To solve the above-mentioned problems, we propose a
missing-value-filling model based on a feature-fusion-enhanced autoencoder. We
first incorporate into an autoencoder a hidden layer that consists of
de-tracking neurons and radial basis function neurons, which can enhance the
ability of learning interrelated features and common features. Besides, we
develop a missing value filling strategy based on dynamic clustering that is
incorporated into an iterative optimization process. This design can enhance
the multi-dimensional feature fusion ability and thus improves the dynamic
collaborative missing-value-filling performance. The effectiveness of the
proposed model is validated by extensive experiments compared to a variety of
baseline methods on thirteen data sets.
- Abstract(参考訳): ビッグデータ時代の到来により、データ品質の問題はさらに重要になりつつある。
多くの要因のうち、値が欠けているデータは主要な問題の一つであり、効果的なインプテーションモデルの開発は研究コミュニティの重要なトピックである。
最近では、自己組織化マッピングや自動エンコーダなどのニューラルネットワークモデルを用いて、不足した値を埋めることが主な研究方向である。
しかし、これらの古典的手法は、データ属性間で相互に関係する特徴や共通の特徴を同時に発見することができない。
特に、古典的なオートエンコーダにとって、しばしば無効な定数マッピングを学ぶことは典型的な問題であり、これは充填性能を劇的に損なう。
上記の問題を解決するために,機能融合型オートエンコーダに基づく不備値充足モデルを提案する。
まず,非追跡ニューロンと放射状基底関数ニューロンからなる隠れた層を自動エンコーダに組み込み,相互関連特徴や共通特徴を学習する能力を高める。
さらに、反復最適化プロセスに組み込まれた動的クラスタリングに基づく、不足値の充足戦略を開発する。
この設計により,多次元機能融合能力が向上し,ダイナミックなコラボレーティブな欠落値充足性能が向上する。
提案モデルの有効性は,13データセット上の様々なベースライン手法と比較して,広範囲な実験により検証される。
関連論文リスト
- Localized Gaussians as Self-Attention Weights for Point Clouds Correspondence [92.07601770031236]
本稿では,エンコーダのみのトランスフォーマーアーキテクチャのアテンションヘッドにおける意味的意味パターンについて検討する。
注意重みの修正はトレーニングプロセスの促進だけでなく,最適化の安定性の向上にも寄与する。
論文 参考訳(メタデータ) (2024-09-20T07:41:47Z) - Combating Missing Modalities in Egocentric Videos at Test Time [92.38662956154256]
現実のアプリケーションは、プライバシの懸念、効率性の必要性、ハードウェアの問題により、不完全なモダリティを伴う問題に直面することが多い。
再トレーニングを必要とせずに,テスト時にこの問題に対処する新しい手法を提案する。
MiDlは、欠落したモダリティをテスト時にのみ扱う、自己管理型のオンラインソリューションとしては初めてのものだ。
論文 参考訳(メタデータ) (2024-04-23T16:01:33Z) - Latent variable model for high-dimensional point process with structured missingness [4.451479907610764]
縦断データは医療、社会学、地震学など多くの分野で重要である。
実世界のデータセットは高次元であり、構造化された欠陥パターンを含み、測定時間ポイントは未知のプロセスによって管理される。
これらの制限に対処可能な、柔軟で効率的な潜在変数モデルを提案する。
論文 参考訳(メタデータ) (2024-02-08T15:41:48Z) - A Performance-Driven Benchmark for Feature Selection in Tabular Deep
Learning [131.2910403490434]
データサイエンティストは通常、データセットにできるだけ多くの機能を集め、既存の機能から新しい機能を設計する。
既存のタブ形式の特徴選択のためのベンチマークでは、古典的な下流モデル、おもちゃの合成データセット、あるいは下流のパフォーマンスに基づいて特徴セレクタを評価していない。
変換器を含む下流ニューラルネットワーク上で評価された課題のある特徴選択ベンチマークを構築した。
また,従来の特徴選択法よりも高い性能を有するニューラルネットワークのための,Lassoのインプット・グラディエント・ベース・アナログも提案する。
論文 参考訳(メタデータ) (2023-11-10T05:26:10Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - Key-Exchange Convolutional Auto-Encoder for Data Augmentation in Early
Knee OsteoArthritis Classification [9.400820679110147]
膝骨関節炎(KOA)は高齢者の移動を損なう筋骨格疾患である。
畳み込み型オートエンコーダに基づく学習モデルと,KOA早期診断のための新たなデータを生成するハイブリッド損失戦略を提案する。
論文 参考訳(メタデータ) (2023-02-26T15:45:19Z) - Interpreting Black-box Machine Learning Models for High Dimensional
Datasets [40.09157165704895]
我々は、高次元データセット上でブラックボックスモデルをトレーニングし、その分類が行われる埋め込みを学習する。
次に、トップk特徴空間上の解釈可能な代理モデルを用いてブラックボックスモデルの挙動を近似する。
我々のアプローチは、異なるデータセットでテストした場合、TabNetやXGboostのような最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2022-08-29T07:36:17Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - Latent Vector Expansion using Autoencoder for Anomaly Detection [1.370633147306388]
オートエンコーダの特徴を利用して,低次元から高次元の潜在ベクトルを訓練する。
不均衡なデータの分類性能を向上させる潜在ベクトル展開オートエンコーダモデルを提案する。
論文 参考訳(メタデータ) (2022-01-05T02:28:38Z) - Learning Causal Models Online [103.87959747047158]
予測モデルは、予測を行うためにデータの急激な相関に依存することができる。
強い一般化を達成するための一つの解決策は、モデルに因果構造を組み込むことである。
本稿では,突発的特徴を継続的に検出・除去するオンラインアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-12T20:49:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。