論文の概要: FeatGeNN: Improving Model Performance for Tabular Data with
Correlation-based Feature Extraction
- arxiv url: http://arxiv.org/abs/2308.07527v1
- Date: Tue, 15 Aug 2023 01:48:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-16 14:20:33.213714
- Title: FeatGeNN: Improving Model Performance for Tabular Data with
Correlation-based Feature Extraction
- Title(参考訳): featgenn:相関型特徴抽出による表データモデル性能の向上
- Authors: Sammuel Ramos Silva and Rodrigo Silva
- Abstract要約: FeatGeNNは、プール機能として相関を使って新機能を抽出し、生成する畳み込み方式である。
提案手法を様々なベンチマークデータセット上で評価し,FeatGeNNがモデル性能に関する既存のAutoFEアプローチより優れていることを示す。
- 参考スコア(独自算出の注目度): 0.22792085593908193
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automated Feature Engineering (AutoFE) has become an important task for any
machine learning project, as it can help improve model performance and gain
more information for statistical analysis. However, most current approaches for
AutoFE rely on manual feature creation or use methods that can generate a large
number of features, which can be computationally intensive and lead to
overfitting. To address these challenges, we propose a novel convolutional
method called FeatGeNN that extracts and creates new features using correlation
as a pooling function. Unlike traditional pooling functions like max-pooling,
correlation-based pooling considers the linear relationship between the
features in the data matrix, making it more suitable for tabular data. We
evaluate our method on various benchmark datasets and demonstrate that FeatGeNN
outperforms existing AutoFE approaches regarding model performance. Our results
suggest that correlation-based pooling can be a promising alternative to
max-pooling for AutoFE in tabular data applications.
- Abstract(参考訳): 自動機能エンジニアリング(autofe:automatic feature engineering)は、モデルのパフォーマンス向上と統計解析のさらなる情報獲得に役立つため、マシンラーニングプロジェクトにおいて重要なタスクとなっている。
しかし、現在のAutoFEのアプローチのほとんどは、多数の機能を生成することができる手動の機能生成や使用方法に依存しており、計算集約的で過度な適合につながる可能性がある。
これらの課題に対処するために,相関関数をプーリング関数として,新たな特徴抽出と生成を行う,featgennと呼ばれる新しい畳み込み手法を提案する。
最大プーリングのような従来のプール機能とは異なり、相関ベースのプーリングはデータマトリックスの機能間の線形関係を考慮し、表データにより適している。
提案手法を様々なベンチマークデータセット上で評価し,FeatGeNNがモデル性能に関する既存のAutoFEアプローチより優れていることを示す。
この結果から,相関型プールは表データアプリケーションにおけるAutoFEの最大プールの代替となる可能性が示唆された。
関連論文リスト
- An improved tabular data generator with VAE-GMM integration [9.4491536689161]
本稿では,現在のアプローチの限界に対処する新しい変分オートエンコーダ(VAE)モデルを提案する。
本手法は,TVAEモデルにインスパイアされたベイジアン・ガウス混合モデル(BGM)をVAEアーキテクチャに組み込む。
我々は,2つの医療関連データセットを含む混合データ型を持つ実世界の3つのデータセットに対して,我々のモデルを徹底的に検証する。
論文 参考訳(メタデータ) (2024-04-12T12:31:06Z) - Interpretable Machine Learning for TabPFN [5.012821694203072]
TabPFNモデルは、様々な分類タスクで最先端のパフォーマンスを達成することができる。
モデルのユニークな性質を利用することで、我々の適応はより効率的な計算を可能にします。
論文 参考訳(メタデータ) (2024-03-16T13:35:15Z) - AutoFT: Learning an Objective for Robust Fine-Tuning [60.641186718253735]
ファンデーションモデルは、微調整によって下流タスクに適応できるリッチな表現をエンコードする。
手作り正則化技術を用いた頑健な微調整への最近のアプローチ
我々は、堅牢な微調整のためのデータ駆動型アプローチであるAutoFTを提案する。
論文 参考訳(メタデータ) (2024-01-18T18:58:49Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - FAStEN: an efficient adaptive method for feature selection and
estimation in high-dimensional functional regressions [8.384075654211685]
本稿では,スパース関数オン・ファンクション回帰問題において特徴選択を行うための,新しい,柔軟な,超効率的なアプローチを提案する。
我々はそれをスカラー・オン・ファンクション・フレームワークに拡張する方法を示す。
AOMIC PIOP1による脳MRIデータへの応用について述べる。
論文 参考訳(メタデータ) (2023-03-26T19:41:17Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - Data Fusion with Latent Map Gaussian Processes [0.0]
多要素モデリングとキャリブレーションは、エンジニアリング設計においてユビキタスに発生するデータ融合タスクである。
本稿では,遅延マップガウス過程(LMGP)に基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2021-12-04T00:54:19Z) - ARM-Net: Adaptive Relation Modeling Network for Structured Data [29.94433633729326]
ARM-Netは、構造化データに適した適応関係モデリングネットワークであり、リレーショナルデータのためのARM-Netに基づく軽量フレームワークARMORである。
ARM-Netは既存のモデルより一貫して優れており、データセットに対してより解釈可能な予測を提供する。
論文 参考訳(メタデータ) (2021-07-05T07:37:24Z) - Efficient Data-specific Model Search for Collaborative Filtering [56.60519991956558]
協調フィルタリング(CF)はレコメンダシステムの基本的なアプローチである。
本稿では,機械学習(AutoML)の最近の進歩を動機として,データ固有のCFモデルを設計することを提案する。
ここでキーとなるのは、最先端(SOTA)のCFメソッドを統一し、それらを入力エンコーディング、埋め込み関数、インタラクション、予測関数の非結合ステージに分割する新しいフレームワークである。
論文 参考訳(メタデータ) (2021-06-14T14:30:32Z) - Learning summary features of time series for likelihood free inference [93.08098361687722]
時系列データから要約機能を自動的に学習するためのデータ駆動型戦略を提案する。
以上の結果から,データから要約的特徴を学習することで,手作りの値に基づいてLFI手法よりも優れる可能性が示唆された。
論文 参考訳(メタデータ) (2020-12-04T19:21:37Z) - S^3-Rec: Self-Supervised Learning for Sequential Recommendation with
Mutual Information Maximization [104.87483578308526]
本稿では,シーケンスレコメンデーションのための自己改善学習のためのモデルS3-Recを提案する。
そこで本稿では,属性,項目,サブシーケンス,シーケンス間の相関関係を学習するために,4つの補助的自己教師対象を考案する。
6つの実世界のデータセットで実施された大規模な実験は、既存の最先端手法よりも提案手法が優れていることを示す。
論文 参考訳(メタデータ) (2020-08-18T11:44:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。