論文の概要: Learned Feature Importance Scores for Automated Feature Engineering
- arxiv url: http://arxiv.org/abs/2406.04153v1
- Date: Thu, 6 Jun 2024 15:17:00 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-07 14:20:13.568945
- Title: Learned Feature Importance Scores for Automated Feature Engineering
- Title(参考訳): 自動機能エンジニアリングのための学習された特徴重要度スコア
- Authors: Yihe Dong, Sercan Arik, Nathanael Yoder, Tomas Pfister,
- Abstract要約: AutoMANは、高精度で低レイテンシを実現し、異種データに拡張可能な、自動機能エンジニアリングフレームワークである。
これは、変換された特徴を明確に示さずに、候補変換空間を効果的に探索することに基づいている。
データセットのタスクターゲットを直接機能エンジニアリングに組み込んで、機能変換の重要性をエンドツーエンドに学習する。
- 参考スコア(独自算出の注目度): 26.49891047211272
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Feature engineering has demonstrated substantial utility for many machine learning workflows, such as in the small data regime or when distribution shifts are severe. Thus automating this capability can relieve much manual effort and improve model performance. Towards this, we propose AutoMAN, or Automated Mask-based Feature Engineering, an automated feature engineering framework that achieves high accuracy, low latency, and can be extended to heterogeneous and time-varying data. AutoMAN is based on effectively exploring the candidate transforms space, without explicitly manifesting transformed features. This is achieved by learning feature importance masks, which can be extended to support other modalities such as time series. AutoMAN learns feature transform importance end-to-end, incorporating a dataset's task target directly into feature engineering, resulting in state-of-the-art performance with significantly lower latency compared to alternatives.
- Abstract(参考訳): 機能エンジニアリングは、小さなデータ構造や分散シフトが深刻である場合など、多くの機械学習ワークフローにかなりの有用性を示している。
したがって、この機能を自動化すれば、多くの手作業が軽減され、モデルのパフォーマンスが向上します。
そこで我々は,高い精度,低レイテンシを実現する自動機能エンジニアリングフレームワークであるAutoMAN(Automated Mask-based Feature Engineering)を提案する。
AutoMANは、変換された特徴を明確に示さずに、候補の変換空間を効果的に探索することに基づいている。
これは、時系列などの他のモダリティをサポートするために拡張できる特徴重要マスクの学習によって達成される。
AutoMANは、データセットのタスクターゲットを直接機能エンジニアリングに組み込むことで、機能変換の重要性をエンドツーエンドに学習する。
関連論文リスト
- Automated data processing and feature engineering for deep learning and big data applications: a survey [0.0]
現代の人工知能(AI)のアプローチは、データから直接学習するアルゴリズムを設計することを目的としている。
従来のディープラーニングパイプラインのすべてのデータ処理タスクが自動化されたわけではない。
論文 参考訳(メタデータ) (2024-03-18T01:07:48Z) - AutoAct: Automatic Agent Learning from Scratch for QA via Self-Planning [54.47116888545878]
AutoActはQAのための自動エージェント学習フレームワークである。
大規模アノテートデータやクローズドソースモデルからの合成計画軌道は依存していない。
論文 参考訳(メタデータ) (2024-01-10T16:57:24Z) - TaskBench: Benchmarking Large Language Models for Task Automation [85.3879908356586]
タスク自動化における大規模言語モデルの能力を評価するためにTaskBenchを導入します。
高品質な評価データセットを生成するために,ツールグラフの概念を導入する。
また,タスク分解,ツールの実行,パラメータ予測など,さまざまな側面からLCMの能力を評価するためのTaskEvalを提案する。
論文 参考訳(メタデータ) (2023-11-30T18:02:44Z) - Benchmarking Automated Machine Learning Methods for Price Forecasting
Applications [58.720142291102135]
自動機械学習(AutoML)ソリューションで手作業で作成したMLパイプラインを置換する可能性を示す。
CRISP-DMプロセスに基づいて,手動MLパイプラインを機械学習と非機械学習に分割した。
本稿では、価格予測の産業利用事例として、ドメイン知識とAutoMLを組み合わせることで、ML専門家への依存が弱まることを示す。
論文 参考訳(メタデータ) (2023-04-28T10:27:38Z) - Traceable Automatic Feature Transformation via Cascading Actor-Critic
Agents [25.139229855367088]
特徴変換は機械学習(ML)の有効性と解釈可能性を高めるための必須課題である
特徴変換タスクを、特徴生成と選択の反復的、ネストされたプロセスとして定式化する。
高次元データにおけるSOTAとロバスト性と比較すると,F1スコアの24.7%の改善が見られた。
論文 参考訳(メタデータ) (2022-12-27T08:20:19Z) - Automated Machine Learning Techniques for Data Streams [91.3755431537592]
本稿では、最先端のオープンソースAutoMLツールを調査し、ストリームから収集したデータに適用し、時間とともにパフォーマンスがどのように変化するかを測定する。
この結果から,既製のAutoMLツールで十分な結果が得られることが示されたが,概念ドリフトや検出,適応といった手法が適用されれば,予測精度を時間とともに維持することが可能になる。
論文 参考訳(メタデータ) (2021-06-14T11:42:46Z) - Efficient Feature Transformations for Discriminative and Generative
Continual Learning [98.10425163678082]
継続的学習のための簡易タスク特化機能マップ変換戦略を提案する。
これらは新しいタスクを学習するための強力な柔軟性を提供し、ベースアーキテクチャに最小パラメータを追加することで実現される。
本手法の有効性と効率を,判別(cifar-100およびimagenet-1k)および生成的タスクの一連の実験を用いて実証する。
論文 参考訳(メタデータ) (2021-03-25T01:48:14Z) - DIFER: Differentiable Automated Feature Engineering [12.961270020632362]
機械学習の重要なステップである機能エンジニアリングは、生データから有用な機能を抽出し、データ品質を改善することを目的としている。
連続ベクトル空間における微分可能自動特徴工学を実現するために,DIFERと呼ばれる効率的な勾配法を提案する。
この結果から,DIFERは機械学習アルゴリズムの性能を著しく向上させ,現在のAutoFE手法よりも効率と性能の両面で優れていることを示す。
論文 参考訳(メタデータ) (2020-10-17T12:55:45Z) - TimeAutoML: Autonomous Representation Learning for Multivariate
Irregularly Sampled Time Series [27.0506649441212]
本稿では,不規則なサンプリングレートと可変長を持つ多変量時系列(TimeAutoML)の自律表現学習手法を提案する。
実世界のデータセットに関する大規模な実証研究は、提案されたTimeAutoMLが、様々なタスクにおける競合するアプローチを大きなマージンで上回ることを示した。
論文 参考訳(メタデータ) (2020-10-04T15:01:46Z) - AutoFIS: Automatic Feature Interaction Selection in Factorization Models
for Click-Through Rate Prediction [75.16836697734995]
自動特徴相互作用選択(AutoFIS)と呼ばれる2段階のアルゴリズムを提案する。
AutoFISは、目標モデルを収束させるためにトレーニングするのと同等の計算コストで、因子化モデルに対する重要な特徴的相互作用を自動的に識別することができる。
AutoFISはHuawei App Storeレコメンデーションサービスのトレーニングプラットフォームにデプロイされている。
論文 参考訳(メタデータ) (2020-03-25T06:53:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。