論文の概要: How Usable is Automated Feature Engineering for Tabular Data?
- arxiv url: http://arxiv.org/abs/2508.13932v1
- Date: Tue, 19 Aug 2025 15:23:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-20 15:36:31.985927
- Title: How Usable is Automated Feature Engineering for Tabular Data?
- Title(参考訳): タブラルデータの自動機能エンジニアリングはどの程度有効か?
- Authors: Bastian Schäfer, Lennart Purucker, Maciej Janowski, Frank Hutter,
- Abstract要約: 自動特徴工学(AutoFE)手法は、実践者にとってのユーザビリティについて、これまで調査されていない。
これらの手法は一般的には使いづらく、ドキュメントが欠如し、アクティブなコミュニティがないことが分かりました。
我々の調査は、使い勝手の良いAutoFEメソッドに関する今後の研究の必要性を強調している。
- 参考スコア(独自算出の注目度): 37.89654305075891
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Tabular data, consisting of rows and columns, is omnipresent across various machine learning applications. Each column represents a feature, and features can be combined or transformed to create new, more informative features. Such feature engineering is essential to achieve peak performance in machine learning. Since manual feature engineering is expensive and time-consuming, a substantial effort has been put into automating it. Yet, existing automated feature engineering (AutoFE) methods have never been investigated regarding their usability for practitioners. Thus, we investigated 53 AutoFE methods. We found that these methods are, in general, hard to use, lack documentation, and have no active communities. Furthermore, no method allows users to set time and memory constraints, which we see as a necessity for usable automation. Our survey highlights the need for future work on usable, well-engineered AutoFE methods.
- Abstract(参考訳): 行と列で構成されるタブラルデータは、さまざまな機械学習アプリケーションに共通に表現されている。
それぞれの列は機能を表しており、新しい、より情報のある機能を作成するために、機能を結合または変換することができる。
このような特徴工学は、機械学習におけるピークパフォーマンスを達成するために不可欠である。
手動のフィーチャーエンジニアリングは高価で時間を要するため、自動化にかなりの努力が払われている。
しかし、既存の自動機能エンジニアリング(AutoFE)手法は、実践者にとってのユーザビリティについて調査されていない。
そこで我々は53のAutoFE法について検討した。
これらの手法は一般的には使いづらく、ドキュメントが欠如し、アクティブなコミュニティがないことが分かりました。
さらに、ユーザが時間とメモリの制約を設定できる方法はなく、使用可能な自動化に必要なものだと考えています。
我々の調査は、使い勝手の良いAutoFEメソッドに関する今後の研究の必要性を強調している。
関連論文リスト
- Learned Feature Importance Scores for Automated Feature Engineering [26.49891047211272]
AutoMANは、高精度で低レイテンシを実現し、異種データに拡張可能な、自動機能エンジニアリングフレームワークである。
これは、変換された特徴を明確に示さずに、候補変換空間を効果的に探索することに基づいている。
データセットのタスクターゲットを直接機能エンジニアリングに組み込んで、機能変換の重要性をエンドツーエンドに学習する。
論文 参考訳(メタデータ) (2024-06-06T15:17:00Z) - Learning Generalizable Tool Use with Non-rigid Grasp-pose Registration [29.998917158604694]
本稿では,ツール使用行動の強化学習を可能にする新しい手法を提案する。
私たちのアプローチは、ひとつのデモだけで新しいカテゴリのツールの操作を学ぶためのスケーラブルな方法を提供します。
学習したポリシーは複雑なツールの使用タスクを解決し、テスト時に見えないツールに一般化する。
論文 参考訳(メタデータ) (2023-07-31T08:49:11Z) - Large Language Models for Automated Data Science: Introducing CAAFE for
Context-Aware Automated Feature Engineering [52.09178018466104]
データセットのセマンティックな特徴を生成するために、コンテキスト認識自動特徴工学(CAAFE)を導入する。
方法論的には単純だが、CAAFEは14のデータセットのうち11のパフォーマンスを改善している。
我々は,AutoMLシステムの範囲をセマンティックなAutoMLに拡張できるコンテキスト認識ソリューションの重要性を強調した。
論文 参考訳(メタデータ) (2023-05-05T09:58:40Z) - Unsupervised Automata Learning via Discrete Optimization [7.06671668667062]
与えられたラベルなし単語の多元集合から決定論的有限オートマトン(DFA)を学習するためのフレームワークを提案する。
この問題は計算的に困難であることが示され,制約最適化に基づく3つの学習アルゴリズムが開発された。
DFAの全体的な解釈性を改善するため,最適化問題に対する新たな正規化手法を導入する。
論文 参考訳(メタデータ) (2023-03-24T16:19:15Z) - AutoSmart: An Efficient and Automatic Machine Learning framework for
Temporal Relational Data [30.61871094916853]
テンポラルリレーショナルデータは、おそらく産業機械学習アプリケーションで最もよく使われるデータ型である。
本研究では,上記の問題にエンドツーエンドの自動処理で対処する手法を提案する。
提案されたフレームワークであるAutoSmartは、AutoML TrackのKDD Cup 2019で優勝したソリューションである。
論文 参考訳(メタデータ) (2021-09-09T09:11:23Z) - Automated Machine Learning Techniques for Data Streams [91.3755431537592]
本稿では、最先端のオープンソースAutoMLツールを調査し、ストリームから収集したデータに適用し、時間とともにパフォーマンスがどのように変化するかを測定する。
この結果から,既製のAutoMLツールで十分な結果が得られることが示されたが,概念ドリフトや検出,適応といった手法が適用されれば,予測精度を時間とともに維持することが可能になる。
論文 参考訳(メタデータ) (2021-06-14T11:42:46Z) - AutoGL: A Library for Automated Graph Learning [67.63587865669372]
グラフ上での機械学習を自動化するための,最初の専用ライブラリであるAutomated Graph Learning(AutoGL)を紹介する。
AutoGLはオープンソースで、使いやすく、拡張も柔軟です。
また、パイプラインのカスタマイズとアプリケーションの強化を容易にする、AutoGLの軽量バージョンであるAutoGL-lightも紹介します。
論文 参考訳(メタデータ) (2021-04-11T10:49:23Z) - AutoML to Date and Beyond: Challenges and Opportunities [30.60364966752454]
AutoMLツールは、機械学習を非機械学習の専門家が利用できるようにすることを目的としている。
本稿では,AutoMLシステムのための新しい分類システムを提案する。
エンド・ツー・エンドの機械学習パイプラインのさらなる自動化に必要な研究を指摘して、将来のロードマップを策定しました。
論文 参考訳(メタデータ) (2020-10-21T06:08:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。