Fugu-MT 論文翻訳(概要): LLM-FE: Automated Feature Engineering for Tabular Data with LLMs as Evolutionary Optimizers

論文の概要: LLM-FE: Automated Feature Engineering for Tabular Data with LLMs as Evolutionary Optimizers

arxiv url: http://arxiv.org/abs/2503.14434v1
Date: Tue, 18 Mar 2025 17:11:24 GMT
ステータス: 翻訳完了
システム内更新日: 2025-03-19 16:29:13.347743
Title: LLM-FE: Automated Feature Engineering for Tabular Data with LLMs as Evolutionary Optimizers
Title（参考訳）: LLM-FE: LLMを進化最適化として用いた語彙データの自動特徴工学
Authors: Nikhil Abhyankar, Parshin Shojaee, Chandan K. Reddy,
Abstract要約: 大規模言語モデル(LLM)は、機能エンジニアリングプロセスにドメイン知識を統合することを可能にする。進化的探索とドメイン知識とLLMの推論能力を組み合わせた新しいフレームワーク LLM-FE を提案する。以上の結果から,LLM-FEは最先端のベースラインを一貫して上回っていることが明らかとなった。
参考スコア（独自算出の注目度）: 10.282327560070202
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Automated feature engineering plays a critical role in improving predictive model performance for tabular learning tasks. Traditional automated feature engineering methods are limited by their reliance on pre-defined transformations within fixed, manually designed search spaces, often neglecting domain knowledge. Recent advances using Large Language Models (LLMs) have enabled the integration of domain knowledge into the feature engineering process. However, existing LLM-based approaches use direct prompting or rely solely on validation scores for feature selection, failing to leverage insights from prior feature discovery experiments or establish meaningful reasoning between feature generation and data-driven performance. To address these challenges, we propose LLM-FE, a novel framework that combines evolutionary search with the domain knowledge and reasoning capabilities of LLMs to automatically discover effective features for tabular learning tasks. LLM-FE formulates feature engineering as a program search problem, where LLMs propose new feature transformation programs iteratively, and data-driven feedback guides the search process. Our results demonstrate that LLM-FE consistently outperforms state-of-the-art baselines, significantly enhancing the performance of tabular prediction models across diverse classification and regression benchmarks.
Abstract（参考訳）: 自動機能エンジニアリングは、表型学習タスクの予測モデルパフォーマンスを改善する上で重要な役割を果たす。従来の自動機能エンジニアリング手法は、固定された手動で設計された検索空間内の事前定義された変換に依存しており、ドメインの知識を無視することが多い。大規模言語モデル(LLM)を用いた最近の進歩により、機能エンジニアリングプロセスへのドメイン知識の統合が可能になった。しかし、既存のLCMベースのアプローチでは、機能選択の検証スコアのみを直接的なプロンプトまたは依存し、以前の特徴発見実験からの洞察を活用できなかったり、特徴生成とデータ駆動のパフォーマンスの間に有意義な推論を確立することができなかった。これらの課題に対処するために,LLMの進化的探索とドメイン知識と推論能力を組み合わせた新しいフレームワーク LLM-FE を提案する。 LLM-FEは、プログラム検索問題として機能工学を定式化し、LCMが新たな機能変換プログラムを反復的に提案し、データ駆動フィードバックが探索プロセスを導く。以上の結果から,LLM-FEは最先端のベースラインを一貫して上回り,多様な分類および回帰ベンチマークで表層予測モデルの性能を著しく向上させることが示された。

関連論文リスト

Human-LLM Collaborative Feature Engineering for Tabular Data [22.2647889885109]
大規模言語モデル(LLM)は、表型学習における機能工学の自動化にますます利用されている。現在のアプローチでは、LLMをブラックボックスとして割り当て、操作の提案と選択の両方に責任を負う。本稿では,人間-LLM協調機能エンジニアリングフレームワークを提案する。
論文参考訳（メタデータ） (2026-01-28T21:33:42Z)
Tabular Feature Discovery With Reasoning Type Exploration [5.030210915367596]
大きな言語モデル(LLM)は、その膨大な知識を活用して、新しい機能を自動生成するために使われてきた。本稿では,複数種類の推論を活かして多種多様な情報的特徴の発見を支援する新しい手法REFeatを提案する。
論文参考訳（メタデータ） (2025-06-25T12:18:34Z)
Iterative Self-Incentivization Empowers Large Language Models as Agentic Searchers [74.17516978246152]
大規模言語モデル(LLM)は、従来の手法を進化させるために情報検索に広く統合されている。エージェント検索フレームワークであるEXSEARCHを提案する。 4つの知識集約ベンチマークの実験では、EXSEARCHはベースラインを大幅に上回っている。
論文参考訳（メタデータ） (2025-05-26T15:27:55Z)
LLM-Guided Evolution: An Autonomous Model Optimization for Object Detection [0.0]
機械学習では、ニューラルネットワークサーチ(NAS)はモデル設計のドメイン知識と、有望なパフォーマンスを達成するために大量の試行錯誤を必要とする。 Large Language Model (LLM)-Guided Evolution (GE)フレームワークは、CIFARデータ上の画像分類アルゴリズムのモデルソースコードを直接修正するためにLLMを組み込むことによって、このアプローチを変革した。 LLM-GEは平均平均精度を92.5%から94.5%に向上させるなど,大幅な性能向上を図った。
論文参考訳（メタデータ） (2025-04-03T05:06:06Z)
Efficient Model Selection for Time Series Forecasting via LLMs [52.31535714387368]
本稿では,Large Language Models (LLM) をモデル選択の軽量な代替手段として活用することを提案する。提案手法は, LLMの固有知識と推論能力を活用することで, 明示的な性能行列の必要性を解消する。
論文参考訳（メタデータ） (2025-04-02T20:33:27Z)
From Selection to Generation: A Survey of LLM-based Active Learning [153.8110509961261]
大きな言語モデル(LLM)は、全く新しいデータインスタンスを生成し、よりコスト効率の良いアノテーションを提供するために使われています。本調査は,LSMに基づくAL手法の直感的な理解を目指して,研究者や実践者の最新のリソースとして機能することを目的としている。
論文参考訳（メタデータ） (2025-02-17T12:58:17Z)
LLM-Lasso: A Robust Framework for Domain-Informed Feature Selection and Regularization [59.75242204923353]
LLM-Lassoは大規模言語モデル(LLM)を利用してラッソ回帰における特徴選択を導くフレームワークである。 LLMは各特徴に対してペナルティ因子を生成し、単純でチューニング可能なモデルを用いてラスソペナルティの重みに変換される。 LLMによりより関連づけられた特徴は、より低い罰を受け、最終モデルに保持される可能性を高める。
論文参考訳（メタデータ） (2025-02-15T02:55:22Z)
A Framework for Using LLMs for Repository Mining Studies in Empirical Software Engineering [12.504438766461027]
大規模言語モデル(LLM)は、ソフトウェアリポジトリを分析する革新的な方法を提供することで、ソフトウェア工学(SE)を変革した。私たちの研究は、PRIMES(Prompt Refinement and Insights for Mining Empirical Software repository)というフレームワークをまとめています。この結果,PRIMESの標準化により,LLMを用いた研究の信頼性と精度が向上することが示唆された。
論文参考訳（メタデータ） (2024-11-15T06:08:57Z)
SELF-GUIDE: Better Task-Specific Instruction Following via Self-Synthetic Finetuning [70.21358720599821]
大規模言語モデル(LLM)は、適切な自然言語プロンプトを提供する際に、多様なタスクを解決するという約束を持っている。学生LLMからタスク固有の入出力ペアを合成する多段階メカニズムであるSELF-GUIDEを提案する。ベンチマークの指標から,分類タスクに約15%,生成タスクに18%の絶対的な改善を報告した。
論文参考訳（メタデータ） (2024-07-16T04:41:58Z)
Q*: Improving Multi-step Reasoning for LLMs with Deliberative Planning [53.6472920229013]
大規模言語モデル(LLM)は多くの自然言語タスクにおいて印象的な能力を示している。 LLMは多段階推論を行う際にエラー、幻覚、矛盾する文を生成する傾向がある。本稿では,LLMの復号化過程を検討計画で導くためのフレームワークであるQ*を紹介する。
論文参考訳（メタデータ） (2024-06-20T13:08:09Z)
One Token Can Help! Learning Scalable and Pluggable Virtual Tokens for Retrieval-Augmented Large Language Models [67.49462724595445]
Retrieval-augmented Generation (RAG)は、大規模言語モデル(LLM)を改善するための有望な方法である。本稿では,RAGのためのスケーラブルでプラガブルな仮想トークンを学習する新しい手法を提案する。
論文参考訳（メタデータ） (2024-05-30T03:44:54Z)
Towards Modeling Learner Performance with Large Language Models [7.002923425715133]
本稿では,LLMのパターン認識とシーケンスモデリング機能が,知識追跡の領域にまで拡張できるかどうかを検討する。ゼロショットプロンプト(ゼロショットプロンプト)とモデル微調整(モデル微調整)の2つの手法と,既存のLLM以外の知識追跡手法を比較した。 LLMベースのアプローチは最先端のパフォーマンスを達成しないが、微調整のLLMは素早いベースラインモデルの性能を上回り、標準的なベイズ的知識追跡手法と同等に機能する。
論文参考訳（メタデータ） (2024-02-29T14:06:34Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。