論文の概要: SCOPE-FE: Structured Control of Operator and Pairwise Exploration for Feature Engineering
- arxiv url: http://arxiv.org/abs/2604.27025v1
- Date: Wed, 29 Apr 2026 14:17:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 16:31:53.725862
- Title: SCOPE-FE: Structured Control of Operator and Pairwise Exploration for Feature Engineering
- Title(参考訳): SCOPE-FE: オペレータの構造制御と機能工学のためのペアワイズ探索
- Authors: Minhee Park, Seongyeon Son, Yonghyun Lee, Eunchan Kim,
- Abstract要約: SCOPE-FEは構造化検索空間制御フレームワークである。
特徴生成の前に候補空間を小さくすることで効率を向上する。
10のベンチマークデータセットの実験では、SCOPE-FEが機能エンジニアリング時間を著しく短縮することが示された。
- 参考スコア(独自算出の注目度): 0.4199844472131921
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Automatic feature engineering is an effective approach for improving predictive performance in tabular learning. However, expand-and-reduce methods, such as OpenFE, become increasingly computationally expensive as the input dimensionality grows. This limitation arises primarily from the combinatorial explosion of candidate features generated through operator-feature combinations. To address this issue, we propose SCOPE-FE, a structured search space control framework that improves efficiency by reducing the candidate space prior to feature generation. SCOPE-FE jointly regulates two major sources of combinatorial growth: the operator space and feature-pair space. First, OperatorProbing estimates the dataset-specific utility of candidate operators and eliminates low-contribution operators in advance. Second, FeatureClustering employs spectral embedding and fuzzy c-means clustering to group structurally related features, thereby restricting candidate generation to relevant within-cluster combinations. In addition, we introduce ReliabilityScoring, which incorporates variance across subsamples to stabilize pruning decisions. Experiments on ten benchmark datasets demonstrate that SCOPE-FE substantially reduces feature engineering time while maintaining competitive predictive performance relative to existing baselines. The efficiency gains are particularly pronounced for high-dimensional datasets. These results indicate that structured control of the search space is an effective strategy for scalable automatic feature engineering. The code will be made publicly available upon acceptance.
- Abstract(参考訳): 自動特徴工学は,表型学習における予測性能向上に有効な手法である。
しかし、OpenFEのような拡張還元法は、入力次元が大きくなるにつれて計算コストが増大する。
この制限は、主に演算子と関数の組み合わせによって生成される候補特徴の組合せ爆発によって生じる。
そこで本研究では,特徴生成前の候補空間を削減し,効率を向上する構造化検索空間制御フレームワークSCOPE-FEを提案する。
SCOPE-FEは、演算子空間と特徴対空間の2つの主要な組合せ成長源を共同で制御する。
まず、OperatorProbingは、候補演算子のデータセット固有のユーティリティを推定し、前もって低コントリビューション演算子を排除します。
第二に、FeatureClusteringはスペクトル埋め込みとファジィc-meansクラスタリングを使用して、構造的に関連する特徴をグループ化することで、候補生成を関連するクラスタ内結合に制限する。
さらに、サブサンプル間の分散を取り入れてプルーニング決定を安定化するReliabilityScoringを導入する。
10のベンチマークデータセットの実験により、SCOPE-FEは、既存のベースラインに対して競合予測性能を維持しながら、機能エンジニアリング時間を著しく短縮することが示された。
効率向上は特に高次元データセットに対して顕著である。
これらの結果は,検索空間の構造的制御が,スケーラブルな自動特徴工学の効果的な戦略であることを示唆している。
コードは受理時に公開されます。
関連論文リスト
- LLM Driven Design of Continuous Optimization Problems with Controllable High-level Properties [2.0539269837079392]
連続的なブラックボックス最適化におけるベンチマークは、BBOBのような既存のテストスイートの構造的多様性の制限によって妨げられる。
本研究では,進化ループに埋め込まれた大規模言語モデルを用いて,高度景観特性を明確に定義した最適化問題を設計できるかどうかを考察する。
論文 参考訳(メタデータ) (2026-01-26T12:34:52Z) - Towards Federated Clustering: A Client-wise Private Graph Aggregation Framework [57.04850867402913]
フェデレーションクラスタリングは、分散化されたラベルのないデータからパターンを抽出する課題に対処する。
本研究では,プライバシ保護のための知識共有媒体として,局所構造グラフを革新的に活用する新しいアルゴリズムSPP-FGCを提案する。
我々のフレームワークは最先端のパフォーマンスを実現し、認証可能なプライバシー保証を維持しつつ、フェデレーションベースラインよりも最大10%(NMI)のクラスタリング精度を向上させる。
論文 参考訳(メタデータ) (2025-11-14T03:05:22Z) - HeFS: Helper-Enhanced Feature Selection via Pareto-Optimized Genetic Search [10.751560953850925]
HeFS(Helper-Enhanced Feature Selection)フレームワークを導入し、既存のアルゴリズムによって生成された特徴サブセットを洗練する。
HeFSは、元のサブセットを補完し、分類性能を改善する機能であるヘルパーセットを特定するために、残りの機能空間を体系的に検索する。
18のベンチマークデータセットでの実験では、HFSは一貫して情報のある機能を識別し、最先端のメソッドよりも優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-10-21T12:30:22Z) - STT-GS: Sample-Then-Transmit Edge Gaussian Splatting with Joint Client Selection and Power Control [77.56170394100022]
Edge Gaussian splatting (EGS)は、分散クライアントからデータを集約し、エッジサーバでグローバルGSモデルをトレーニングする。
本稿では、異なるクライアントのビューコントリビューションを識別する新しいGS指向の目的関数を定式化する。
その結果,低サンプリング比でGS指向の目的を正確に予測できることが判明した。
論文 参考訳(メタデータ) (2025-10-15T06:20:47Z) - HoMer: Addressing Heterogeneities by Modeling Sequential and Set-wise Contexts for CTR Prediction [10.779868699316829]
逐次的および集合的コンテキストをモデル化するためのホモジニアス指向トランスフォーマーであるHoMerを提案する。
HoMerは、AUCメトリックで工業ベースラインを0.0099向上させ、CTR/RPMのようなオンラインビジネスメトリクスを1.99%/2.46%向上させています。
論文 参考訳(メタデータ) (2025-10-13T07:47:03Z) - Unifying Feature and Cost Aggregation with Transformers for Semantic and Visual Correspondence [51.54175067684008]
本稿では,高密度マッチングタスク用に設計されたTransformerベースの積分機能とコスト集約ネットワークを提案する。
まず, 特徴集約とコスト集約が異なる特徴を示し, 双方の集約プロセスの司法的利用から生じる実質的な利益の可能性を明らかにした。
本フレームワークは意味マッチングのための標準ベンチマークで評価され,また幾何マッチングにも適用された。
論文 参考訳(メタデータ) (2024-03-17T07:02:55Z) - Task-Oriented Over-the-Air Computation for Multi-Device Edge AI [57.50247872182593]
エッジAIをサポートするための6Gネットワークは、AIタスクの効率的かつ効率的な実行に焦点を当てたタスク指向のテクニックを備えている。
本稿では,マルチデバイススプリット推論システムにおけるタスク指向オーバー・ザ・エア計算(AirComp)方式を提案する。
論文 参考訳(メタデータ) (2022-11-02T16:35:14Z) - Task-Oriented Sensing, Computation, and Communication Integration for
Multi-Device Edge AI [108.08079323459822]
本稿では,AIモデルの分割推論と統合センシング通信(ISAC)を併用した,新しいマルチインテリジェントエッジ人工レイテンシ(AI)システムについて検討する。
推定精度は近似的だが抽出可能な計量、すなわち判別利得を用いて測定する。
論文 参考訳(メタデータ) (2022-07-03T06:57:07Z) - Meta-Wrapper: Differentiable Wrapping Operator for User Interest
Selection in CTR Prediction [97.99938802797377]
クリックスルー率(CTR)予測は、ユーザーが商品をクリックする確率を予測することを目的としており、リコメンデーションシステムにおいてますます重要になっている。
近年,ユーザの行動からユーザの興味を自動的に抽出する深層学習モデルが大きな成功を収めている。
そこで我々は,メタラッパー(Meta-Wrapper)と呼ばれるラッパー手法の枠組みに基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2022-06-28T03:28:15Z) - Evolutionary Optimization of High-Coverage Budgeted Classifiers [1.7767466724342065]
予算付き多機能分類器(MSC)プロセスは、部分的特徴取得および評価ステップのシーケンスを通じて入力される。
本稿では,不確定な予測のための端末拒否オプションを組み込んだ問題固有MSCを提案する。
アルゴリズムの設計は、一意化による集約性能の概念を尊重しながら効率を重視している。
論文 参考訳(メタデータ) (2021-10-25T16:03:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。