論文の概要: LLM-Driven Performance-Space Augmentation for Meta-Learning-Based Algorithm Selection
- arxiv url: http://arxiv.org/abs/2605.09518v1
- Date: Sun, 10 May 2026 13:00:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.292385
- Title: LLM-Driven Performance-Space Augmentation for Meta-Learning-Based Algorithm Selection
- Title(参考訳): メタラーニングに基づくアルゴリズム選択のためのLLM駆動性能空間拡張
- Authors: Darren Zhu, Daren Ler,
- Abstract要約: 永続的な制限は、キュレートされた実世界のデータセットの数が少ないため、スパースメタデータセットが生成されることである。
メタデータセットを大言語モデル(LLM)を用いて生成した合成回帰データセットで拡張することでこの問題に対処する。
本研究では,(1)合成データセットを性能空間に分散する一様サンプリングと,(2)決定境界付近に集中するマージンベースサンプリングの2つを比較した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Meta-learning for algorithm selection relies on a meta-dataset in which each row corresponds to a supervised learning dataset described by meta-features and labelled with a target value that is associated with algorithm choice (typically, some function of algorithm performance). A persistent limitation is that the number of curated real-world datasets is small, resulting in sparse meta-datasets that constrain meta-learner generalisation. In this paper, we address this problem by augmenting the meta-dataset with synthetic regression datasets produced via a large language model (LLM), with generation steered toward target regions of a low-dimensionality performance space. In our experiments, we adopt a two-dimensional geometric setting defined by the cross-validated $R^2$ scores of two anchor algorithms, known as landmarkers. We compare two augmentation strategies: (1) uniform sampling, which distributes synthetic datasets across the performance space; and (2) margin-based sampling, which concentrates them near the decision boundary where landmarker preference is most ambiguous. Across 42 real-world UCI regression datasets and 730 synthetic datasets, both strategies substantially improve meta-learner performance over the unaugmented baseline under regression and multi-label evaluation formulations. However, uniform augmentation consistently outperforms margin-based augmentation, achieving a 17.47% relative reduction in Hamming loss, a 100.41% relative improvement in subset accuracy, and a +6.09% relative gain in pooled out-of-fold $R^2$. These results lead us to postulate a central thesis: the performance of algorithms resides on a low-dimensional performance manifold, whose reconstruction bias may be minimised by user-guided LLMs that seek to maximise uniform $ε$-cover, and consequently, lead to improved meta-learning for algorithm selection.
- Abstract(参考訳): アルゴリズム選択のためのメタ学習は、各行がメタ機能によって記述された教師付き学習データセットに対応し、アルゴリズム選択に関連するターゲット値(典型的には、アルゴリズム性能のいくつかの機能)にラベル付けされるメタデータセットに依存する。
永続的な制限は、キュレートされた実世界のデータセットの数は少なく、その結果、メタラーナーの一般化を制約するスパースなメタデータセットが生成されることである。
本稿では,大言語モデル (LLM) を用いて生成した合成回帰データセットを用いてメタデータセットを拡張し,低次元性能空間のターゲット領域に向けて生成を行うことにより,この問題に対処する。
実験では,ランドマークと呼ばれる2つのアンカーアルゴリズムの相互検証値R^2$スコアによって定義される2次元幾何学的設定を採用する。
本研究では,(1)合成データセットを性能空間に分散する一様サンプリング,(2)マージンに基づくサンプリング,(2)ランドマークの選好が最も曖昧な決定境界付近に集中する一様サンプリングを比較した。
42の現実のUCI回帰データセットと730の合成データセットで、どちらの戦略も回帰とマルチラベル評価の定式化の下で、未拡張のベースライン上でのメタラーナー性能を大幅に改善する。
しかし、一様増進はマージンベースの増進を一貫して上回り、17.47%のハミング損失の相対的な減少、100.41%のサブセット精度の相対的な改善、+6.09%の相対的な利得のプールアウトオブフォールド$R^2$を達成している。
アルゴリズムの性能は低次元の性能多様体上に存在し、その再構成バイアスは、一様$ε$-coverを最大化するユーザガイド付きLLMによって最小化され、アルゴリズム選択のためのメタラーニングの改善につながる。
関連論文リスト
- L-SR1: Learned Symmetric-Rank-One Preconditioning [5.421390145168128]
エンドツーエンドのディープラーニングは目覚ましい結果を得たが、大きなラベル付きデータセットに依存しているため、依然として制限されている。
対照的に、古典最適化法はデータ効率が高く軽量であるが、しばしば収束が遅い。
そこで本研究では,古典的シンメトリー・ランクワンアルゴリズムを強化するために,トレーニング可能なプレコンディショニングユニットを導入した新しい2次ベクトルを提案する。
論文 参考訳(メタデータ) (2025-08-17T07:37:29Z) - Learning sparse generalized linear models with binary outcomes via iterative hard thresholding [20.28503550819373]
統計学において、一般化線形モデル(GLM)はデータモデリングに広く用いられている。
本稿では,2次反復型ハードしきい値(BIHT)と呼ばれる反復型ハードしきい値(ReLU損失に対する投射勾配勾配)アルゴリズムの使用と解析を提案する。
BIHTは統計的に効率的であり、スパースバイナリGLMの一般クラスにおいてパラメータ推定のための正しい解に収束することを示す。
論文 参考訳(メタデータ) (2025-02-25T17:42:33Z) - Memory-Reduced Meta-Learning with Guaranteed Convergence [7.306367313570251]
本稿では,履歴パラメータ/勾配の使用を回避し,各イテレーションにおけるメモリコストを大幅に削減するメタ学習アルゴリズムを提案する。
メタラーニングベンチマーク実験の結果,提案アルゴリズムの有効性が確認された。
論文 参考訳(メタデータ) (2024-12-16T17:55:55Z) - Interpetable Target-Feature Aggregation for Multi-Task Learning based on Bias-Variance Analysis [53.38518232934096]
マルチタスク学習(MTL)は、タスク間の共有知識を活用し、一般化とパフォーマンスを改善するために設計された強力な機械学習パラダイムである。
本稿では,タスククラスタリングと特徴変換の交点におけるMTL手法を提案する。
両段階において、鍵となる側面は減った目標と特徴の解釈可能性を維持することである。
論文 参考訳(メタデータ) (2024-06-12T08:30:16Z) - Large-scale Fully-Unsupervised Re-Identification [78.47108158030213]
大規模未ラベルデータから学ぶための2つの戦略を提案する。
第1の戦略は、近傍関係に違反することなく、それぞれのデータセットサイズを減らすために、局所的な近傍サンプリングを行う。
第2の戦略は、低時間上限の複雑さを持ち、メモリの複雑さを O(n2) から O(kn) に k n で還元する新しい再帰的手法を利用する。
論文 参考訳(メタデータ) (2023-07-26T16:19:19Z) - Maximize to Explore: One Objective Function Fusing Estimation, Planning,
and Exploration [87.53543137162488]
我々はtextttMEX というオンライン強化学習(オンラインRL)フレームワークを提案する。
textttMEXは、自動的に探索エクスプロイトのバランスをとりながら、見積もりと計画コンポーネントを統合する。
様々な MuJoCo 環境では,ベースラインを安定的なマージンで上回り,十分な報酬を得られる。
論文 参考訳(メタデータ) (2023-05-29T17:25:26Z) - Memory-Based Optimization Methods for Model-Agnostic Meta-Learning and
Personalized Federated Learning [56.17603785248675]
モデルに依存しないメタラーニング (MAML) が人気のある研究分野となっている。
既存のMAMLアルゴリズムは、イテレーション毎にメタモデルを更新するためにいくつかのタスクとデータポイントをサンプリングすることで、エピソードのアイデアに依存している。
本稿では,MAMLのメモリベースアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-06-09T08:47:58Z) - Meta-Learning with Neural Tangent Kernels [58.06951624702086]
メタモデルのニューラルタンジェントカーネル(NTK)によって誘導される再生カーネルヒルベルト空間(RKHS)における最初のメタラーニングパラダイムを提案する。
このパラダイムでは,MAMLフレームワークのように,最適な反復内ループ適応を必要としない2つのメタ学習アルゴリズムを導入する。
本研究の目的は,1) 適応をRKHSの高速適応正則化器に置き換えること,2) NTK理論に基づいて解析的に適応を解くことである。
論文 参考訳(メタデータ) (2021-02-07T20:53:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。