論文の概要: RF+clust for Leave-One-Problem-Out Performance Prediction
- arxiv url: http://arxiv.org/abs/2301.09524v1
- Date: Mon, 23 Jan 2023 16:14:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-24 12:56:45.218127
- Title: RF+clust for Leave-One-Problem-Out Performance Prediction
- Title(参考訳): アフターワンプロブレムアウト性能予測のためのRF+クラスト
- Authors: Ana Nikolikj and Carola Doerr and Tome Eftimov
- Abstract要約: 本稿では,LOPO(Left-one-problem-out)のパフォーマンス予測について検討する。
我々は、標準ランダムフォレスト(RF)モデル予測が性能値の重み付き平均値で校正することで改善できるかどうかを解析する。
- 参考スコア(独自算出の注目度): 0.9281671380673306
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Per-instance automated algorithm configuration and selection are gaining
significant moments in evolutionary computation in recent years. Two crucial,
sometimes implicit, ingredients for these automated machine learning (AutoML)
methods are 1) feature-based representations of the problem instances and 2)
performance prediction methods that take the features as input to estimate how
well a specific algorithm instance will perform on a given problem instance.
Non-surprisingly, common machine learning models fail to make predictions for
instances whose feature-based representation is underrepresented or not covered
in the training data, resulting in poor generalization ability of the models
for problems not seen during training.In this work, we study
leave-one-problem-out (LOPO) performance prediction. We analyze whether
standard random forest (RF) model predictions can be improved by calibrating
them with a weighted average of performance values obtained by the algorithm on
problem instances that are sufficiently close to the problem for which a
performance prediction is sought, measured by cosine similarity in feature
space. While our RF+clust approach obtains more accurate performance prediction
for several problems, its predictive power crucially depends on the chosen
similarity threshold as well as on the feature portfolio for which the cosine
similarity is measured, thereby opening a new angle for feature selection in a
zero-shot learning setting, as LOPO is termed in machine learning.
- Abstract(参考訳): per-instance automatic algorithm configuration and selectionは近年、進化的計算において重要な瞬間を得ている。
自動化機械学習(automl)の2つの重要な、時には暗黙的な要素は
1)問題インスタンスの特徴に基づく表現と
2) 特定のアルゴリズムインスタンスが与えられた問題インスタンス上でどれだけうまく機能するかを推定するために,特徴を入力とする性能予測手法。
当然のことながら、一般的な機械学習モデルでは、特徴に基づく表現が不足している、あるいはトレーニングデータにカバーされていないインスタンスの予測に失敗し、トレーニング中に見られない問題に対するモデルの一般化能力が低下する。
本研究では,特徴空間におけるコサイン類似度を用いて,性能予測を求める課題に十分近い問題インスタンスに対して,アルゴリズムが求めた性能値の重み付け平均値を用いて,標準ランダムフォレスト(rf)モデル予測を改善することができるかを分析する。
rf+clustアプローチは,いくつかの問題に対してより正確な性能予測を行うが,その予測能力は,選択された類似度閾値と,コサイン類似度を測定する特徴ポートフォリオに依存する。
関連論文リスト
- Accelerated zero-order SGD under high-order smoothness and overparameterized regime [79.85163929026146]
凸最適化問題を解くための新しい勾配のないアルゴリズムを提案する。
このような問題は医学、物理学、機械学習で発生する。
両種類の雑音下で提案アルゴリズムの収束保証を行う。
論文 参考訳(メタデータ) (2024-11-21T10:26:17Z) - Attribute-to-Delete: Machine Unlearning via Datamodel Matching [65.13151619119782]
機械学習 -- 事前訓練された機械学習モデルで、小さな"ターゲットセット"トレーニングデータを効率的に削除する -- は、最近関心を集めている。
最近の研究では、機械学習技術はこのような困難な環境では耐えられないことが示されている。
論文 参考訳(メタデータ) (2024-10-30T17:20:10Z) - Assessing the Generalizability of a Performance Predictive Model [0.6070952062639761]
本稿では,アルゴリズム性能の予測モデルの一般化可能性を評価するワークフローを提案する。
その結果,ランドスケープの特徴空間における一般化可能性パターンが性能空間に反映されることが示唆された。
論文 参考訳(メタデータ) (2023-05-31T12:50:44Z) - Representation Learning with Multi-Step Inverse Kinematics: An Efficient
and Optimal Approach to Rich-Observation RL [106.82295532402335]
既存の強化学習アルゴリズムは、計算的難易度、強い統計的仮定、最適なサンプルの複雑さに悩まされている。
所望の精度レベルに対して、レート最適サンプル複雑性を実現するための、最初の計算効率の良いアルゴリズムを提供する。
我々のアルゴリズムMusIKは、多段階の逆運動学に基づく表現学習と体系的な探索を組み合わせる。
論文 参考訳(メタデータ) (2023-04-12T14:51:47Z) - Tokenization Consistency Matters for Generative Models on Extractive NLP
Tasks [54.306234256074255]
生成モデルの訓練において一般的に無視されるトークン化の不整合の問題を特定する。
この問題は、入力と出力が無矛盾にトークン化されると、これらのタスクの抽出特性を損なう。
一貫性のあるトークン化では、ドメイン内のデータセットとドメイン外のデータセットの両方で、モデルのパフォーマンスが向上することを示す。
論文 参考訳(メタデータ) (2022-12-19T23:33:21Z) - An Advantage Using Feature Selection with a Quantum Annealer [0.0]
特徴選択(英: Feature selection)は、ターゲット変数に強い統計的接続を持つレコード中の特徴を識別する統計予測モデルにおける技法である。
本稿では、オープンソースのデータセットを利用して古典的手法に対するこの直感を検証し、各訓練された統計モデルの有効性を評価する。
論文 参考訳(メタデータ) (2022-11-17T18:32:26Z) - Explainable Landscape Analysis in Automated Algorithm Performance
Prediction [0.0]
自動アルゴリズムの性能予測において,異なる教師付き機械学習モデルによって活用される問題景観の特徴の表現性について検討する。
教師付きML回帰モデルでは,問題ランドスケープの特徴が異なるため,教師付きML手法の選択が重要であることを実験的に指摘した。
論文 参考訳(メタデータ) (2022-03-22T15:54:17Z) - Efficient and Differentiable Conformal Prediction with General Function
Classes [96.74055810115456]
本稿では,複数の学習可能なパラメータに対する共形予測の一般化を提案する。
本研究は, クラス内において, ほぼ有効な人口被覆率, ほぼ最適効率を実現していることを示す。
実験の結果,提案アルゴリズムは有効な予測セットを学習し,効率を著しく向上できることがわかった。
論文 参考訳(メタデータ) (2022-02-22T18:37:23Z) - Non-Clairvoyant Scheduling with Predictions Revisited [77.86290991564829]
非論理的スケジューリングでは、優先度不明な処理条件でジョブをスケジューリングするためのオンライン戦略を見つけることが課題である。
我々はこのよく研究された問題を、アルゴリズム設計に(信頼できない)予測を統合する、最近人気の高い学習強化された設定で再検討する。
これらの予測には所望の特性があり, 高い性能保証を有するアルゴリズムと同様に, 自然な誤差測定が可能であることを示す。
論文 参考訳(メタデータ) (2022-02-21T13:18:11Z) - Quantum-Assisted Feature Selection for Vehicle Price Prediction Modeling [0.0]
本研究では,一般平均情報係数やピアソン相関係数などの二元モデルとして検索を符号化する指標について検討する。
我々は,新しい指標を用いて合成データの最適部分集合を求めるための0.9の精度スコアを得る。
その結果、量子支援ルーチンを活用することで、予測モデル出力の品質を高めるソリューションが見つかることが分かりました。
論文 参考訳(メタデータ) (2021-04-08T20:48:44Z) - Landscape-Aware Fixed-Budget Performance Regression and Algorithm
Selection for Modular CMA-ES Variants [1.0965065178451106]
市販の教師あり学習手法を用いて,高品質な性能予測が可能であることを示す。
このアプローチを,モジュール型CMA-ESアルゴリズム群から選択した,非常に類似したアルゴリズムのポートフォリオ上でテストする。
論文 参考訳(メタデータ) (2020-06-17T13:34:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。