論文の概要: DOSA-MO: Dual-stage Optimizer for Systematic overestimation Adjustment
in Multi-Objective problems improves biomarker discovery
- arxiv url: http://arxiv.org/abs/2312.16624v1
- Date: Wed, 27 Dec 2023 16:13:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-29 18:42:41.455777
- Title: DOSA-MO: Dual-stage Optimizer for Systematic overestimation Adjustment
in Multi-Objective problems improves biomarker discovery
- Title(参考訳): DOSA-MO:多目的問題における過大評価の2段階最適化によるバイオマーカー発見の改善
- Authors: Luca Cattelani and Vittorio Fortino
- Abstract要約: バイオマーカーの同定は、予測能力と分子的特徴数の相似性の間のトレードオフを伴う典型的な多目的問題である。
遺伝的アルゴリズムは多目的最適化の一般的なツールであるが、多くの解を進化させ、過大評価しがちである。
提案するDOSA-MOは多目的最適化ラッパーアルゴリズムで,元の推定値,分散度,および解の特徴セットサイズが過大評価を予測する。
- 参考スコア(独自算出の注目度): 0.18648070031379424
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The challenge in biomarker discovery and validation using machine learning
from omics data lies in the abundance of molecular features but scarcity of
samples. Most machine learning-based feature selection methods necessitate of
hyperparameter tuning, typically performed by evaluating numerous alternatives
on a validation set. Every evaluation has a performance estimation error and
when the selection takes place between many models the best ones are almost
certainly overestimated. Biomarker identification is a typical multi-objective
problem with trade-offs between the predictive ability and the parsimony in the
number of molecular features. Genetic algorithms are a popular tool for
multi-objective optimization but they evolve numerous solutions and are prone
to overestimation. Methods have been proposed to reduce the overestimation
after a model has already been selected in single-objective problems, but to
the best of our knowledge no algorithm existed that was capable of reducing the
overestimation during the optimization, leading to a better model selection, or
that had been applied in the more general domain of multi-objective problems.
We propose DOSA-MO, a novel multi-objective optimization wrapper algorithm that
learns how the original estimation, its variance, and the feature set size of
the solutions predict the overestimation, and adjusts the expectation of the
performance during the optimization, improving the composition of the solution
set. We verify that DOSA-MO improves the performance of a state-of-the-art
genetic algorithm on left-out or external sample sets, when predicting cancer
subtypes and/or patient overall survival, using three transcriptomics datasets
for kidney and breast cancer.
- Abstract(参考訳): バイオマーカーの発見とオミクスデータからの機械学習による検証の課題は、分子の特徴の豊富さとサンプルの不足にある。
ほとんどの機械学習ベースの特徴選択方法は、通常、検証セット上で多くの代替品を評価することによって実行されるハイパーパラメータチューニングを必要とする。
評価には性能推定誤差があり、多くのモデル間で選択が行われると、最良のモデルはほぼ確実に過大評価される。
バイオマーカーの同定は、予測能力と分子的特徴数の相似性の間のトレードオフを伴う典型的な多目的問題である。
遺伝的アルゴリズムは多目的最適化の一般的なツールであるが、多くの解を進化させ、過大評価しがちである。
モデルが単一対象問題において既に選択された後、過大評価を減らす方法が提案されているが、我々の知る限り、最適化時に過大評価を低減できるアルゴリズムは存在せず、より良いモデル選択、あるいはより一般的な多目的問題領域に適用された。
提案アルゴリズムは, 最適化時の性能の期待値を予測し, 解集合の構成を改善し, 元の推定値, 分散値, 特徴セットサイズを推定する方法を学習する, 新規な多目的最適化ラッパーアルゴリズムであるDOSA-MOを提案する。
癌サブタイプおよび/または患者全体の生存率を予測する場合, DOSA-MOは, 腎癌および乳癌の3つの転写学的データセットを用いて, 最先端の遺伝的アルゴリズムの性能を向上させることが確認された。
関連論文リスト
- Embedded feature selection in LSTM networks with multi-objective
evolutionary ensemble learning for time series forecasting [49.1574468325115]
本稿では,Long Short-Term Memory Networkに埋め込まれた特徴選択手法を提案する。
本手法はLSTMの重みと偏りを分割的に最適化する。
イタリアとスペイン南東部の大気質時系列データの実験的評価により,従来のLSTMの能力一般化が著しく向上することが確認された。
論文 参考訳(メタデータ) (2023-12-29T08:42:10Z) - An Empirical Evaluation of Zeroth-Order Optimization Methods on
AI-driven Molecule Optimization [78.36413169647408]
分子目的を最適化するための様々なZO最適化手法の有効性について検討する。
ZO符号に基づく勾配降下(ZO-signGD)の利点を示す。
本稿では,Guurcamol スイートから広く使用されているベンチマークタスクに対して,ZO 最適化手法の有効性を示す。
論文 参考訳(メタデータ) (2022-10-27T01:58:10Z) - Multi-objective hyperparameter optimization with performance uncertainty [62.997667081978825]
本稿では,機械学習アルゴリズムの評価における不確実性を考慮した多目的ハイパーパラメータ最適化の結果について述べる。
木構造型Parzen Estimator(TPE)のサンプリング戦略と、ガウス過程回帰(GPR)と異種雑音の訓練後に得られたメタモデルを組み合わせる。
3つの解析的テスト関数と3つのML問題の実験結果は、多目的TPEとGPRよりも改善したことを示している。
論文 参考訳(メタデータ) (2022-09-09T14:58:43Z) - Fair Feature Subset Selection using Multiobjective Genetic Algorithm [0.0]
フェアネスと精度を両立させる特徴部分選択手法を提案する。
モデル性能の指標としてF1-Scoreを用いる。
最も一般的なフェアネスベンチマークデータセットの実験では、進化的アルゴリズムを用いることで、フェアネスと精度のトレードオフを効果的に探索できることが示されている。
論文 参考訳(メタデータ) (2022-04-30T22:51:19Z) - The Importance of Landscape Features for Performance Prediction of
Modular CMA-ES Variants [2.3823600586675724]
近年の研究では、教師あり機械学習手法が問題事例から抽出したランドスケープ特徴を用いてアルゴリズムの性能を予測できることが示されている。
モジュール型CMA-ESフレームワークを考察し、各ランドスケープ機能が最適なアルゴリズム性能回帰モデルにどの程度貢献するかを推定する。
論文 参考訳(メタデータ) (2022-04-15T11:55:28Z) - Meta-learning One-class Classifiers with Eigenvalue Solvers for
Supervised Anomaly Detection [55.888835686183995]
教師付き異常検出のためのニューラルネットワークに基づくメタラーニング手法を提案する。
提案手法は,既存の異常検出法や少数ショット学習法よりも優れた性能を実現することを実験的に実証した。
論文 参考訳(メタデータ) (2021-03-01T01:43:04Z) - Robust Multi-class Feature Selection via $l_{2,0}$-Norm Regularization
Minimization [6.41804410246642]
特徴選択は、データマイニングと機械学習において重要な計算処理である。
本稿では,複数クラスの特徴選択における最小二乗問題の解法として,ホモシーハードしきい値(HIHT)に基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2020-10-08T02:06:06Z) - Landscape-Aware Fixed-Budget Performance Regression and Algorithm
Selection for Modular CMA-ES Variants [1.0965065178451106]
市販の教師あり学習手法を用いて,高品質な性能予測が可能であることを示す。
このアプローチを,モジュール型CMA-ESアルゴリズム群から選択した,非常に類似したアルゴリズムのポートフォリオ上でテストする。
論文 参考訳(メタデータ) (2020-06-17T13:34:57Z) - Multi-Objective Evolutionary approach for the Performance Improvement of
Learners using Ensembling Feature selection and Discretization Technique on
Medical data [8.121462458089143]
本稿では,新しい多目的型次元還元フレームワークを提案する。
これは、特徴選択と離散化を行うためのアンサンブルモデルとして、離散化と特徴縮小の両方を組み込んでいる。
論文 参考訳(メタデータ) (2020-04-16T06:32:15Z) - Discovering Representations for Black-box Optimization [73.59962178534361]
ブラックボックス最適化符号化は手作業で行うのではなく,自動的に学習可能であることを示す。
学習された表現は、標準的なMAP-Elitesよりも桁違いに少ない評価で高次元の問題を解くことができることを示す。
論文 参考訳(メタデータ) (2020-03-09T20:06:20Z) - Stepwise Model Selection for Sequence Prediction via Deep Kernel
Learning [100.83444258562263]
本稿では,モデル選択の課題を解決するために,新しいベイズ最適化(BO)アルゴリズムを提案する。
結果として得られる複数のブラックボックス関数の最適化問題を協調的かつ効率的に解くために,ブラックボックス関数間の潜在的な相関を利用する。
我々は、シーケンス予測のための段階的モデル選択(SMS)の問題を初めて定式化し、この目的のために効率的な共同学習アルゴリズムを設計し、実証する。
論文 参考訳(メタデータ) (2020-01-12T09:42:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。