論文の概要: StackFeat RL: Reinforcement Learning over Iterative Dual Criterion Feature Selection for Stable Biomarker Discovery
- arxiv url: http://arxiv.org/abs/2604.22892v1
- Date: Fri, 24 Apr 2026 09:52:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.035338
- Title: StackFeat RL: Reinforcement Learning over Iterative Dual Criterion Feature Selection for Stable Biomarker Discovery
- Title(参考訳): StackFeat RL: 安定なバイオマーカー発見のための反復的デュアル基準特徴選択による強化学習
- Authors: A. Yermekov, D. A. Herrera-Martí,
- Abstract要約: StackFeat-RLは、反復的な二重基準機能選択のためのメタラーニングフレームワークである。
StackFeat-RLは評価されたすべての手法の中で最も高い予測精度を達成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Feature selection in high-dimensional genomic data ($d \gg n$) demands methods that are simultaneously accurate, sparse, and stable. Existing approaches either require manual threshold specification (mRMR, stability selection), produce unstable selections under data perturbation (Lasso, Boruta), or ignore biological structure entirely. We introduce StackFeat-RL, a meta-learning framework that optimises the hyperparameters of an iterative dual-criterion feature selection algorithm via REINFORCE policy gradients. The dual criterion, requiring both coefficient consistency and selection frequency, guards against two failure modes missed by single-criterion methods, while iterative accumulation provides convergence guarantees via the law of large numbers. On COVID-19 miRNA data (GSE240888, 332 features) and three Alzheimer's disease classification tasks (GSE84422, 13237 genes; Normal vs.\ Possible, Probable, and Definite AD), StackFeat-RL achieves the highest predictive accuracy among all evaluated methods, including ElasticNet, Boruta, mRMR, and stability selection, while requiring 3--4$\times$ fewer features. Keywords: feature selection, reinforcement learning, REINFORCE, elastic net, biomarker discovery, Alzheimer's disease, dual-criterion selection, protein interaction networks
- Abstract(参考訳): 高次元ゲノムデータ(d \gg n$)の特徴選択は、同時に正確でスパースで安定な手法を必要とする。
既存のアプローチでは、手動しきい値仕様(mRMR、安定性の選択)、データ摂動下で不安定な選択(Lasso、Boruta)、あるいは生物学的構造を完全に無視する必要がある。
メタラーニングフレームワークであるStackFeat-RLを導入し、REINFORCEポリシー勾配を介して反復的二重基準特徴選択アルゴリズムのハイパーパラメータを最適化する。
二重基準は、係数整合性と選択周波数の両方を必要とするが、単一基準法で欠落した2つの障害モードに対してガードする一方、反復的な累積は、大数の法則を通じて収束を保証する。
COVID-19miRNAデータ(GSE240888, 332特徴)と3つのアルツハイマー病分類タスク(GSE84422, 13237遺伝子, 正常 vs。
StackFeat-RLは、ElasticNet、Boruta、mRMR、安定性の選択を含むすべての評価されたメソッドの中で、最も高い予測精度を達成し、3~4$\times$より少ない機能を必要とする。
キーワード:特徴選択、強化学習、REINFORCE、弾性ネット、バイオマーカー発見、アルツハイマー病、二重基準選択、タンパク質相互作用ネットワーク
関連論文リスト
- Quality-Driven Selective Mutation for Deep Learning [0.31498833540989407]
ディープラーニングのための選択的突然変異は、耐性があり現実的な変異をもたらすオペレータ構成を選択することで、突然変異の生成と実行のコストを削減することを目的としている。
本研究では,2つの相補的軸(抵抗とリアリズム)に沿って変異品質を定量化する確率的枠組みを提案する。
品質駆動的選択は、典型的な抵抗性とリアリズムを保ちながら、生成した突然変異体の数を最大55.6%減少させることを示す。
論文 参考訳(メタデータ) (2026-04-24T15:15:10Z) - Dendrograms of Mixing Measures for Softmax-Gated Gaussian Mixture of Experts: Consistency without Model Sweeps [41.371172458797524]
ゲーティングパラメータの共通翻訳、固有のゲート-エキスパート相互作用、およびタイトな数値-デノミネータ結合までの不特定性に対処する。
モデル選択には, 最適なパラメータ率を得る専門家の数を一貫したスイープフリーセレクタとして, デンドログラム誘導SGMoEを適応させる。
干ばつを識別できるトウモロコシの形質のデータセット上で、私たちのデンドログラム誘導SGMoEは2人の専門家を選別し、明確な混合階層を公開し、確率を早期に安定化し、解釈可能な遺伝子型フェノタイプマップを生成する。
論文 参考訳(メタデータ) (2025-10-14T17:23:44Z) - Nonparametric IPSS: Fast, flexible feature selection with false discovery control [12.608885112539202]
本稿では、任意の特徴重要点にIPSS(Integrated path stability selection)を適用し、有限サンプル偽発見制御を用いた一般的な特徴選択法を提案する。
両手法が偽発見率を正確に制御し,既存手法よりも真正を検出できることを示す。
我々はIPSSGBとIPSSRFを用いて、がんに関連するマイクロRNAや遺伝子を検出し、既存のアプローチよりも少ない特徴でより良い予測が得られることを発見した。
論文 参考訳(メタデータ) (2024-10-03T04:42:28Z) - Knockoff-Guided Feature Selection via A Single Pre-trained Reinforced
Agent [44.84307718534031]
ノックオフ機能によってガイドされる特徴選択のための革新的なフレームワークを導入し、強化学習により最適化する。
探索プロセスの有効性を向上させるために,原特徴とそれに対応する擬似ラベルを事前訓練した深部Qネットワークが用いられている。
新しいepsilon-greedy戦略を使用して、擬似ラベルからの洞察を取り入れて、特徴選択プロセスをより効果的にする。
論文 参考訳(メタデータ) (2024-03-06T19:58:19Z) - Feature Selection as Deep Sequential Generative Learning [50.00973409680637]
本研究では, 逐次再構成, 変分, 性能評価器の損失を伴って, 深部変分変圧器モデルを構築した。
提案モデルでは,特徴選択の知識を抽出し,連続的な埋め込み空間を学習し,特徴選択決定シーケンスをユーティリティスコアに関連付けられた埋め込みベクトルにマッピングする。
論文 参考訳(メタデータ) (2024-03-06T16:31:56Z) - Embedded Multi-label Feature Selection via Orthogonal Regression [45.55795914923279]
少なくとも2乗回帰に基づく最先端の組込みマルチラベル特徴選択アルゴリズムは、マルチラベルデータに十分な識別情報を保存できない。
複数ラベルの特徴選択を容易にするために, 組込み多ラベル特徴選択法を提案する。
10個の多ラベルデータセットの大規模な実験結果から,GRROORの有効性が示された。
論文 参考訳(メタデータ) (2024-03-01T06:18:40Z) - KECOR: Kernel Coding Rate Maximization for Active 3D Object Detection [48.66703222700795]
我々は、ラベルの取得に最も有用なポイントクラウドを特定するために、新しいカーネル戦略を利用する。
1段目(SECOND)と2段目(SECOND)の両方に対応するため、アノテーションに選択した境界ボックスの総数と検出性能のトレードオフをよく組み込んだ分類エントロピー接点を組み込んだ。
その結果,ボックスレベルのアノテーションのコストは約44%,計算時間は26%削減された。
論文 参考訳(メタデータ) (2023-07-16T04:27:03Z) - Optirank: classification for RNA-Seq data with optimal ranking reference
genes [0.0]
そこで我々は,ロジスティック回帰モデルであるOptiicrankを提案し,モデルと遺伝子のパラメータを同時に学習し,ランキングの基準セットとして使用する。
また、列車データと試験データの間に異なる種類の分散シフトを示す実際の分類タスクについても検討する。
論文 参考訳(メタデータ) (2023-01-11T10:49:06Z) - Cervical Cytology Classification Using PCA & GWO Enhanced Deep Features
Selection [1.990876596716716]
子宮頸癌は世界でも最も致命的かつ一般的な疾患の1つである。
ディープラーニングと特徴選択を利用した完全自動化フレームワークを提案する。
このフレームワークは3つの公開ベンチマークデータセットで評価されている。
論文 参考訳(メタデータ) (2021-06-09T08:57:22Z) - Two-step penalised logistic regression for multi-omic data with an
application to cardiometabolic syndrome [62.997667081978825]
我々は,各層で変数選択を行うマルチオミックロジスティック回帰に対する2段階のアプローチを実装した。
私たちのアプローチは、可能な限り多くの関連する予測子を選択することを目標とすべきです。
提案手法により,分子レベルでの心筋メタボリックシンドロームの特徴を同定することができる。
論文 参考訳(メタデータ) (2020-08-01T10:36:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。