論文の概要: A Hybrid Ensemble Feature Selection Design for Candidate Biomarkers
Discovery from Transcriptome Profiles
- arxiv url: http://arxiv.org/abs/2108.00290v1
- Date: Sat, 31 Jul 2021 17:14:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-03 15:01:20.194929
- Title: A Hybrid Ensemble Feature Selection Design for Candidate Biomarkers
Discovery from Transcriptome Profiles
- Title(参考訳): トランスクリプトームプロファイルからの候補バイオマーカー発見のためのハイブリッドアンサンブル特徴選択設計
- Authors: Felipe Colombelli, Thayne Woycinck Kowalski, Mariana Recamonde-Mendoza
- Abstract要約: 生体マーカーの安定性と予測能力を向上させるために,両タイプの摂動を探索するハイブリッドESS(Hyb-EFS)の設計を提案する。
4種類の癌に関するマイクロアレイデータに対するアプローチの有効性について検討した。
- 参考スコア(独自算出の注目度): 1.4502611532302039
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The discovery of disease biomarkers from gene expression data has been
greatly advanced by feature selection (FS) methods, especially using ensemble
FS (EFS) strategies with perturbation at the data level (i.e., homogeneous,
Hom-EFS) or method level (i.e., heterogeneous, Het-EFS). Here we proposed a
Hybrid EFS (Hyb-EFS) design that explores both types of perturbation to improve
the stability and the predictive power of candidate biomarkers. With this,
Hyb-EFS aims to disrupt associations of good performance with a single dataset,
single algorithm, or a specific combination of both, which is particularly
interesting for better reproducibility of genomic biomarkers. We investigated
the adequacy of our approach for microarray data related to four types of
cancer, carrying out an extensive comparison with other ensemble and single FS
approaches. Five FS methods were used in our experiments: Wx, Symmetrical
Uncertainty (SU), Gain Ratio (GR), Characteristic Direction (GeoDE), and
ReliefF. We observed that the Hyb-EFS and Het-EFS approaches attenuated the
large performance variation observed for most single FS and Hom-EFS across
distinct datasets. Also, the Hyb-EFS improved upon the stability of the Het-EFS
within our domain. Comparing the Hyb-EFS and Het-EFS composed of the
top-performing selectors (Wx, GR, and SU), our hybrid approach surpassed the
equivalent heterogeneous design and the best Hom-EFS (Hom-Wx). Interestingly,
the rankings produced by our Hyb-EFS reached greater biological plausibility,
with a notably high enrichment for cancer-related genes and pathways. Thus, our
experiments suggest the potential of the proposed Hybrid EFS design in
discovering candidate biomarkers from microarray data. Finally, we provide an
open-source framework to support similar analyses in other domains, both as a
user-friendly application and a plain Python package.
- Abstract(参考訳): 遺伝子発現データからの疾患バイオマーカーの発見は、特にデータレベルでの摂動を伴うアンサンブルFS(EFS)戦略(ホモジニアス、Hom-EFS)やメソッドレベル(ヘテロジニアス、Het-EFS)を用いて、特徴選択(FS)法によって大きく進歩した。
本稿では,生体マーカーの安定性と予測能力を向上させるために,両タイプの摂動を探索するハイブリッドESS(Hyb-EFS)の設計を提案する。
これによってhyb-efsは、単一のデータセット、単一のアルゴリズム、またはそれらの特定の組み合わせによる優れたパフォーマンスの関連を破壊することを目的としており、ゲノムバイオマーカーの再現性の向上に特に興味深い。
4種類の癌に関するマイクロアレイデータに対するアプローチの有効性について検討し,他のアンサンブルおよび単一FSアプローチとの比較を行った。
実験では, Wx, Symmetrical Uncertainty (SU), Gain Ratio (GR), Characteristics Direction (GeoDE), ReliefFの5種類のFS法を用いた。
その結果,Hyb-EFS と Het-EFS のアプローチは,多くの単一 FS と Hom-EFS で異なるデータセット間で観測される大きな性能変動を減らした。
また、Hyb-EFSはドメイン内のHet-EFSの安定性を改善した。
その結果,Hyb-EFSとHyb-EFSは高い性能のセレクタ (Wx, GR, SU) で構成され,Hyb-EFSとHet-EFSは等価なヘテロジニアス設計と最高のHom-EFS (Hom-Wx) を超越した。
興味深いことに、私たちのHyb-EFSが生成するランキングは、がん関連遺伝子や経路に顕著に富み、生物学的に高い評価を得た。
そこで本実験は,マイクロアレイデータから候補バイオマーカーを発見するためのハイブリッドESF設計の可能性を示した。
最後に、ユーザフレンドリなアプリケーションとプレーンなPythonパッケージとして、他のドメインで同様の分析をサポートするためのオープンソースフレームワークを提供します。
関連論文リスト
- Heterogeneous Random Forest [2.0646127669654835]
不均一ランダムフォレスト(HRF)は、木多様性を有意義な方法で向上させるように設計されている。
HRFは、ほとんどのデータセットの精度において、他のアンサンブル手法よりも一貫して優れていた。
論文 参考訳(メタデータ) (2024-10-24T09:18:55Z) - PhyloGFN: Phylogenetic inference with generative flow networks [57.104166650526416]
本稿では,系統学における2つの中核的問題に対処するための生成フローネットワーク(GFlowNets)の枠組みを紹介する。
GFlowNetsは複雑な構造をサンプリングするのに適しているため、木トポロジー上の多重モード後部分布を探索し、サンプリングするのに自然な選択である。
我々は, 実際のベンチマークデータセット上で, 様々な, 高品質な進化仮説を生成できることを実証した。
論文 参考訳(メタデータ) (2023-10-12T23:46:08Z) - Diversity-enhancing Generative Network for Few-shot Hypothesis
Adaptation [135.80439360370556]
本稿では,FHA問題に対する多様性向上型生成ネットワーク(DEG-Net)を提案する。
カーネル独立対策(Hilbert-Schmidt independent criterion、HSIC)の助けを借りて、さまざまなラベルのないデータを生成することができる。
論文 参考訳(メタデータ) (2023-07-12T06:29:02Z) - Rethinking Mitosis Detection: Towards Diverse Data and Feature
Representation [30.882319057927052]
ミトコンドリア検出のための新しい一般化可能なフレームワーク(MitDet)を提案する。
提案手法は,いくつかの一般的なミトーシス検出データセットにおいて,SOTAのアプローチよりも優れた性能を示す。
論文 参考訳(メタデータ) (2023-07-12T03:33:11Z) - Histopathology Whole Slide Image Analysis with Heterogeneous Graph
Representation Learning [78.49090351193269]
本稿では,WSI分析のために,異なる種類の核間の相互関係を利用する新しいグラフベースのフレームワークを提案する。
具体的には、WSI を各ノードに "nucleus-type" 属性と各エッジに類似した意味属性を持つ異種グラフとして定式化する。
我々のフレームワークは、様々なタスクに対してかなりのマージンで最先端の手法より優れています。
論文 参考訳(メタデータ) (2023-07-09T14:43:40Z) - FedSDG-FS: Efficient and Secure Feature Selection for Vertical Federated
Learning [21.79965380400454]
Vertical Learning(VFL)は、複数のデータオーナに対して、大きな重複するデータサンプルセットに関する機能のサブセットをそれぞれ保持して、有用なグローバルモデルを共同でトレーニングすることを可能にする。
VFLのために設計された既存のFSは、ノイズの多い特徴の数について事前知識を仮定するか、有用な特徴の訓練後のしきい値について事前知識を仮定する。
本稿では,FedSDG-FS(Federated Dual-Gate Based Feature Selection)アプローチを提案する。
論文 参考訳(メタデータ) (2023-02-21T03:09:45Z) - Unsupervised ensemble-based phenotyping helps enhance the
discoverability of genes related to heart morphology [57.25098075813054]
我々はUn Phenotype Ensemblesという名の遺伝子発見のための新しいフレームワークを提案する。
教師なしの方法で学習された表現型のセットをプールすることで、冗長だが非常に表現性の高い表現を構築する。
これらの表現型は、(GWAS)を介して分析され、高い自信と安定した関連のみを保持する。
論文 参考訳(メタデータ) (2023-01-07T18:36:44Z) - Mycorrhiza: Genotype Assignment usingPhylogenetic Networks [2.286041284499166]
遺伝子型代入問題に対する機械学習手法であるMycorrhizaを紹介する。
提案アルゴリズムは系統ネットワークを用いて,標本間の進化的関係を符号化する特徴を設計する。
Mycorrhizaは、大きな平均固定指数(FST)を持つデータセットやハーディ・ワインバーグ平衡からの偏差で特に顕著な利得を得る。
論文 参考訳(メタデータ) (2020-10-14T02:36:27Z) - DVG-Face: Dual Variational Generation for Heterogeneous Face Recognition [85.94331736287765]
我々は、HFRを二重生成問題として定式化し、新しいDual Variational Generation(DVG-Face)フレームワークを用いてそれに取り組む。
大規模可視データの豊富なアイデンティティ情報を結合分布に統合する。
同一の同一性を持つ多種多様な多種多様な画像は、ノイズから生成することができる。
論文 参考訳(メタデータ) (2020-09-20T09:48:24Z) - Face Anti-Spoofing with Human Material Perception [76.4844593082362]
フェース・アンチ・スプーフィング(FAS)は、プレゼンテーション攻撃から顔認識システムを保護する上で重要な役割を担っている。
我々は、顔の反偽造を物質認識問題として言い換え、それを古典的な人間の物質知覚と組み合わせる。
本稿では,本質的な素材に基づくパターンをキャプチャ可能なバイラテラル畳み込みネットワーク(BCN)を提案する。
論文 参考訳(メタデータ) (2020-07-04T18:25:53Z) - Atom Search Optimization with Simulated Annealing -- a Hybrid
Metaheuristic Approach for Feature Selection [29.765647724007827]
ハイブリッドメタヒューリスティックス(Hybrid meta-heuristics)は、最適化と特徴選択(FS)分野における最も興味深いトレンドの1つである。
我々は、ASO-SA(Atom Search Optimization)のバイナリ版と、FSのためのASO-SA(ASO-SA)技術と呼ばれるSimulated Annealing(Simulated Annealing)によるハイブリッドを提案した。
提案手法は, UCI, Handwriting digit recognition, Text, non-text separation, Facial emotion Recognitionの4つのカテゴリから25のデータセットに対して適用した。
論文 参考訳(メタデータ) (2020-05-10T07:56:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。