論文の概要: Ensemble feature selection with data-driven thresholding for Alzheimer's
disease biomarker discovery
- arxiv url: http://arxiv.org/abs/2207.01822v1
- Date: Tue, 5 Jul 2022 05:50:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-06 15:28:55.025247
- Title: Ensemble feature selection with data-driven thresholding for Alzheimer's
disease biomarker discovery
- Title(参考訳): アルツハイマー病バイオマーカー発見のためのデータ駆動しきい値を用いたアンサンブル特徴選択
- Authors: Annette Spooner, Gelareh Mohammadi, Perminder S. Sachdev, Henry
Brodaty, Arcot Sowmya (for the Sydney Memory and Ageing Study and the
Alzheimer's Disease Neuroimaging Initiative)
- Abstract要約: この研究は複数のデータ駆動しきい値を開発し、アンサンブル機能セレクタで関連する特徴を自動的に識別する。
臨床データへのこれらの手法の適用性を実証するため、2つの現実世界のアルツハイマー病(AD)研究のデータに適用した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Healthcare datasets present many challenges to both machine learning and
statistics as their data are typically heterogeneous, censored,
high-dimensional and have missing information. Feature selection is often used
to identify the important features but can produce unstable results when
applied to high-dimensional data, selecting a different set of features on each
iteration.
The stability of feature selection can be improved with the use of feature
selection ensembles, which aggregate the results of multiple base feature
selectors. A threshold must be applied to the final aggregated feature set to
separate the relevant features from the redundant ones. A fixed threshold,
which is typically applied, offers no guarantee that the final set of selected
features contains only relevant features. This work develops several
data-driven thresholds to automatically identify the relevant features in an
ensemble feature selector and evaluates their predictive accuracy and
stability.
To demonstrate the applicability of these methods to clinical data, they are
applied to data from two real-world Alzheimer's disease (AD) studies. AD is a
progressive neurodegenerative disease with no known cure, that begins at least
2-3 decades before overt symptoms appear, presenting an opportunity for
researchers to identify early biomarkers that might identify patients at risk
of developing AD. Features identified by applying these methods to both
datasets reflect current findings in the AD literature.
- Abstract(参考訳): 医療データセットは、データが不均一で、検閲され、高次元で、情報が不足しているため、機械学習と統計の両方に多くの課題をもたらす。
特徴の選択はしばしば重要な特徴を特定するために使われるが、高次元データに適用すると不安定な結果が得られ、各イテレーションで異なる特徴セットを選択する。
複数の基本特徴セレクタの結果を集約する特徴選択アンサンブルを用いることで、特徴選択の安定性を向上させることができる。
関連する機能を冗長機能から分離するために、最終的な集約機能セットにしきい値を適用する必要がある。
通常適用される固定閾値は、選択された特徴の最終セットが関連する特徴のみを含むことを保証しない。
本研究は,アンサンブル特徴セレクタの関連特徴を自動的に識別し,その予測精度と安定性を評価するために,データ駆動しきい値を開発した。
臨床データへのこれらの手法の適用性を実証するため、2つの現実世界のアルツハイマー病(AD)研究のデータに適用した。
adは、既知の治療法がない進行性神経変性疾患であり、過剰な症状が現れる2~3年前から始まり、adを発症するリスクのある患者を識別する初期のバイオマーカーを研究者が特定する機会をもたらす。
これらの手法を両方のデータセットに適用することによって同定された特徴は、AD文献の現在の知見を反映している。
関連論文リスト
- Towards Within-Class Variation in Alzheimer's Disease Detection from Spontaneous Speech [60.08015780474457]
アルツハイマー病(AD)の検出は、機械学習の分類モデルを使用する有望な研究領域として浮上している。
我々は、AD検出において、クラス内変異が重要な課題であると考え、ADを持つ個人は認知障害のスペクトルを示す。
本稿では,ソフトターゲット蒸留 (SoTD) とインスタンスレベルの再分散 (InRe) の2つの新しい手法を提案する。
論文 参考訳(メタデータ) (2024-09-22T02:06:05Z) - Detecting and Identifying Selection Structure in Sequential Data [53.24493902162797]
我々は,音楽のシーケンスなどの実践的な状況において,潜在目的に基づくデータポイントの選択的包摂が一般的である,と論じる。
選択構造はパラメトリックな仮定や介入実験なしで識別可能であることを示す。
また、他の種類の依存関係と同様に、選択構造を検知し、識別するための証明可能な正当性アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-29T20:56:34Z) - Utilizing Semantic Textual Similarity for Clinical Survey Data Feature
Selection [4.5574502769585745]
調査データから結果を予測する機械学習モデルは、過度に適合し、結果として一般化性が低下する可能性がある。
この機能の選択は、学習する機能の最適なサブセットを選択しようとするものだ。
特徴名と対象名の関係を言語モデル(LM)を用いて評価し,意味的テキスト類似度(STS)スコアを生成する。
STSを用いて最小冗長-最大関連性(mRMR)アルゴリズムで特徴を直接選択する性能について検討する。
論文 参考訳(メタデータ) (2023-08-19T03:10:51Z) - Towards Understanding the Survival of Patients with High-Grade
Gastroenteropancreatic Neuroendocrine Neoplasms: An Investigation of Ensemble
Feature Selection in the Prediction of Overall Survival [0.0]
Ensemble機能セレクタを使えば、サンプルサイズが低いデータセットで、そのような機能を識別できる。
RENTとUBayFSは、機能選択プロセスにおいて、専門家の知識を優先的に統合することができる。
以上の結果から,両機能セレクタが正確な予測を可能にし,専門家の知識が機能セットに安定化効果があることが示唆された。
論文 参考訳(メタデータ) (2023-02-20T17:08:03Z) - Ensemble feature selection with clustering for analysis of
high-dimensional, correlated clinical data in the search for Alzheimer's
disease biomarkers [0.0]
多変量特徴セレクタから特徴選択アンサンブルを作成するための新しいフレームワークを提案する。
我々は,事前処理段階における集合的階層的クラスタリングを用いて,相関した特徴群が生み出すバイアスを考慮に入れた。
これらの手法はアルツハイマー病(AD)の研究から現実の2つのデータセットに適用された。
論文 参考訳(メタデータ) (2022-07-06T01:03:50Z) - Exploring linguistic feature and model combination for speech
recognition based automatic AD detection [61.91708957996086]
音声ベースの自動ADスクリーニングシステムは、他の臨床スクリーニング技術に代わる非侵襲的でスケーラブルな代替手段を提供する。
専門的なデータの収集は、そのようなシステムを開発する際に、モデル選択と特徴学習の両方に不確実性をもたらす。
本稿では,BERT と Roberta の事前学習したテキストエンコーダのドメイン微調整の堅牢性向上のための特徴とモデルの組み合わせ手法について検討する。
論文 参考訳(メタデータ) (2022-06-28T05:09:01Z) - Domain Invariant Model with Graph Convolutional Network for Mammogram
Classification [49.691629817104925]
グラフ畳み込みネットワークを用いたドメイン不変モデル(DIM-GCN)を提案する。
まず,潜伏変数を病原性その他の疾患関連部位に明示的に分解するベイズネットワークを提案する。
マクロな特徴をよりよく捉えるために、我々は、GCN(Graph Convolutional Network)を介して、観察された臨床特性を再構築の目的として活用する。
論文 参考訳(メタデータ) (2022-04-21T08:23:44Z) - Multi-class versus One-class classifier in spontaneous speech analysis
oriented to Alzheimer Disease diagnosis [58.720142291102135]
本研究の目的は,音声信号から抽出した新しいバイオマーカーを用いて自動解析を行うことにより,ADの早期診断と重症度評価の改善に寄与することである。
外付け器とフラクタル次元の機能に関する情報を使用することで、システムの性能が向上する。
論文 参考訳(メタデータ) (2022-03-21T09:57:20Z) - Active Selection of Classification Features [0.0]
人口統計などの補助的データは、最も有益なMRIスキャンを持つ個人を含む小さなサンプルを選択するのに役立ちます。
本研究では,2つの実用的手法を提案し,その性能を3つの実世界のベンチマークデータセットで評価する。
論文 参考訳(メタデータ) (2021-02-26T18:19:08Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Analysis of ensemble feature selection for correlated high-dimensional
RNA-Seq cancer data [0.24366811507669126]
本研究は、関連する変数の発見のための2つのアプローチを比較する。
最も有益な特徴は、4つの特徴選択アルゴリズムを用いて識別される。
残念なことに、特徴選択アルゴリズムのアンサンブルから得られた特徴集合に基づいて構築されたモデルは、個々のアルゴリズムから得られた特徴集合に基づいて開発されたモデルよりは良くなかった。
論文 参考訳(メタデータ) (2020-04-28T20:38:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。