Fugu-MT 論文翻訳(概要): A comparative study on feature selection for a risk prediction model for colorectal cancer

論文の概要: A comparative study on feature selection for a risk prediction model for colorectal cancer

arxiv url: http://arxiv.org/abs/2402.05293v1
Date: Wed, 7 Feb 2024 22:14:14 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-09 17:10:07.600840
Title: A comparative study on feature selection for a risk prediction model for colorectal cancer
Title（参考訳）: 大腸癌のリスク予測モデルにおける特徴選択の比較検討
Authors: N. Cueto-L\'opez, M. T. Garc\'ia-Ord\'as, V. D\'avila-Batista, V. Moreno, N. Aragon\'es, and R. Alaiz-Rodr\'iguez
Abstract要約: この研究は大腸癌に焦点を当て、リスク予測モデルのパフォーマンスの観点からいくつかの特徴ランキングアルゴリズムを評価する。この研究で提案された視覚的アプローチにより、ニューラルネットワークベースのラッパーランキングが最も不安定であり、ランダムフォレストが最も安定である。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Background and objective Risk prediction models aim at identifying people at higher risk of developing a target disease. Feature selection is particularly important to improve the prediction model performance avoiding overfitting and to identify the leading cancer risk (and protective) factors. Assessing the stability of feature selection/ranking algorithms becomes an important issue when the aim is to analyze the features with more prediction power. Methods This work is focused on colorectal cancer, assessing several feature ranking algorithms in terms of performance for a set of risk prediction models (Neural Networks, Support Vector Machines (SVM), Logistic Regression, k-Nearest Neighbors and Boosted Trees). Additionally, their robustness is evaluated following a conventional approach with scalar stability metrics and a visual approach proposed in this work to study both similarity among feature ranking techniques as well as their individual stability. A comparative analysis is carried out between the most relevant features found out in this study and features provided by the experts according to the state-of-the-art knowledge. Results The two best performance results in terms of Area Under the ROC Curve (AUC) are achieved with a SVM classifier using the top-41 features selected by the SVM wrapper approach (AUC=0.693) and Logistic Regression with the top-40 features selected by the Pearson (AUC=0.689). Experiments showed that performing feature selection contributes to classification performance with a 3.9% and 1.9% improvement in AUC for the SVM and Logistic Regression classifier, respectively, with respect to the results using the full feature set. The visual approach proposed in this work allows to see that the Neural Network-based wrapper ranking is the most unstable while the Random Forest is the most stable.
Abstract（参考訳）: 背景および客観的リスク予測モデルは、標的疾患の発生リスクが高い人を特定することを目的としている。機能選択は、過剰適合を避ける予測モデルの性能向上と、主要ながんリスク(および保護)要因の特定に特に重要である。特徴選択/ランク付けアルゴリズムの安定性を評価することは、より予測力のある特徴を分析することを目的とした場合、重要な問題となる。この研究は大腸癌に焦点を当てており、リスク予測モデル(ニューラルネットワーク、サポートベクターマシン(svm)、ロジスティック回帰、k-ネアレスト近傍、ブーストツリー)のパフォーマンスの観点からいくつかの特徴ランキングアルゴリズムを評価している。さらに,スカラー安定性指標を用いた従来のアプローチと,特徴ランキング手法間の類似性と個々の安定性について検討する視覚的アプローチにより,ロバスト性を評価した。本研究で得られた最も関連性の高い特徴と,最先端の知識に基づく専門家による特徴の比較分析を行った。結果 ROC曲線 (AUC) の領域における2つの最高の性能結果は、SVMラッパーアプローチ (AUC=0.693) で選択されたトップ41特徴と、ピアソン (AUC=0.689) で選択されたトップ40特徴を用いたロジスティック回帰を用いてSVM分類器によって達成される。 svmとロジスティック回帰分類器のaucがそれぞれ3.9%,1.9%改善し,全機能セットを用いた結果に対して特徴選択を行うことで分類性能が向上することを示した。この研究で提案された視覚的アプローチは、ニューラルネットワークベースのラッパーランキングが最も不安定であり、ランダムフォレストが最も安定であることを示す。

関連論文リスト

Can Causality Cure Confusion Caused By Correlation (in Software Analytics)? [4.082216579462797]
シンボリックモデル、特に決定木は、説明可能な分析のためにソフトウェア工学で広く使われている。ソフトウェア工学における最近の研究は、相関モデルと因果発見アルゴリズムの両方が明らかな不安定性に悩まされていることを示している。本研究では,因果関係を意識した分類基準を,その安定性と堅牢性を改善するための象徴的モデルに分割する。
論文参考訳（メタデータ） (2026-02-17T23:35:50Z)
STAR : Bridging Statistical and Agentic Reasoning for Large Model Performance Prediction [78.0692157478247]
本稿では,知識駆動型エージェント推論を用いて,データ駆動型静的予測を橋渡しするフレームワークSTARを提案する。 STARはスコアベースとランクベースの両方の基準線を一貫して上回ることを示す。
論文参考訳（メタデータ） (2026-02-12T16:30:07Z)
Investigating the Impact of Histopathological Foundation Models on Regressive Prediction of Homologous Recombination Deficiency [52.50039435394964]
回帰に基づくタスクの基礎モデルを体系的に評価する。我々は5つの最先端基礎モデルを用いて、スライド画像全体(WSI)からパッチレベルの特徴を抽出する。乳房、子宮内膜、肺がんコホートにまたがるこれらの抽出された特徴に基づいて、連続したRDDスコアを予測するモデルが訓練されている。
論文参考訳（メタデータ） (2026-01-29T14:06:50Z)
Methodology for Comparing Machine Learning Algorithms for Survival Analysis [55.65997641180011]
生存分析のための6つの機械学習モデルを評価した。 XGB-AFTは最高性能(C-Index = 0.7618; IPCW = 0.7532、GBSAとRCF)を達成した。
論文参考訳（メタデータ） (2025-10-28T14:42:28Z)
RoHOI: Robustness Benchmark for Human-Object Interaction Detection [84.78366452133514]
ヒューマン・オブジェクト・インタラクション(HOI)検出は、コンテキスト認識支援を可能にするロボット・ヒューマン・アシストに不可欠である。 HOI検出のための最初のベンチマークを導入し、様々な課題下でモデルのレジリエンスを評価する。我々のベンチマークであるRoHOIは、HICO-DETとV-COCOデータセットに基づく20の汚職タイプと、新しいロバストネスにフォーカスしたメトリクスを含んでいる。
論文参考訳（メタデータ） (2025-07-12T01:58:04Z)
Machine learning algorithms to predict stroke in China based on causal inference of time series analysis [1.7646715816998508]
本研究では,動的因果推論と機械学習モデルを組み合わせた脳卒中リスク予測手法を提案する。その結果,脳卒中リスクの予測には動的因果推論の特徴が重要であることが示唆された。
論文参考訳（メタデータ） (2025-03-10T14:45:43Z)
A Hybrid Framework for Statistical Feature Selection and Image-Based Noise-Defect Detection [55.2480439325792]
本稿では,統計的特徴選択と分類技術を統合し,欠陥検出精度を向上させるハイブリッドフレームワークを提案する。工業画像から抽出した55個の特徴を統計的手法を用いて解析した。これらの手法をフレキシブルな機械学習アプリケーションに統合することにより、検出精度を改善し、偽陽性や誤分類を減らす。
論文参考訳（メタデータ） (2024-12-11T22:12:21Z)
Controlling Risk of Retrieval-augmented Generation: A Counterfactual Prompting Framework [77.45983464131977]
我々は、RAGモデルの予測が誤りであり、現実のアプリケーションにおいて制御不能なリスクをもたらす可能性がどの程度あるかに焦点を当てる。本研究は,RAGの予測に影響を及ぼす2つの重要な潜伏要因を明らかにする。我々は,これらの要因をモデルに誘導し,その応答に与える影響を解析する,反実的プロンプトフレームワークを開発した。
論文参考訳（メタデータ） (2024-09-24T14:52:14Z)
Electroencephalogram Emotion Recognition via AUC Maximization [0.0]
不均衡データセットは神経科学、認知科学、医学診断などの分野で大きな課題を提起する。本研究は,DEAPデータセットにおけるライキングラベルを例として,イシュークラスの不均衡に対処する。
論文参考訳（メタデータ） (2024-08-16T19:08:27Z)
Optimizing Disease Prediction with Artificial Intelligence Driven Feature Selection and Attention Networks [0.0]
この記事では、先駆的なアンサンブル特徴選択モデルを紹介します。提案モデルの中心には、最適な特徴選択のための新しいアプローチであるSEV-EBアルゴリズムがある。 HSC-AttentionNetが導入され、モデルが健康データ内の短期パターンと長期依存関係の両方をキャプチャできる。
論文参考訳（メタデータ） (2024-07-31T14:12:27Z)
Two new feature selection methods based on learn-heuristic techniques for breast cancer prediction: A comprehensive analysis [6.796017024594715]
帝国主義競争アルゴリズム(ICA)とバットアルゴリズム(BA)に基づく2つの新しい特徴選択法を提案する。本研究は, 診断モデルの効率を向上し, 臨床医師がこれまでよりもはるかに正確かつ信頼性の高い意思決定を行えるよう包括的分析を行うことを目的とする。
論文参考訳（メタデータ） (2024-07-19T19:07:53Z)
Confidence-aware Contrastive Learning for Selective Classification [20.573658672018066]
この研究は、選択分類のための一般化を提供し、特徴層を最適化することで選択分類の性能を向上させることを開示する。この理論に触発されて、我々は初めて特徴レベルで選択的分類モデルを明確に改善することを提案し、新たに選択的分類のための信頼を意識したコントラスト学習手法であるCCL-SCを提案する。
論文参考訳（メタデータ） (2024-06-07T08:43:53Z)
Uncertainty Quantification on Clinical Trial Outcome Prediction [37.238845949535616]
本稿では,不確実性の定量化を臨床治験結果の予測に取り入れることを提案する。私たちの主な目標は、ニュアンスドの違いを識別するモデルの能力を強化することです。我々は目的を達成するために選択的な分類手法を採用した。
論文参考訳（メタデータ） (2024-01-07T13:48:05Z)
Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文参考訳（メタデータ） (2023-10-17T08:04:45Z)
Evaluating Probabilistic Classifiers: The Triptych [62.997667081978825]
本稿では,予測性能の異なる相補的な側面に焦点をあてた診断グラフィックのトリチチを提案し,研究する。信頼性図は校正に対処し、受信動作特性(ROC)曲線は識別能力を診断し、マーフィー図は全体的な予測性能と価値を視覚化する。
論文参考訳（メタデータ） (2023-01-25T19:35:23Z)
Stochastic Optimization of Areas Under Precision-Recall Curves with Provable Convergence [66.83161885378192]
ROC(AUROC)と精度リコール曲線(AUPRC)の下の領域は、不均衡問題に対する分類性能を評価するための一般的な指標である。本稿では,深層学習のためのAUPRCの最適化手法を提案する。
論文参考訳（メタデータ） (2021-04-18T06:22:21Z)
Bootstrapping Your Own Positive Sample: Contrastive Learning With Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。 EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文参考訳（メタデータ） (2021-04-07T06:02:04Z)
Characterizing Fairness Over the Set of Good Models Under Selective Labels [69.64662540443162]
同様の性能を実現するモデルセットに対して,予測公正性を特徴付けるフレームワークを開発する。到達可能なグループレベルの予測格差の範囲を計算するためのトラクタブルアルゴリズムを提供します。選択ラベル付きデータの実証的な課題に対処するために、我々のフレームワークを拡張します。
論文参考訳（メタデータ） (2021-01-02T02:11:37Z)
UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。 UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。 UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文参考訳（メタデータ） (2020-10-22T02:28:11Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。