論文の概要: Interpretable Machine Learning for Cognitive Aging: Handling Missing Data and Uncovering Social Determinant
- arxiv url: http://arxiv.org/abs/2510.10952v1
- Date: Mon, 13 Oct 2025 03:04:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:30.167697
- Title: Interpretable Machine Learning for Cognitive Aging: Handling Missing Data and Uncovering Social Determinant
- Title(参考訳): 認知的高齢化のための解釈可能な機械学習: 欠落データ処理と社会的決定要因の発見
- Authors: Xi Mao, Zhendong Wang, Jingyu Li, Lingchao Mao, Utibe Essien, Hairong Wang, Xuelei Sherry Ni,
- Abstract要約: アルツハイマー病(AD)の早期発見は神経変性効果が不可逆的であるため重要である。
NIH NIAが支援するPrePARE Challenge Phase 2データセットを用いて,健康の社会的要因から認知能力を予測する。
- 参考スコア(独自算出の注目度): 28.20784930277189
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Early detection of Alzheimer's disease (AD) is crucial because its neurodegenerative effects are irreversible, and neuropathologic and social-behavioral risk factors accumulate years before diagnosis. Identifying higher-risk individuals earlier enables prevention, timely care, and equitable resource allocation. We predict cognitive performance from social determinants of health (SDOH) using the NIH NIA-supported PREPARE Challenge Phase 2 dataset derived from the nationally representative Mex-Cog cohort of the 2003 and 2012 Mexican Health and Aging Study (MHAS). Data: The target is a validated composite cognitive score across seven domains-orientation, memory, attention, language, constructional praxis, and executive function-derived from the 2016 and 2021 MHAS waves. Predictors span demographic, socioeconomic, health, lifestyle, psychosocial, and healthcare access factors. Methodology: Missingness was addressed with a singular value decomposition (SVD)-based imputation pipeline treating continuous and categorical variables separately. This approach leverages latent feature correlations to recover missing values while balancing reliability and scalability. After evaluating multiple methods, XGBoost was chosen for its superior predictive performance. Results and Discussion: The framework outperformed existing methods and the data challenge leaderboard, demonstrating high accuracy, robustness, and interpretability. SHAP-based post hoc analysis identified top contributing SDOH factors and age-specific feature patterns. Notably, flooring material emerged as a strong predictor, reflecting socioeconomic and environmental disparities. Other influential factors, age, SES, lifestyle, social interaction, sleep, stress, and BMI, underscore the multifactorial nature of cognitive aging and the value of interpretable, data-driven SDOH modeling.
- Abstract(参考訳): アルツハイマー病(AD)の早期発見は、その神経変性効果が不可逆的であり、神経病理学的および社会的行動的リスク因子が診断の前に何年も蓄積しているため、重要である。
リスクの高い個人を特定することで、予防、タイムリーケア、公平なリソース割り当てが可能になる。
我々は,2003年と2012年メキシコ健康高齢研究(MHAS)のMex-Cogコホートに代表されるNIH NIA支援のPrePARE Challenge Phase 2データセットを用いて,社会的健康決定因子(SDOH)の認知能力を予測する。
データ: 対象は、2016年と2021年のMHAS波から派生した7つのドメインの向き、記憶、注意、言語、建設的実践、実行機能に対する総合的認知スコアである。
予測者は人口統計、社会経済、健康、ライフスタイル、精神社会的、医療アクセス要因にまたがる。
方法: 特異値分解(SVD)に基づくインプットパイプラインを用いて, 連続変数とカテゴリー変数を別々に処理した。
このアプローチでは、遅延機能相関を利用して、信頼性とスケーラビリティのバランスをとりながら、欠落した値を回復する。
複数の手法を評価した後、XGBoostはその優れた予測性能のために選ばれた。
結果と議論: このフレームワークは既存の手法とデータチャレンジのリーダーボードを上回り、高い正確性、堅牢性、解釈可能性を示しました。
SHAPをベースとしたポストホック分析では,SDOH因子と年齢特有な特徴パターンが認められた。
特に、フロアリング材料は、社会経済と環境格差を反映して、強い予測因子として現れた。
その他の影響要因として、年齢、SES、ライフスタイル、社会的相互作用、睡眠、ストレス、BMIがある。
関連論文リスト
- Interpretable Machine Learning for Life Expectancy Prediction: A Comparative Study of Linear Regression, Decision Tree, and Random Forest [0.0]
本研究では、線形回帰(LR)、回帰決定木(RDT)、ランダムフォレスト(RF)の3つの機械学習モデルを評価する。
RFは最大予測精度(R2 = 0.9423$)を達成し、LRとRTTを大きく上回る。
これらの洞察は、公衆衛生上の課題に対処する上で、アンサンブル手法と透明性の相乗効果を強調している。
論文 参考訳(メタデータ) (2025-10-01T06:02:31Z) - A Comprehensive Review of Datasets for Clinical Mental Health AI Systems [55.67299586253951]
本稿では,AIを活用した臨床アシスタントの訓練・開発に関連する臨床精神保健データセットの総合的調査を行う。
本調査では, 縦断データの欠如, 文化・言語表現の制限, 一貫性のない収集・注釈基準, 合成データのモダリティの欠如など, 重要なギャップを明らかにした。
論文 参考訳(メタデータ) (2025-08-13T13:42:35Z) - Naturalistic Language-related Movie-Watching fMRI Task for Detecting Neurocognitive Decline and Disorder [60.84344168388442]
言語関連機能的磁気共鳴画像(fMRI)は,認知機能低下と早期NCDの検出に有望なアプローチである。
香港在住の高齢者97名を対象に,この課題の有効性について検討した。
本研究は、加齢に伴う認知低下とNCDの早期発見のための自然言語関連fMRIタスクの可能性を示した。
論文 参考訳(メタデータ) (2025-06-10T16:58:47Z) - Comparative Analysis of Stroke Prediction Models Using Machine Learning [0.0]
ストロークはいまだに世界的健康上の最も重要な課題の1つであり、世界第2位の死因であり、世界第3位の障害の原因である。
本研究では、ストローク予測データセットから、人口統計データ、臨床データ、ライフスタイルデータを用いて、脳卒中リスクを予測する機械学習アルゴリズムの有効性を検討する。
論文 参考訳(メタデータ) (2025-05-14T21:27:19Z) - Early Prediction of Alzheimer's and Related Dementias: A Machine Learning Approach Utilizing Social Determinants of Health Data [1.4140700984013321]
アルツハイマー病と関連する認知症(AD/ADRD)は、600万人以上のアメリカ人に影響を及ぼす医療危機の進行を示している。
社会的健康決定因子(SDOH)は認知機能のリスクと進行の両方に大きな影響を及ぼす。
本報告は、これらの社会的、環境的、構造的要因が認知的健康軌道に与える影響について考察する。
論文 参考訳(メタデータ) (2025-03-20T03:16:02Z) - Targeted Data Fusion for Causal Survival Analysis Under Distribution Shift [46.84912148188679]
複数のデータソースにまたがる因果推論は、科学的発見の一般化性と複製性を高めるための有望な道を提供する。
既存のアプローチでは、検閲や離散的かつ連続的な時間の統合など、生存分析のユニークな課題に対処できない。
マルチソース設定におけるターゲットサイト固有の因果効果を推定する2つの新しい手法を提案する。
論文 参考訳(メタデータ) (2025-01-30T23:21:25Z) - Machine Learning for ALSFRS-R Score Prediction: Making Sense of the Sensor Data [44.99833362998488]
筋萎縮性側索硬化症(Amyotrophic Lateral Sclerosis、ALS)は、急速に進行する神経変性疾患である。
iDPP@CLEF 2024チャレンジを先導した今回の調査は,アプリから得られるセンサデータを活用することに焦点を当てている。
論文 参考訳(メタデータ) (2024-07-10T19:17:23Z) - Bias Reducing Multitask Learning on Mental Health Prediction [18.32551434711739]
メンタルヘルスの検出や予測のための機械学習モデルの開発では、研究が増加している。
本研究では,マルチタスク学習に基づくバイアス緩和手法を不安予測モデルに適用し,公平性分析を行うことを目的とする。
分析の結果、我々の不安予測ベースモデルでは、年齢、収入、民族性、そして参加者が米国で生まれたかどうかに偏りが生じていた。
論文 参考訳(メタデータ) (2022-08-07T02:28:32Z) - Improving Prediction of Cognitive Performance using Deep Neural Networks
in Sparse Data [2.867517731896504]
MIDUS(Midlife in the United States)の観察・コホート研究から得られたデータを用いて,エグゼクティブ機能とエピソード記憶測定をモデル化した。
ディープニューラルネットワーク(DNN)モデルは、認知パフォーマンス予測タスクの中で一貫して最高である。
論文 参考訳(メタデータ) (2021-12-28T22:23:08Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。