論文の概要: Ensemble Learning for Healthcare: A Comparative Analysis of Hybrid Voting and Ensemble Stacking in Obesity Risk Prediction
- arxiv url: http://arxiv.org/abs/2509.02826v1
- Date: Tue, 02 Sep 2025 20:44:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 21:40:46.339674
- Title: Ensemble Learning for Healthcare: A Comparative Analysis of Hybrid Voting and Ensemble Stacking in Obesity Risk Prediction
- Title(参考訳): 医療のためのアンサンブル学習:肥満リスク予測におけるハイブリッド投票とアンサンブルスタッキングの比較分析
- Authors: Towhidul Islam, Md Sumon Ali,
- Abstract要約: 肥満は、食事、生理、環境要因によって引き起こされる重要な世界的な健康問題である。
機械学習は、早期肥満リスク予測のための有望なアプローチとして登場した。
本研究は,肥満リスク予測のためのハイブリット多数決とアンサンブル累積法を比較することを目的とする。
- 参考スコア(独自算出の注目度): 0.3867363075280543
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Obesity is a critical global health issue driven by dietary, physiological, and environmental factors, and is strongly associated with chronic diseases such as diabetes, cardiovascular disorders, and cancer. Machine learning has emerged as a promising approach for early obesity risk prediction, yet a comparative evaluation of ensemble techniques -- particularly hybrid majority voting and ensemble stacking -- remains limited. This study aims to compare hybrid majority voting and ensemble stacking methods for obesity risk prediction, identifying which approach delivers higher accuracy and efficiency. The analysis seeks to highlight the complementary strengths of these ensemble techniques in guiding better predictive model selection for healthcare applications. Two datasets were utilized to evaluate three ensemble models: Majority Hard Voting, Weighted Hard Voting, and Stacking (with a Multi-Layer Perceptron as meta-classifier). A pool of nine Machine Learning (ML) algorithms, evaluated across a total of 50 hyperparameter configurations, was analyzed to identify the top three models to serve as base learners for the ensemble methods. Preprocessing steps involved dataset balancing, and outlier detection, and model performance was evaluated using Accuracy and F1-Score. On Dataset-1, weighted hard voting and stacking achieved nearly identical performance (Accuracy: 0.920304, F1: 0.920070), outperforming majority hard voting. On Dataset-2, stacking demonstrated superior results (Accuracy: 0.989837, F1: 0.989825) compared to majority hard voting (Accuracy: 0.981707, F1: 0.981675) and weighted hard voting, which showed the lowest performance. The findings confirm that ensemble stacking provides stronger predictive capability, particularly for complex data distributions, while hybrid majority voting remains a robust alternative.
- Abstract(参考訳): 肥満は、食事、生理、環境要因によって引き起こされる重要な世界的な健康問題であり、糖尿病、心血管障害、がんなどの慢性疾患と強く関連している。
機械学習は、早期肥満リスク予測のための有望なアプローチとして登場したが、アンサンブルテクニック(特にハイブリッドな多数決投票とアンサンブルの積み重ね)の比較評価はまだ限られている。
本研究の目的は、肥満リスク予測のためのハイブリッド多数決法とアンサンブル重ね法を比較し、どのアプローチがより高い精度と効率をもたらすかを特定することである。
この分析は、医療応用のためのより良い予測モデル選択を導くために、これらのアンサンブルテクニックの補完的な強みを強調しようとしている。
2つのデータセットを使用して、3つのアンサンブルモデル、Majority Hard Voting、Weighted Hard Voting、Stacking(メタ分類器としてMulti-Layer Perceptron)を評価した。
合計50のハイパーパラメータ構成で評価された9つの機械学習(ML)アルゴリズムのプールを分析し、アンサンブル手法のベースラーナーとして機能する上位3つのモデルを特定した。
前処理のステップはデータセットのバランシングと異常検出であり、モデル性能はAcurcuracyとF1-Scoreを用いて評価された。
Dataset-1では、重み付けされたハード投票と積み重ねがほぼ同じパフォーマンス(精度:0.920304、F1:0.920070)を達成した。
Dataset-2では、過半数のハード投票 (精度: 0.981707, F1: 0.981675) と重み付きハード投票 (性能: 0.989837, F1: 0.989825) に比較して、より優れた結果(精度: 0.989837, F1: 0.989825)を示した。
その結果、アンサンブルの積み重ねは、特に複雑なデータ分布において、より強力な予測能力を提供する一方で、ハイブリッドな多数決投票は依然として堅牢な代替手段であることがわかった。
関連論文リスト
- Project-Probe-Aggregate: Efficient Fine-Tuning for Group Robustness [61.45587642780908]
画像テキスト基礎モデルのパラメータ効率向上のための3段階のアプローチを提案する。
本手法は, マイノリティ標本同定とロバストトレーニングアルゴリズムの2つの重要な要素を改良する。
我々の理論分析は,PPAが少数群の識別を向上し,バランスの取れたグループエラーを最小限に抑えるためにベイズが最適であることを示している。
論文 参考訳(メタデータ) (2025-03-12T15:46:12Z) - Leveraging Audio and Text Modalities in Mental Health: A Study of LLMs Performance [0.9074663948713616]
本研究では,マルチモーダル精神保健診断におけるLarge Language Models(LLMs)の可能性について検討した。
テキストと音声のモダリティを比較し,LLMが音声入力で等しく動作するかどうかを検討する。
論文 参考訳(メタデータ) (2024-12-09T20:40:03Z) - Predictive Accuracy-Based Active Learning for Medical Image Segmentation [5.25147264940975]
医用画像セグメンテーションのための効果的な予測精度に基づく能動学習法を提案する。
PAALは、精度予測器(AP)と軽量ポーリング戦略(WPS)から構成される。
複数のデータセットに対する実験結果は、PAALの優位性を示している。
論文 参考訳(メタデータ) (2024-05-01T11:12:08Z) - Automated Bi-Fold Weighted Ensemble Algorithms and its Application to Brain Tumor Detection and Classification [0.3413711585591077]
脳腫瘍は、特に第三世界の国々において重大な課題を引き起こす。
早期診断は、脳腫瘍を効果的に管理し、死亡率を下げる上で重要な役割を担っている。
重み付きアンサンブル法の有効性を高めることを目的とした2つの短辺二重み付き投票アンサンブルモデルを提案する。
論文 参考訳(メタデータ) (2024-03-31T06:38:08Z) - GREAT Score: Global Robustness Evaluation of Adversarial Perturbation using Generative Models [60.48306899271866]
GREATスコア(GREAT Score)と呼ばれる新しいフレームワークを提案する。
我々は,ロバストベンチにおける攻撃ベースモデルと比較し,高い相関性を示し,GREATスコアのコストを大幅に削減した。
GREAT Scoreは、プライバシーに敏感なブラックボックスモデルのリモート監査に使用することができる。
論文 参考訳(メタデータ) (2023-04-19T14:58:27Z) - An Intelligent Decision Support Ensemble Voting Model for Coronary
Artery Disease Prediction in Smart Healthcare Monitoring Environments [0.0]
冠動脈疾患 (CAD) は、世界で最も一般的な心臓疾患の1つである。
機械学習(ML)アルゴリズムに基づくe-diagnosisツールは、スマートヘルスケア監視システムで使用することができる。
論文 参考訳(メタデータ) (2022-10-25T21:09:34Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Predictive Modeling of ICU Healthcare-Associated Infections from
Imbalanced Data. Using Ensembles and a Clustering-Based Undersampling
Approach [55.41644538483948]
本研究は,集中治療室における危険因子の同定と医療関連感染症の予測に焦点をあてる。
感染発生率の低減に向けた意思決定を支援することを目的とする。
論文 参考訳(メタデータ) (2020-05-07T16:13:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。