論文の概要: A Micro-Macro Machine Learning Framework for Predicting Childhood Obesity Risk Using NHANES and Environmental Determinants
- arxiv url: http://arxiv.org/abs/2512.22758v1
- Date: Sun, 28 Dec 2025 03:20:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-30 22:37:30.207948
- Title: A Micro-Macro Machine Learning Framework for Predicting Childhood Obesity Risk Using NHANES and Environmental Determinants
- Title(参考訳): NHANESと環境要因を用いた小児肥満リスク予測のためのマイクロマクロ機械学習フレームワーク
- Authors: Eswarasanthosh Kumar Mamillapalli, Nishtha Sharma,
- Abstract要約: 子供の肥満は、米国では依然として主要な公衆衛生上の課題である。
個人レベルの人文・社会経済データを統合したマイクロマクロ機械学習フレームワークを提案する。
NHANESマイクロデータを用いて肥満を予測するために、4つの機械学習モデルが訓練された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Childhood obesity remains a major public health challenge in the United States, strongly influenced by a combination of individual-level, household-level, and environmental-level risk factors. Traditional epidemiological studies typically analyze these levels independently, limiting insights into how structural environmental conditions interact with individual-level characteristics to influence health outcomes. In this study, we introduce a micro-macro machine learning framework that integrates (1) individual-level anthropometric and socioeconomic data from NHANES and (2) macro-level structural environment features, including food access, air quality, and socioeconomic vulnerability extracted from USDA and EPA datasets. Four machine learning models Logistic Regression, Random Forest, XGBoost, and LightGBM were trained to predict obesity using NHANES microdata. XGBoost achieved the strongest performance. A composite environmental vulnerability index (EnvScore) was constructed using normalized indicators from USDA and EPA at the state level. Multi-level comparison revealed strong geographic similarity between states with high environmental burden and the nationally predicted micro-level obesity risk distribution. This demonstrates the feasibility of integrating multi-scale datasets to identify environment-driven disparities in obesity risk. This work contributes a scalable, data-driven, multi-level modeling pipeline suitable for public health informatics, demonstrating strong potential for expansion into causal modeling, intervention planning, and real-time analytics.
- Abstract(参考訳): 子供の肥満は、個人レベル、世帯レベル、環境レベルのリスクファクターの組み合わせの影響を強く受け、米国では依然として主要な公衆衛生上の課題である。
伝統的疫学研究は通常、これらのレベルを個別に分析し、構造的環境条件が個々のレベルの特性とどのように相互作用して健康に影響を及ぼすかについての洞察を制限する。
本研究では,(1)NHANESの個人レベルの人文・社会経済データと(2)食品アクセス,空気質,社会経済の脆弱性を含むマクロレベルの環境特徴を統合したマイクロマクロ機械学習フレームワークを提案する。
4つの機械学習モデルであるLogistic Regression、Random Forest、XGBoost、LightGBMは、NHANESマイクロデータを使用して肥満を予測するためにトレーニングされた。
XGBoostは最強のパフォーマンスを達成した。
環境リスク指数(EnvScore)は,米国農務省とEPAの正常化指標を用いて構築された。
多段階比較の結果, 環境負荷の高い州と, 全国的に予測されるミクロレベルの肥満リスク分布との間には, 地理的に強い類似性が認められた。
これは、肥満リスクにおける環境駆動の格差を特定するために、マルチスケールデータセットを統合する可能性を示している。
この研究は、公衆衛生情報学に適したスケーラブルでデータ駆動のマルチレベルモデリングパイプラインに貢献し、因果モデリング、介入計画、リアルタイム分析への拡張の可能性を示す。
関連論文リスト
- Interpretable Graph-Language Modeling for Detecting Youth Illicit Drug Use [51.696842592898804]
十代の若者や若者(TYA)の間での違法薬物使用は、公衆衛生上の問題となっている。
TYAの違法薬物使用を検出するため、研究者は若者のリスク行動調査(YRBS)や全米薬物使用・健康調査(NSDUH)などの大規模調査を分析した。
既存のモデリング手法は、潜伏構造と相互接続構造を見渡すことで、調査変数を独立に扱う。
LAMIは違法薬物の使用を検知し、TYA間の行動危険因子を解釈するための新しいグラフ言語モデリングフレームワークである。
論文 参考訳(メタデータ) (2025-10-11T17:29:50Z) - Adaptable Cardiovascular Disease Risk Prediction from Heterogeneous Data using Large Language Models [70.64969663547703]
AdaCVDは、英国バイオバンクから50万人以上の参加者を対象に、大規模な言語モデルに基づいて構築された適応可能なCVDリスク予測フレームワークである。
包括的かつ可変的な患者情報を柔軟に取り込み、構造化データと非構造化テキストの両方をシームレスに統合し、最小限の追加データを使用して新規患者の集団に迅速に適応する。
論文 参考訳(メタデータ) (2025-05-30T14:42:02Z) - Improving Diseases Predictions Utilizing External Bio-Banks [1.9336815376402723]
機械学習がどのように活用され、説明可能性を高め、生物学的に意味のある関連を明らかにするかを実証する。
LightGBMモデルをデータセット(10K)のスクラッチからトレーニングして、メタボロミクス機能をインプットします。
汚染された代謝学の特徴は、疾患に関連する危険因子に対する影響を評価するために生存分析に使用される。
論文 参考訳(メタデータ) (2025-03-30T13:05:20Z) - How Your Location Relates to Health: Variable Importance and Interpretable Machine Learning for Environmental and Sociodemographic Data [15.463748602675695]
健康の結果は、場所や時間によって影響が変化する複雑な環境や社会的な要因に依存する。
我々は、これらの効果、すなわち、イギリスの健康、環境、社会デマトグラフィー情報のMEDSATデータセットを研究するために、きめ細かい空間的・時間的データを使用します。
次に、GAM(Generalized Additive Models)とMGWR(Multiscale Geographically Weighted Regression)に基づく解釈可能な機械学習フレームワークを開発する。
以上の結果から,NO2は喘息,高血圧,不安の世界的な予測因子であり,職業,結婚,植生に関連する他の結果特異的な予測因子であることがわかった。
論文 参考訳(メタデータ) (2025-01-03T21:34:35Z) - Impact on Public Health Decision Making by Utilizing Big Data Without
Domain Knowledge [17.73578632982445]
新たなデータソースと人工知能(AI)の手法は、多くの社会的応用における意思決定と関係がある。
この研究は、新しいデータソースを用いた効果的な介入の割り当てを示すためのロバストネスとモデル仕様の重要な問題を示す。
論文 参考訳(メタデータ) (2024-02-08T21:03:34Z) - Agent-Based Model: Simulating a Virus Expansion Based on the Acceptance
of Containment Measures [65.62256987706128]
比較疫学モデルは、疾患の状態に基づいて個人を分類する。
我々は、適応されたSEIRDモデルと市民のための意思決定モデルを組み合わせたABMアーキテクチャを提案する。
スペイン・ア・コルナにおけるSARS-CoV-2感染症の進行状況について検討した。
論文 参考訳(メタデータ) (2023-07-28T08:01:05Z) - A Comparative Study of Machine Learning Algorithms for Anomaly Detection
in Industrial Environments: Performance and Environmental Impact [62.997667081978825]
本研究は,環境の持続可能性を考慮した高性能機械学習モデルの要求に応えることを目的としている。
Decision TreesやRandom Forestsといった従来の機械学習アルゴリズムは、堅牢な効率性とパフォーマンスを示している。
しかし, 資源消費の累積増加にもかかわらず, 最適化された構成で優れた結果が得られた。
論文 参考訳(メタデータ) (2023-07-01T15:18:00Z) - Label scarcity in biomedicine: Data-rich latent factor discovery
enhances phenotype prediction [102.23901690661916]
低次元の埋め込み空間は、健康指標、ライフスタイル、および人口動態の予測をデータスカース化するために、英国バイオバンクの人口データセットから導出することができる。
半超越的アプローチによるパフォーマンス向上は、おそらく様々な医学データサイエンス応用にとって重要な要素となるだろう。
論文 参考訳(メタデータ) (2021-10-12T16:25:50Z) - Health Status Prediction with Local-Global Heterogeneous Behavior Graph [69.99431339130105]
ウェアラブルセンサから継続的に収集される各種データストリームにより、健康状態の推定が可能です。
行動関連マルチソースデータストリームをローカル・グローバル・グラフでモデル化することを提案する。
学生生活データセットを用いて実験を行い,提案モデルの有効性を実証した。
論文 参考訳(メタデータ) (2021-03-23T11:10:04Z) - Inferring the Spatial Distribution of Physical Activity in Children
Population from Characteristics of the Environment [5.16880858963093]
本研究では,地域環境の機能として期待される人口行動をモデル化するための新しい分析手法を提案する。
小地域における身体活動の予測において,本手法を実験的に評価した。
具体的には、ある地域の身体活動レベルを予測するモデルを訓練し、81%のアウトアウト精度を達成した。
論文 参考訳(メタデータ) (2020-05-08T11:07:35Z) - BigO: A public health decision support system for measuring obesogenic
behaviors of children in relation to their local environment [3.1617908029688913]
BigOは、子どもや思春期の若者やその環境から客観的な行動データを集めるために設計されたシステムである。
本稿では,BigO システムのデータ取得,インジケータ抽出,データ探索,分析コンポーネントについて概説する。
論文 参考訳(メタデータ) (2020-05-06T16:06:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。