論文の概要: SatHealth: A Multimodal Public Health Dataset with Satellite-based Environmental Factors
- arxiv url: http://arxiv.org/abs/2506.13842v1
- Date: Mon, 16 Jun 2025 16:34:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-18 17:34:59.187438
- Title: SatHealth: A Multimodal Public Health Dataset with Satellite-based Environmental Factors
- Title(参考訳): SatHealth: 衛星による環境要因を考慮したマルチモーダル公衆衛生データセット
- Authors: Yuanlong Wang, Pengqi Wang, Changchang Yin, Ping Zhang,
- Abstract要約: SatHealthは、環境データ、衛星画像、医学的クレームから推定される全発生頻度、健康指標の社会的決定要因を組み合わせたデータセットである。
SatHealthの2症例(地域公衆衛生モデルと個人病リスク予測)で実験を行った。
その結果,生物環境情報はAIモデルの性能と時間空間の一般化性を著しく向上させることができることがわかった。
- 参考スコア(独自算出の注目度): 8.107949747896107
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Living environments play a vital role in the prevalence and progression of diseases, and understanding their impact on patient's health status becomes increasingly crucial for developing AI models. However, due to the lack of long-term and fine-grained spatial and temporal data in public and population health studies, most existing studies fail to incorporate environmental data, limiting the models' performance and real-world application. To address this shortage, we developed SatHealth, a novel dataset combining multimodal spatiotemporal data, including environmental data, satellite images, all-disease prevalences estimated from medical claims, and social determinants of health (SDoH) indicators. We conducted experiments under two use cases with SatHealth: regional public health modeling and personal disease risk prediction. Experimental results show that living environmental information can significantly improve AI models' performance and temporal-spatial generalizability on various tasks. Finally, we deploy a web-based application to provide an exploration tool for SatHealth and one-click access to both our data and regional environmental embedding to facilitate plug-and-play utilization. SatHealth is now published with data in Ohio, and we will keep updating SatHealth to cover the other parts of the US. With the web application and published code pipeline, our work provides valuable angles and resources to include environmental data in healthcare research and establishes a foundational framework for future research in environmental health informatics.
- Abstract(参考訳): 生活環境は病気の流行と進行において重要な役割を担い、患者の健康状態への影響を理解することは、AIモデルを開発する上でますます重要になっている。
しかし、公衆衛生研究や人口健康研究において、長期的・微粒な空間的・時間的データが欠如しているため、既存の研究の多くは環境データを取り入れず、モデルの性能と実世界の応用を制限している。
この不足に対処するために、環境データ、衛星画像、医学的クレームから推定される全発生頻度、SDoH指標を含むマルチモーダル時空間データを組み合わせた新しいデータセットであるSatHealthを開発した。
SatHealthの2症例(地域公衆衛生モデルと個人病リスク予測)で実験を行った。
実験結果から, 生活環境情報は, 各種タスクにおけるAIモデルの性能と時間空間的一般化性を著しく向上させることができることがわかった。
最後に、SatHealthのための探索ツールを提供するためにWebベースのアプリケーションをデプロイし、プラグイン・アンド・プレイの利用を容易にするために、データと地域環境の埋め込みの両方にワンクリックでアクセスできるようにする。
SatHealthは現在、オハイオ州でデータを公開しており、米国の他の地域をカバーするために、SatHealthをアップデートし続けます。
Webアプリケーションと公開コードパイプラインにより、我々の研究は、医療研究に環境データを含めるための貴重なアングルとリソースを提供し、将来の環境健康情報学研究の基盤となる枠組みを確立します。
関連論文リスト
- An AI-driven framework for the prediction of personalised health response to air pollution [30.858937705130106]
大気汚染は公衆衛生にとって重大な脅威となり、多くの呼吸器や心臓血管疾患を発生または悪化させる。
個人感覚の最近の進歩は、行動や生理的なデータの収集に変化をもたらした。
本研究では、ウェアラブルフィットネスデバイスからの生理データをリアルタイム環境暴露と統合することで、汚染に対する個人化された健康反応を予測する新しいワークフローを提案する。
論文 参考訳(メタデータ) (2025-05-15T17:59:07Z) - How Your Location Relates to Health: Variable Importance and Interpretable Machine Learning for Environmental and Sociodemographic Data [15.463748602675695]
健康の結果は、場所や時間によって影響が変化する複雑な環境や社会的な要因に依存する。
我々は、これらの効果、すなわち、イギリスの健康、環境、社会デマトグラフィー情報のMEDSATデータセットを研究するために、きめ細かい空間的・時間的データを使用します。
次に、GAM(Generalized Additive Models)とMGWR(Multiscale Geographically Weighted Regression)に基づく解釈可能な機械学習フレームワークを開発する。
以上の結果から,NO2は喘息,高血圧,不安の世界的な予測因子であり,職業,結婚,植生に関連する他の結果特異的な予測因子であることがわかった。
論文 参考訳(メタデータ) (2025-01-03T21:34:35Z) - DAMMI:Daily Activities in a Psychologically Annotated Multi-Modal IoT dataset [10.771838327042609]
DAMMIデータセットは、この分野の研究者を支援するように設計されている。
これには、ホームインストールされたセンサー、スマートフォンデータ、リストバンド146日以上にわたって収集された高齢者の日々の行動データが含まれている。
データ収集は、新型コロナウイルス(COVID-19)のパンデミック、正月、ラマダンの宗教月など、重要なイベントにまたがる。
論文 参考訳(メタデータ) (2024-10-05T13:26:54Z) - A primer on synthetic health data [0.2770822269241974]
深層生成モデルの最近の進歩は、現実的な合成健康データセットを作成する可能性を大きく広げている。
これらの合成データセットは、患者のアイデンティティやセンシティブな情報を開示することなく、特徴、パターン、全体的な科学的結論を保存することを目的としている。
しかし、合成データセットの類似性と予測ユーティリティを継続的に評価する方法など、多くの疑問や課題が残っている。
論文 参考訳(メタデータ) (2024-01-31T08:13:35Z) - SatBird: Bird Species Distribution Modeling with Remote Sensing and
Citizen Science Data [68.2366021016172]
本稿では,市民科学データベース eBird の観測データから得られたラベルを用いた,米国内の位置情報のサテライトデータセットである SatBird について述べる。
ケニアでは低データのレシエーションを表すデータセットも提供しています。
リモートセンシングタスクのためのSOTAモデルを含む、データセットのベースラインセットをベンチマークします。
論文 参考訳(メタデータ) (2023-11-02T02:00:27Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Data-Centric Epidemic Forecasting: A Survey [56.99209141838794]
この調査は、様々なデータ駆動の方法論および実践的進歩を掘り下げるものである。
疫学的なデータセットと,流行予測に関連する新しいデータストリームを列挙する。
また,これらの予測システムの現実的な展開において生じる経験や課題についても論じる。
論文 参考訳(メタデータ) (2022-07-19T16:15:11Z) - Health Status Prediction with Local-Global Heterogeneous Behavior Graph [69.99431339130105]
ウェアラブルセンサから継続的に収集される各種データストリームにより、健康状態の推定が可能です。
行動関連マルチソースデータストリームをローカル・グローバル・グラフでモデル化することを提案する。
学生生活データセットを用いて実験を行い,提案モデルの有効性を実証した。
論文 参考訳(メタデータ) (2021-03-23T11:10:04Z) - Challenges in biomarker discovery and biorepository for Gulf-war-disease
studies: a novel data platform solution [48.7576911714538]
ROSALINDという新しいデータプラットフォームを導入し、課題を克服し、健全で重要なコラボレーションを育み、科学的調査を進めます。
ROSALINDは、自己管理されたアクセシビリティ、リンク性、可積分性、中立性、信頼性を持つリソース有機体を指します。
過去12ヶ月のGWI研究におけるROSALINDの展開により、データ実験と分析のペースが加速し、多数のエラーソースが削除され、研究品質と生産性が向上しました。
論文 参考訳(メタデータ) (2021-02-04T20:38:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。