論文の概要: Impact on Public Health Decision Making by Utilizing Big Data Without
Domain Knowledge
- arxiv url: http://arxiv.org/abs/2402.06059v1
- Date: Thu, 8 Feb 2024 21:03:34 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-12 18:42:30.484241
- Title: Impact on Public Health Decision Making by Utilizing Big Data Without
Domain Knowledge
- Title(参考訳): ドメイン知識のないビッグデータを活用した公衆衛生意思決定への影響
- Authors: Miao Zhang, Salman Rahman, Vishwali Mhasawade, Rumi Chunara
- Abstract要約: 新たなデータソースと人工知能(AI)の手法は、多くの社会的応用における意思決定と関係がある。
この研究は、新しいデータソースを用いた効果的な介入の割り当てを示すためのロバストネスとモデル仕様の重要な問題を示す。
- 参考スコア(独自算出の注目度): 17.73578632982445
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: New data sources, and artificial intelligence (AI) methods to extract
information from them are becoming plentiful, and relevant to decision making
in many societal applications. An important example is street view imagery,
available in over 100 countries, and considered for applications such as
assessing built environment aspects in relation to community health outcomes.
Relevant to such uses, important examples of bias in the use of AI are evident
when decision-making based on data fails to account for the robustness of the
data, or predictions are based on spurious correlations. To study this risk, we
utilize 2.02 million GSV images along with health, demographic, and
socioeconomic data from New York City. Initially, we demonstrate that built
environment characteristics inferred from GSV labels at the intra-city level
may exhibit inadequate alignment with the ground truth. We also find that the
average individual-level behavior of physical inactivity significantly mediates
the impact of built environment features by census tract, as measured through
GSV. Finally, using a causal framework which accounts for these mediators of
environmental impacts on health, we find that altering 10% of samples in the
two lowest tertiles would result in a 4.17 (95% CI 3.84 to 4.55) or 17.2 (95%
CI 14.4 to 21.3) times bigger decrease on the prevalence of obesity or
diabetes, than the same proportional intervention on the number of crosswalks
by census tract. This work illustrates important issues of robustness and model
specification for informing effective allocation of interventions using new
data sources.
- Abstract(参考訳): 新しいデータソースと、それらから情報を取り出す人工知能(AI)メソッドは、多くの社会的応用において意思決定に関係している。
重要な例として、100か国以上で利用可能なストリートビューイメージがあり、コミュニティの健康に関する構築された環境側面の評価などの応用について検討されている。
このような利用に関連して、AIの使用における重要なバイアスの例は、データに基づく意思決定がデータの堅牢性を考慮するのに失敗する場合に明らかである。
このリスクを研究するために、ニューヨーク市の健康、人口統計、社会経済データとともに、2200万のGSV画像を利用する。
当初,都市内レベルでGSVラベルから推定される構築環境特性は,基礎的事実と不適切な一致を示す可能性が示唆された。
また,GSVを用いて測定したところ,身体不活性の平均的個人レベルの挙動は,建築環境特性の影響を著しく緩和することがわかった。
最後に、これらの環境影響のメディエーターが健康に与える影響を考慮に入れた因果的枠組みを用いて、2つの最も低いタイルで10%のサンプルを変更すると、4.17(95% CI 3.84から4.55)または17.2(95% CI 14.4から21.3)が肥満や糖尿病の頻度を減少させる。
この研究は、新しいデータソースを用いた効果的な介入の割り当てを示すためのロバストネスとモデル仕様の重要な問題を示す。
関連論文リスト
- Decoding Susceptibility: Modeling Misbelief to Misinformation Through a Computational Approach [61.04606493712002]
誤報に対する感受性は、観測不可能な不検証の主張に対する信念の度合いを記述している。
既存の感受性研究は、自己報告された信念に大きく依存している。
本稿では,ユーザの潜在感受性レベルをモデル化するための計算手法を提案する。
論文 参考訳(メタデータ) (2023-11-16T07:22:56Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - The adoption of non-pharmaceutical interventions and the role of digital
infrastructure during the COVID-19 Pandemic in Colombia, Ecuador, and El
Salvador [0.0]
コロンビア、エクアドル、エルサルバドルでのCOVID-19パンデミックの第1波におけるNPI付着の要因について検討した。
モビリティ低下とデジタルインフラストラクチャの品質との間には,大きな相関関係がある。
モビリティ低下とデジタルインフラストラクチャの品質の関連性は、NPIの制約のピーク時に強くなる。
論文 参考訳(メタデータ) (2022-02-24T13:15:17Z) - Label scarcity in biomedicine: Data-rich latent factor discovery
enhances phenotype prediction [102.23901690661916]
低次元の埋め込み空間は、健康指標、ライフスタイル、および人口動態の予測をデータスカース化するために、英国バイオバンクの人口データセットから導出することができる。
半超越的アプローチによるパフォーマンス向上は、おそらく様々な医学データサイエンス応用にとって重要な要素となるだろう。
論文 参考訳(メタデータ) (2021-10-12T16:25:50Z) - The Effects of Air Quality on the Spread of the COVID-19. An Artificial
Intelligence Approach [3.997680012976965]
本研究の目的は,イタリア地方における大気汚染とcovid-19の感染状況の関連について検討することである。
日頃のCOVID-19の事例と、気温、相対湿度、大気汚染物質などの環境要因との相関関係の分析を報告します。
これは、将来の感染数を予測するために環境パラメータでトレーニングされた機械学習モデルが正確であることを示唆している。
論文 参考訳(メタデータ) (2021-04-09T19:08:59Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Exposure Density and Neighborhood Disparities in COVID-19 Infection
Risk: Using Large-scale Geolocation Data to Understand Burdens on Vulnerable
Communities [1.2526963688768453]
本研究では,高空間・時間分解能の近傍活動レベルを定量化する手法を開発した。
本研究では, 露光密度を, 特定地域における局所的な活動量と非居住地および屋外土地利用における活動量の比率の尺度として定義する。
論文 参考訳(メタデータ) (2020-08-04T15:41:24Z) - COVI White Paper [67.04578448931741]
接触追跡は、新型コロナウイルスのパンデミックの進行を変える上で不可欠なツールだ。
カナダで開発されたCovid-19の公衆ピアツーピア接触追跡とリスク認識モバイルアプリケーションであるCOVIの理論的、設計、倫理的考察、プライバシ戦略について概説する。
論文 参考訳(メタデータ) (2020-05-18T07:40:49Z) - Inferring the Spatial Distribution of Physical Activity in Children
Population from Characteristics of the Environment [5.16880858963093]
本研究では,地域環境の機能として期待される人口行動をモデル化するための新しい分析手法を提案する。
小地域における身体活動の予測において,本手法を実験的に評価した。
具体的には、ある地域の身体活動レベルを予測するモデルを訓練し、81%のアウトアウト精度を達成した。
論文 参考訳(メタデータ) (2020-05-08T11:07:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。