論文の概要: Computationally Assisted Quality Control for Public Health Data Streams
- arxiv url: http://arxiv.org/abs/2306.16914v1
- Date: Thu, 29 Jun 2023 13:08:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-30 13:27:48.086535
- Title: Computationally Assisted Quality Control for Public Health Data Streams
- Title(参考訳): 公衆衛生データストリームのための計算支援品質制御
- Authors: Ananya Joshi, Kathryn Mazaitis, Roni Rosenfeld, Bryan Wilder
- Abstract要約: FlaSHは、公衆衛生データユーザのための実用的なアウトリー検出フレームワークである。
シンプルでスケーラブルなモデルを使用して、公衆衛生ストリームの統計特性をキャプチャします。
公衆衛生関係者が使用するデータストリームにデプロイされている。
- 参考スコア(独自算出の注目度): 28.69077280862091
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Irregularities in public health data streams (like COVID-19 Cases) hamper
data-driven decision-making for public health stakeholders. A real-time,
computer-generated list of the most important, outlying data points from
thousands of daily-updated public health data streams could assist an expert
reviewer in identifying these irregularities. However, existing outlier
detection frameworks perform poorly on this task because they do not account
for the data volume or for the statistical properties of public health streams.
Accordingly, we developed FlaSH (Flagging Streams in public Health), a
practical outlier detection framework for public health data users that uses
simple, scalable models to capture these statistical properties explicitly. In
an experiment where human experts evaluate FlaSH and existing methods
(including deep learning approaches), FlaSH scales to the data volume of this
task, matches or exceeds these other methods in mean accuracy, and identifies
the outlier points that users empirically rate as more helpful. Based on these
results, FlaSH has been deployed on data streams used by public health
stakeholders.
- Abstract(参考訳): 公衆衛生データストリーム(COVID-19ケースなど)の不規則性は、公衆衛生ステークホルダーにとってデータ駆動による意思決定を妨げる。
毎日更新される何千もの公衆衛生データストリームから、最も重要なデータポイントをリアルタイムでコンピュータが生成するリストは、専門家のレビュワーがこれらの不備を特定するのに役立つだろう。
しかし、既存の異常検出フレームワークは、データ量や公衆衛生ストリームの統計特性を考慮していないため、このタスクではパフォーマンスが悪くなっている。
そこで我々は,統計特性を明示的に把握するために,単純でスケーラブルなモデルを用いた公衆衛生データユーザのための実用的な異常検出フレームワーク flash (flagging stream in public health) を開発した。
人間の専門家がFraSHと既存の手法(ディープラーニングアプローチを含む)を評価する実験では、FraSHはこのタスクのデータボリュームにスケールし、これらのメソッドを平均精度でマッチングまたはオーバーし、ユーザが経験的に有益であると評価するアウトリーポイントを特定する。
これらの結果に基づいて、FraSHは、公衆衛生関係者が使用するデータストリームにデプロイされている。
関連論文リスト
- Outlier Ranking in Large-Scale Public Health Streams [17.53470381091954]
疾病管理の専門家は、毎日公衆衛生データストリームを検査し、調査に値するアウトリーチを検査する。
本稿では,各ストリームに適用される任意の単変数法の出力をランク付けするアルゴリズムを提案する。
階層的ネットワークと極端な値解析を生かした新しいアルゴリズムは,従来の外乱検出指標で最善を尽くした。
論文 参考訳(メタデータ) (2024-01-02T23:08:49Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - CenTime: Event-Conditional Modelling of Censoring in Survival Analysis [49.44664144472712]
CenTimeは、イベントへの時間を直接見積もる、サバイバル分析の新しいアプローチである。
本手法は,非検閲データが少ない場合でも,堅牢なイベント条件検閲機構を特徴とする。
以上の結果から,CenTimeは同等の性能を維持しつつ,死までの時間を予測する上で,最先端のパフォーマンスを提供することがわかった。
論文 参考訳(メタデータ) (2023-09-07T17:07:33Z) - On the Universal Adversarial Perturbations for Efficient Data-free
Adversarial Detection [55.73320979733527]
本稿では,UAPに対して正常サンプルと逆サンプルの異なる応答を誘導する,データに依存しない逆検出フレームワークを提案する。
実験結果から,本手法は様々なテキスト分類タスクにおいて,競合検出性能を実現することが示された。
論文 参考訳(メタデータ) (2023-06-27T02:54:07Z) - Sensitive Data Detection with High-Throughput Machine Learning Models in
Electrical Health Records [15.982220037507169]
1996年健康保険ポータビリティ・アンド・アカウンタビリティ法(英: Health Insurance Portability and Accountability Act of 1996, HIPAA)は、厚生労働情報保護法(PHI)である。
この領域における課題の1つは、異なる分野にわたるデータにおけるPHIフィールドの不均一性である。
この可変性は、あるデータベースで動作しているルールベースの機密変数識別システムを別のデータベースでフェールさせる。
論文 参考訳(メタデータ) (2023-04-30T16:14:23Z) - Practical Challenges in Differentially-Private Federated Survival
Analysis of Medical Data [57.19441629270029]
本稿では,ニューラルネットワークの本質的特性を活用し,生存分析モデルの訓練過程を関連づける。
小さな医療データセットと少数のデータセンターの現実的な設定では、このノイズはモデルを収束させるのが難しくなります。
DPFed-post は,私的フェデレート学習方式に後処理の段階を追加する。
論文 参考訳(メタデータ) (2022-02-08T10:03:24Z) - Reliable and Trustworthy Machine Learning for Health Using Dataset Shift
Detection [7.263558963357268]
予測不能なMLモデルの振る舞いは、特に健康領域において、その安全性に対する深刻な懸念を引き起こす。
マハラノビス距離およびグラム行列に基づく分布外検出法は,分布外データを高精度に検出できることを示す。
次に、アウト・オブ・ディストリビューションスコアを人間の解釈可能なConFIDENCE SCOREに変換し、ユーザーの健康MLアプリケーションとのインタラクションに与える影響を調査する。
論文 参考訳(メタデータ) (2021-10-26T20:49:01Z) - Health Status Prediction with Local-Global Heterogeneous Behavior Graph [69.99431339130105]
ウェアラブルセンサから継続的に収集される各種データストリームにより、健康状態の推定が可能です。
行動関連マルチソースデータストリームをローカル・グローバル・グラフでモデル化することを提案する。
学生生活データセットを用いて実験を行い,提案モデルの有効性を実証した。
論文 参考訳(メタデータ) (2021-03-23T11:10:04Z) - Measuring Data Collection Diligence for Community Healthcare [23.612133021992868]
地域保健従事者(CHW)による非宗教的データ収集は、発展途上国において重要な課題である。
本研究では,データ収集のディリジェンススコアを定義し,テストする。
インドにおけるNGOのフィールドモニタを用いて,本フレームワークを地上で検証した。
論文 参考訳(メタデータ) (2020-11-05T16:45:03Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。