論文の概要: Evaluating Rare Disease Diagnostic Performance in Symptom Checkers: A Synthetic Vignette Simulation Approach
- arxiv url: http://arxiv.org/abs/2506.19750v4
- Date: Sun, 29 Jun 2025 08:14:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 13:01:42.717614
- Title: Evaluating Rare Disease Diagnostic Performance in Symptom Checkers: A Synthetic Vignette Simulation Approach
- Title(参考訳): 症状チェッカーにおける希少疾患診断性能の評価 : 合成ビグネットシミュレーションによる検討
- Authors: Takashi Nishibayashi, Seiji Kanazawa, Kumpei Yamada,
- Abstract要約: SC開発における重要な課題は、個々の疾患の予期せぬパフォーマンス劣化を防ぐことである。
本研究では,新しい合成ビグネットシミュレーション手法を提案し,検証する。
提案手法は,個々のまれな疾患に対するSCアルゴリズム変更の事前デプロイ評価を可能にする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Symptom Checkers (SCs) provide medical information tailored to user symptoms. A critical challenge in SC development is preventing unexpected performance degradation for individual diseases, especially rare diseases, when updating algorithms. This risk stems from the lack of practical pre-deployment evaluation methods. For rare diseases, obtaining sufficient evaluation data from user feedback is difficult. To evaluate the impact of algorithm updates on the diagnostic performance for individual rare diseases before deployment, this study proposes and validates a novel Synthetic Vignette Simulation Approach. This approach aims to enable this essential evaluation efficiently and at a low cost. To estimate the impact of algorithm updates, we generated synthetic vignettes from disease-phenotype annotations in the Human Phenotype Ontology (HPO), a publicly available knowledge base for rare diseases curated by experts. Using these vignettes, we simulated SC interviews to predict changes in diagnostic performance. The effectiveness of this approach was validated retrospectively by comparing the predicted changes with actual performance metrics using the R-squared ($R^2$) coefficient. Our experiment, covering eight past algorithm updates for rare diseases, showed that the proposed method accurately predicted performance changes for diseases with phenotype frequency information in HPO (n=5). For these updates, we found a strong correlation for both Recall@8 change ($R^2$ = 0.83,$p$ = 0.031) and Precision@8 change ($R^2$ = 0.78,$p$ = 0.047). Our proposed method enables the pre-deployment evaluation of SC algorithm changes for individual rare diseases. This evaluation is based on a publicly available medical knowledge database created by experts, ensuring transparency and explainability for stakeholders. Additionally, SC developers can efficiently improve diagnostic performance at a low cost.
- Abstract(参考訳): 症状チェッカー(SC)は、ユーザの症状に合わせて医療情報を提供する。
SC開発における重要な課題は、アルゴリズムを更新する際、個々の疾患、特にまれな疾患の予期せぬパフォーマンス劣化を防ぐことである。
このリスクは、実際のデプロイ前評価方法の欠如に起因する。
稀な疾患では,ユーザのフィードバックから十分な評価データを取得することは困難である。
本研究は, アルゴリズム更新が展開前の個々のまれな疾患の診断性能に与える影響を評価するために, 新たな合成ビグネットシミュレーション手法を提案し, 検証する。
このアプローチは、この本質的な評価を効率的かつ低コストで実現することを目的としている。
HPO(Human Phenotype Ontology:ヒトフェノタイプオントロジー:Human Phenotype Ontology:ヒトフェノタイプオントロジー:HPO)では、アルゴリズム更新の影響を推定するために、専門家がキュレートした稀な疾患の知識基盤として、病原性アノテーションから合成ヴィグネットを生成した。
これらのビグネットを用いてSCインタビューをシミュレートし,診断性能の変化を予測した。
提案手法の有効性は,R-squared(R^2$)係数を用いて予測された変化と実際の性能指標を比較して検証した。
その結果,HPOの表現型頻度情報(n=5。
これらの更新では、Recall@8変更(R^2$ = 0.83,$p$ = 0.031)とPrecision@8変更(R^2$ = 0.78,$p$ = 0.047)の相関が強くなった。
提案手法は,個々のまれな疾患に対するSCアルゴリズム変更の事前デプロイ評価を可能にする。
この評価は、専門家が作成した公開医療知識データベースに基づいており、ステークホルダーに対する透明性と説明可能性を保証する。
さらに、SC開発者は低コストで診断性能を効率的に改善できる。
関連論文リスト
- Advanced Meta-Ensemble Machine Learning Models for Early and Accurate Sepsis Prediction to Improve Patient Outcomes [0.0]
本報告では, 全身性炎症性反応症候群, 早期警戒スコア, クイックシークエンシャル臓器不全評価など, 従来の敗血症スクリーニングツールの限界について検討する。
本稿では,機械学習技術 - ランダムフォレスト, エクストリームグラディエントブースティング, 決定木モデル - を用いて, セプシスの発症を予測することを提案する。
本研究は,これらのモデルについて,精度,精度,リコール,F1スコア,受信器動作特性曲線の下での領域といった重要な指標を用いて,個別かつ組み合わせたメタアンサンブルアプローチで評価する。
論文 参考訳(メタデータ) (2024-07-11T00:51:32Z) - Symptom-based Machine Learning Models for the Early Detection of
COVID-19: A Narrative Review [0.0]
機械学習モデルは、患者の報告した症状、臨床データ、医療画像などを取り入れて、大規模なデータセットを分析することができる。
本稿では、その性能と限界を含む、COVID-19を予測するための症状のみの機械学習モデルの概要について概説する。
また、画像ベースモデルと比較して、症状ベースのモデルの性能についても検討する。
論文 参考訳(メタデータ) (2023-12-08T01:41:42Z) - How Does Pruning Impact Long-Tailed Multi-Label Medical Image
Classifiers? [49.35105290167996]
プルーニングは、ディープニューラルネットワークを圧縮し、全体的なパフォーマンスに大きな影響を及ぼすことなく、メモリ使用量と推論時間を短縮する強力なテクニックとして登場した。
この研究は、プルーニングがモデル行動に与える影響を理解するための第一歩である。
論文 参考訳(メタデータ) (2023-08-17T20:40:30Z) - Undersampling and Cumulative Class Re-decision Methods to Improve
Detection of Agitation in People with Dementia [16.949993123698345]
消化は認知症(PwD)で最も多い症状の1つである。
前回の研究では、参加者17名から600日間のマルチモーダルウェアラブルセンサデータを収集し、1分間の窓での動揺を検出する機械学習モデルを開発した。
本稿では,まず,不均衡を解消するために異なるアンダーサンプリング手法を実装し,通常の動作データの20%だけが競合的動揺検出モデルの訓練に適しているという結論に至った。
論文 参考訳(メタデータ) (2023-02-07T03:14:00Z) - Can uncertainty boost the reliability of AI-based diagnostic methods in
digital pathology? [3.8424737607413157]
デジタル病理学におけるDL予測の不確実性予測を付加すると,臨床応用の価値が増大する可能性が示唆された。
モデル統合手法(MCドロップアウトとディープアンサンブル)の有効性をモデル非依存アプローチと比較した。
以上の結果から,不確実性推定はある程度の信頼性を高め,分類しきい値選択に対する感度を低下させる可能性が示唆された。
論文 参考訳(メタデータ) (2021-12-17T10:10:00Z) - Variational Knowledge Distillation for Disease Classification in Chest
X-Rays [102.04931207504173]
我々は,X線に基づく疾患分類のための新しい確率的推論フレームワークである反復的知識蒸留(VKD)を提案する。
提案手法の有効性を,X線画像とEHRを用いた3つの公開ベンチマークデータセットに示す。
論文 参考訳(メタデータ) (2021-03-19T14:13:56Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z) - Joint Prediction and Time Estimation of COVID-19 Developing Severe
Symptoms using Chest CT Scan [49.209225484926634]
術後に重篤な症状を発症するかどうかを判定するための共同分類法と回帰法を提案する。
提案手法は,各試料の重量を考慮し,外乱の影響を低減し,不均衡な分類の問題を検討する。
提案手法では, 重症症例の予測精度76.97%, 相関係数0.524, 変換時間0.55日差が得られた。
論文 参考訳(メタデータ) (2020-05-07T12:16:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。