論文の概要: Using massive health insurance claims data to predict very high-cost
claimants: a machine learning approach
- arxiv url: http://arxiv.org/abs/1912.13032v1
- Date: Mon, 30 Dec 2019 18:01:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-17 02:17:05.223055
- Title: Using massive health insurance claims data to predict very high-cost
claimants: a machine learning approach
- Title(参考訳): 大規模医療保険請求データを用いて非常に高価な請求者を予測する:機械学習アプローチ
- Authors: Jos\'e M. Maisog and Wenhong Li and Yanchun Xu and Brian Hurley and
Hetal Shah and Ryan Lemberg and Tina Borden and Stephen Bandeian and Melissa
Schline and Roxanna Cross and Alan Spiro and Russ Michael and Alexander
Gutfraind
- Abstract要約: ハイコスト請求者 (HiCCs) は被保険者の0.16%を占めるが、医療費の9%を占める。
機械学習を用いて二分分類モデルの訓練を行い、HiCCの個人的リスクを計算した。
以上の結果から,クレームデータと公開データのみを用いて高い性能の予測モデルを構築できることが示唆された。
- 参考スコア(独自算出の注目度): 43.861384583351835
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Due to escalating healthcare costs, accurately predicting which patients will
incur high costs is an important task for payers and providers of healthcare.
High-cost claimants (HiCCs) are patients who have annual costs above
$\$250,000$ and who represent just 0.16% of the insured population but
currently account for 9% of all healthcare costs. In this study, we aimed to
develop a high-performance algorithm to predict HiCCs to inform a novel care
management system. Using health insurance claims from 48 million people and
augmented with census data, we applied machine learning to train binary
classification models to calculate the personal risk of HiCC. To train the
models, we developed a platform starting with 6,006 variables across all
clinical and demographic dimensions and constructed over one hundred candidate
models. The best model achieved an area under the receiver operating
characteristic curve of 91.2%. The model exceeds the highest published
performance (84%) and remains high for patients with no prior history of
high-cost status (89%), who have less than a full year of enrollment (87%), or
lack pharmacy claims data (88%). It attains an area under the precision-recall
curve of 23.1%, and precision of 74% at a threshold of 0.99. A care management
program enrolling 500 people with the highest HiCC risk is expected to treat
199 true HiCCs and generate a net savings of $\$7.3$ million per year. Our
results demonstrate that high-performing predictive models can be constructed
using claims data and publicly available data alone, even for rare high-cost
claimants exceeding $\$250,000$. Our model demonstrates the transformational
power of machine learning and artificial intelligence in care management, which
would allow healthcare payers and providers to introduce the next generation of
care management programs.
- Abstract(参考訳): 医療費の増大により、どの患者が高コストになるかを正確に予測することは、医療提供者や支払者にとって重要な課題である。
ハイコスト請求者 (HiCCs) は、年間250,000ドル以上の費用がかかる患者であり、被保険者の0.16%に過ぎず、現在の医療費の9%を占めている。
本研究では,hiccsを予測し,新しいケア管理システムに通知する高性能アルゴリズムを開発することを目的とした。
人口4800万人の健康保険請求と国勢調査データを用いて,2進分類モデルのトレーニングに機械学習を適用し,hiccの個人的リスクを算出した。
モデルのトレーニングのために, 臨床および人口動態の全体にわたって6,006変数のプラットフォームを開発し, 100以上の候補モデルを構築した。
最良モデルは受信機動作特性曲線91.2%の範囲を達成した。
このモデルが最も高い成績(84%)を上回り、高コスト状態の既往歴がない(89%)、1年未満の入学率(87%)、薬局の請求データ(88%)を欠いている患者にとって高い水準を維持している。
精度リコール曲線23.1%、精度74%の領域をしきい値0.99で達成する。
hiccリスクの高い500人を対象にしたケアマネジメントプログラムでは、199のhccを治療し、年間7.3億ドルの純貯蓄が期待されている。
この結果から,250,000ドルを超える稀な高コスト請求者であっても,クレームデータと公開データだけで高い性能の予測モデルを構築できることが示唆された。
本モデルは,医療従事者や提供者が次世代のケア管理プログラムを導入することができるように,医療管理における機械学習と人工知能の変容力を実証する。
関連論文リスト
- MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Building predictive models of healthcare costs with open healthcare data [0.0]
本稿では,機械学習技術を用いた予測モデル開発手法を提案する。
我々は2016年に230万件の患者データを分析した。
私たちは、患者の診断と人口統計からコストを予測するモデルを構築しました。
論文 参考訳(メタデータ) (2023-04-05T02:12:58Z) - Private, fair and accurate: Training large-scale, privacy-preserving AI models in medical imaging [47.99192239793597]
我々は,AIモデルのプライバシ保護トレーニングが,非プライベートトレーニングと比較して精度と公平性に与える影響を評価した。
我々の研究は、実際の臨床データセットの困難な現実的な状況下では、診断深層学習モデルのプライバシー保護トレーニングは、優れた診断精度と公正さで可能であることを示しています。
論文 参考訳(メタデータ) (2023-02-03T09:49:13Z) - Predicting Visit Cost of Obstructive Sleep Apnea using Electronic
Healthcare Records with Transformer [0.0]
肥満の増加に伴い、多くの国で閉塞性睡眠時無呼吸症(OSA)が増加傾向にある。
治療目的では,OSA患者の来院費の予測が重要である。
OSA患者のデータのうち3分の1は、分析モデルのトレーニングに利用できる。
論文 参考訳(メタデータ) (2023-01-28T20:08:00Z) - SANSformers: Self-Supervised Forecasting in Electronic Health Records
with Attention-Free Models [48.07469930813923]
本研究は,医療施設への患者訪問数を予測することにより,医療サービスの需要を予測することを目的とする。
SNSformerは、特定の帰納バイアスを設計し、EHRデータの特異な特徴を考慮に入れた、注意のない逐次モデルである。
本研究は, 各種患者集団を対象とした医療利用予測の修正における, 注意力のないモデルと自己指導型事前訓練の有望な可能性について考察した。
論文 参考訳(メタデータ) (2021-08-31T08:23:56Z) - High-Throughput Approach to Modeling Healthcare Costs Using Electronic
Healthcare Records [5.354801701968199]
本研究は6,700種類の処方薬に関する80,000人の患者から得られた40年間のデータから構築された医療事象を予測するための汎用的な機械学習手法の結果を報告する。
この手法を用いて構築したモデルは、個々の医薬品の処方薬を予測する同様の研究と比較すると、良好な結果が得られた。
論文 参考訳(メタデータ) (2020-11-18T19:06:18Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Accurate and Interpretable Machine Learning for Transparent Pricing of
Health Insurance Plans [3.772148470078554]
医療保険会社は米国人口の半分をカバーし、年間1.2兆米ドルを支払って会員の医療費をカバーしている。
医療保険会社におけるアクチュアリーとアンダーライターの役割は、どのリスクを取るか、そのリスクをどのように価格で評価し、組織の利益性を確保するのに役立つ。
患者レベルと雇用者レベルという2つのモデルを作成し,雇用者グループに対する年会費の予測を行った。
我々のモデルは、保険会社の既存の価格モデルよりも20%良いパフォーマンスを示し、譲歩機会の84%を特定できた。
論文 参考訳(メタデータ) (2020-09-23T08:07:33Z) - CPAS: the UK's National Machine Learning-based Hospital Capacity
Planning System for COVID-19 [111.69190108272133]
新型コロナウイルス(COVID-19)の2019年は、集中治療リソースに対する前例のない需要を伴う圧倒的な医療システムの脅威となる。
病院資源計画のための機械学習システムであるCPAS(COVID-19 Capacity Planning and Analysis System)を開発した。
CPASは、新型コロナウイルス(COVID-19)のパンデミックに対処するため、全国規模で病院に配備された最初の機械学習ベースのシステムの一つだ。
論文 参考訳(メタデータ) (2020-07-27T19:39:13Z) - A unified machine learning approach to time series forecasting applied
to demand at emergency departments [1.7119367122421556]
2019年にはイングランドの救急省(ED)に2560万人が出席しており、過去10年間で1200万人が出席した。
我々は,最高の演奏時系列と機械学習アプローチの結果を組み合わせた,新しいアンサンブル手法を開発した。
平均絶対誤差は, 平均絶対誤差が6.8%, 平均絶対誤差が8.6%であった。
論文 参考訳(メタデータ) (2020-07-13T07:59:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。