論文の概要: ML-Driven Approaches to Combat Medicare Fraud: Advances in Class Imbalance Solutions, Feature Engineering, Adaptive Learning, and Business Impact
- arxiv url: http://arxiv.org/abs/2502.15898v1
- Date: Fri, 21 Feb 2025 19:34:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-25 15:57:23.496787
- Title: ML-Driven Approaches to Combat Medicare Fraud: Advances in Class Imbalance Solutions, Feature Engineering, Adaptive Learning, and Business Impact
- Title(参考訳): ML-Driven Approachs to Combat Medicare Fraud: Advances in Class Un Balance Solutions, Feature Engineering, Adaptive Learning, and Business Impact
- Authors: Dorsa Farahmandazad, Kasra Danesh,
- Abstract要約: 本研究は,メディケア不正検出における機械学習の利用について検討する。
データはRandom Forest、KNN、LDA、Decision Tree、AdaBoostの5つのMLモデルのトレーニングと評価に使用された。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Medicare fraud poses a substantial challenge to healthcare systems, resulting in significant financial losses and undermining the quality of care provided to legitimate beneficiaries. This study investigates the use of machine learning (ML) to enhance Medicare fraud detection, addressing key challenges such as class imbalance, high-dimensional data, and evolving fraud patterns. A dataset comprising inpatient claims, outpatient claims, and beneficiary details was used to train and evaluate five ML models: Random Forest, KNN, LDA, Decision Tree, and AdaBoost. Data preprocessing techniques included resampling SMOTE method to address the class imbalance, feature selection for dimensionality reduction, and aggregation of diagnostic and procedural codes. Random Forest emerged as the best-performing model, achieving a training accuracy of 99.2% and validation accuracy of 98.8%, and F1-score (98.4%). The Decision Tree also performed well, achieving a validation accuracy of 96.3%. KNN and AdaBoost demonstrated moderate performance, with validation accuracies of 79.2% and 81.1%, respectively, while LDA struggled with a validation accuracy of 63.3% and a low recall of 16.6%. The results highlight the importance of advanced resampling techniques, feature engineering, and adaptive learning in detecting Medicare fraud effectively. This study underscores the potential of machine learning in addressing the complexities of fraud detection. Future work should explore explainable AI and hybrid models to improve interpretability and performance, ensuring scalable and reliable fraud detection systems that protect healthcare resources and beneficiaries.
- Abstract(参考訳): 医療詐欺は医療システムに重大な課題をもたらし、経済的損失が大きく、正当な受益者に提供された医療の質を損なう。
本研究では,機械学習(ML)を用いてメディケア不正検出を強化し,クラス不均衡や高次元データ,詐欺パターンの進化といった重要な課題に対処する。
患者の主張、外来の主張、受益者の詳細を含むデータセットを用いて、ランダムフォレスト、KNN、LDA、決定木、AdaBoostの5つのMLモデルのトレーニングと評価を行った。
データ前処理技術には、クラス不均衡に対処するSMOTE法の再サンプリング、次元減少のための特徴選択、診断および手続きコードの統合が含まれていた。
ランダムフォレストは、99.2%のトレーニング精度、98.8%の検証精度、F1スコア(98.4%)を達成し、最高のパフォーマンスモデルとして登場した。
決定木も良好に機能し、96.3%の検証精度を達成した。
KNNとAdaBoostはそれぞれ79.2%と81.1%の検証精度を示し、LDAは63.3%の検証精度と16.6%の低いリコールに苦労した。
その結果、メディケア詐欺を効果的に検出する上で、高度なリサンプリング技術、特徴工学、適応学習の重要性が強調された。
本研究では,不正検出の複雑さに対処する機械学習の可能性を明らかにする。
今後の作業では、解釈性とパフォーマンスを改善し、医療資源や受益者を保護するスケーラブルで信頼性の高い不正検出システムを保証するための、説明可能なAIとハイブリッドモデルを検討する必要がある。
関連論文リスト
- TRUSWorthy: Toward Clinically Applicable Deep Learning for Confident Detection of Prostate Cancer in Micro-Ultrasound [3.8208601340697386]
信頼性の高いPCa検出システムであるTRUSWorthyを提案する。
我々のパイプラインは、自己教師付き学習、トランスフォーマーを用いたマルチインスタンス学習集約、ランダムアンサンプブーピング、およびアンサンブルを統合している。
本手法は,従来の最先端のディープラーニング手法よりも精度と不確実性の校正に優れていた。
論文 参考訳(メタデータ) (2025-02-20T16:31:24Z) - Unified dimensionality reduction techniques in chronic liver disease detection [0.5242869847419834]
本研究では,多くの機械学習アルゴリズムについて検討した。
本研究の主な焦点は, 583名の患者の医療記録を含む, このデータセットである。
検索は、カスタマイズされた特徴抽出と次元削減方法の選択と使用に関する重要な新しい視点を提供する。
論文 参考訳(メタデータ) (2024-12-30T18:35:02Z) - Wafer Map Defect Classification Using Autoencoder-Based Data Augmentation and Convolutional Neural Network [4.8748194765816955]
本研究では、自己エンコーダに基づくデータ拡張技術と畳み込みニューラルネットワーク(CNN)を組み合わせた新しい手法を提案する。
提案手法は,ランダムフォレスト,SVM,ロジスティック回帰をそれぞれ19%,21%,27%以上,98.56%の分類精度を達成している。
論文 参考訳(メタデータ) (2024-11-17T10:19:54Z) - U-PASS: an Uncertainty-guided deep learning Pipeline for Automated Sleep
Staging [61.6346401960268]
プロセスの各段階で不確実性推定を組み込んだ臨床応用に適した,U-PASSと呼ばれる機械学習パイプラインを提案する。
不確実性誘導型ディープラーニングパイプラインを睡眠ステージングの困難な問題に適用し、各ステージにおけるパフォーマンスを体系的に改善することを示す。
論文 参考訳(メタデータ) (2023-06-07T08:27:36Z) - Towards Reliable Medical Image Segmentation by utilizing Evidential Calibrated Uncertainty [52.03490691733464]
本稿では,医療画像セグメンテーションネットワークにシームレスに統合可能な,実装が容易な基礎モデルであるDEviSを紹介する。
主観的論理理論を利用して、医用画像分割の問題に対する確率と不確実性を明示的にモデル化する。
DeviSには不確実性を考慮したフィルタリングモジュールが組み込まれている。
論文 参考訳(メタデータ) (2023-01-01T05:02:46Z) - Diffusion Denoising Process for Perceptron Bias in Out-of-distribution
Detection [67.49587673594276]
我々は、識別器モデルが入力の特定の特徴に対してより敏感であることを示唆する新しいパーセプトロンバイアスの仮定を導入し、過度な問題を引き起こした。
DMの拡散分解過程 (DDP) が非対称の新たな形態として機能し, 入力を高め, 過信問題を緩和するのに適していることを示す。
CIFAR10, CIFAR100, ImageNetによる実験により, 提案手法がSOTA手法より優れていることが示された。
論文 参考訳(メタデータ) (2022-11-21T08:45:08Z) - Fraud Detection Using Optimized Machine Learning Tools Under Imbalance
Classes [0.304585143845864]
機械学習(ML)ツールのスマートバージョンによる不正検出は、安全性を保証するために不可欠である。
本稿では,4つの最先端ML手法,すなわちロジスティック回帰,決定木,ランダム森林,極端な勾配上昇について検討する。
フィッシングサイトURLとクレジットカード不正取引データセットは、元のデータに基づいてトレーニングされた極端な勾配が、信頼できるパフォーマンスを示していることを示している。
論文 参考訳(メタデータ) (2022-09-04T15:30:23Z) - Detecting Shortcut Learning for Fair Medical AI using Shortcut Testing [62.9062883851246]
機械学習は医療の改善に大いに貢献するが、その利用が健康格差を広めたり増幅したりしないことを確実にすることは重要である。
アルゴリズムの不公平性の潜在的な要因の1つ、ショートカット学習は、トレーニングデータにおける不適切な相関に基づいてMLモデルが予測した時に発生する。
マルチタスク学習を用いて,臨床MLシステムの公平性評価の一環として,ショートカット学習の評価と緩和を行う手法を提案する。
論文 参考訳(メタデータ) (2022-07-21T09:35:38Z) - Impact of the composition of feature extraction and class sampling in
medicare fraud detection [3.6016022712620095]
本研究では,医療・医療サービスセンターが「医療部品D」保険請求書を公表し,不正検知システムの開発に利用した。
そこで本研究では,特徴抽出手法としてオートエンコーダ,データサンプリング手法として合成マイノリティ・オーバーサンプリング手法(SMOTE),および分類アルゴリズムとして勾配向上決定木に基づく分類器を適用した。
論文 参考訳(メタデータ) (2022-06-03T06:57:08Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Accurate and Robust Feature Importance Estimation under Distribution
Shifts [49.58991359544005]
PRoFILEは、新しい特徴重要度推定法である。
忠実さと頑健さの両面で、最先端のアプローチよりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2020-09-30T05:29:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。