論文の概要: Impact of the composition of feature extraction and class sampling in
medicare fraud detection
- arxiv url: http://arxiv.org/abs/2206.01413v1
- Date: Fri, 3 Jun 2022 06:57:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-07 00:53:21.604301
- Title: Impact of the composition of feature extraction and class sampling in
medicare fraud detection
- Title(参考訳): 医療不正検出における特徴抽出とクラスサンプリングの組成の影響
- Authors: Akrity Kumari, Narinder Singh Punn, Sanjay Kumar Sonbhadra, Sonali
Agarwal
- Abstract要約: 本研究では,医療・医療サービスセンターが「医療部品D」保険請求書を公表し,不正検知システムの開発に利用した。
そこで本研究では,特徴抽出手法としてオートエンコーダ,データサンプリング手法として合成マイノリティ・オーバーサンプリング手法(SMOTE),および分類アルゴリズムとして勾配向上決定木に基づく分類器を適用した。
- 参考スコア(独自算出の注目度): 3.6016022712620095
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With healthcare being critical aspect, health insurance has become an
important scheme in minimizing medical expenses. Following this, the healthcare
industry has seen a significant increase in fraudulent activities owing to
increased insurance, and fraud has become a significant contributor to rising
medical care expenses, although its impact can be mitigated using fraud
detection techniques. To detect fraud, machine learning techniques are used.
The Centers for Medicaid and Medicare Services (CMS) of the United States
federal government released "Medicare Part D" insurance claims is utilized in
this study to develop fraud detection system. Employing machine learning
algorithms on a class-imbalanced and high dimensional medicare dataset is a
challenging task. To compact such challenges, the present work aims to perform
feature extraction following data sampling, afterward applying various
classification algorithms, to get better performance. Feature extraction is a
dimensionality reduction approach that converts attributes into linear or
non-linear combinations of the actual attributes, generating a smaller and more
diversified set of attributes and thus reducing the dimensions. Data sampling
is commonlya used to address the class imbalance either by expanding the
frequency of minority class or reducing the frequency of majority class to
obtain approximately equal numbers of occurrences for both classes. The
proposed approach is evaluated through standard performance metrics. Thus, to
detect fraud efficiently, this study applies autoencoder as a feature
extraction technique, synthetic minority oversampling technique (SMOTE) as a
data sampling technique, and various gradient boosted decision tree-based
classifiers as a classification algorithm. The experimental results show the
combination of autoencoders followed by SMOTE on the LightGBM classifier
achieved best results.
- Abstract(参考訳): 医療が重要な側面であるため、医療保険は医療費を最小化するための重要なスキームとなっている。
その後、医療業界は保険の増加によって不正行為が著しく増加しており、詐欺は医療費の増加に大きく寄与するが、その影響は詐欺検出技術を使って軽減することができる。
不正を検出するために、機械学習技術が使用される。
米国連邦政府のメディケイド・メディケア・サービスセンター(CMS)が「メディケア・パートD」の保険請求を公表し,不正検出システムの開発に利用した。
クラス不均衡で高次元の医療データセットに機械学習アルゴリズムを採用することは難しい課題である。
このような課題をコンパクト化するために,本研究は,データサンプリング後に特徴抽出を行い,その後,様々な分類アルゴリズムを適用し,より良い性能を得ることを目的とする。
特徴抽出(英: feature extraction)は、属性を実際の属性の線形または非線形の組み合わせに変換し、より小さくより多様化した属性の集合を生成し、次元を減らす次元還元アプローチである。
データサンプリングは、マイノリティクラスの頻度を拡大したり、多数派クラスの頻度を減らして、両方のクラスのほぼ同数の出現数を得ることによって、クラス不均衡に対処するために一般的に使用される。
提案手法は標準性能指標を用いて評価される。
そこで,本研究では,特徴抽出手法としてオートエンコーダ,データサンプリング手法として合成マイノリティオーバサンプリング手法(SMOTE),分類アルゴリズムとして各種勾配決定木に基づく分類器を適用した。
実験結果から,LightGBM分類器におけるオートエンコーダとSMOTEの組み合わせが最適であることがわかった。
関連論文リスト
- Quality assurance of organs-at-risk delineation in radiotherapy [7.698565355235687]
放射線治療計画において,腫瘍標的と臓器の脱線は重要である。
自動セグメンテーションの品質保証は、まだ臨床実践において必要ではない。
提案手法は,一級分類フレームワークにおける残差ネットワークとアテンション機構を導入し,様々な種類のOAR輪郭誤差を高精度に検出することができた。
論文 参考訳(メタデータ) (2024-05-20T02:32:46Z) - An Autoencoder and Generative Adversarial Networks Approach for Multi-Omics Data Imbalanced Class Handling and Classification [2.2940141855172036]
分子生物学では、マルチオミクスシークエンシングから生成されるデータの爆発があった。
従来の統計手法は、そのような高次元データを扱う際に難しい課題に直面している。
この研究は、オートエンコーダを組み込んだニューラルネットワークでこれらの課題に取り組むことに焦点を当て、特徴の潜在空間を抽出する。
論文 参考訳(メタデータ) (2024-05-16T01:45:55Z) - Multi-task Explainable Skin Lesion Classification [54.76511683427566]
少ないラベル付きデータでよく一般化する皮膚病変に対する数発のショットベースアプローチを提案する。
提案手法は,アテンションモジュールや分類ネットワークとして機能するセグメンテーションネットワークの融合を含む。
論文 参考訳(メタデータ) (2023-10-11T05:49:47Z) - Fraud Detection Using Optimized Machine Learning Tools Under Imbalance
Classes [0.304585143845864]
機械学習(ML)ツールのスマートバージョンによる不正検出は、安全性を保証するために不可欠である。
本稿では,4つの最先端ML手法,すなわちロジスティック回帰,決定木,ランダム森林,極端な勾配上昇について検討する。
フィッシングサイトURLとクレジットカード不正取引データセットは、元のデータに基づいてトレーニングされた極端な勾配が、信頼できるパフォーマンスを示していることを示している。
論文 参考訳(メタデータ) (2022-09-04T15:30:23Z) - PCA: Semi-supervised Segmentation with Patch Confidence Adversarial
Training [52.895952593202054]
医用画像セグメンテーションのためのPatch Confidence Adrial Training (PCA) と呼ばれる半教師付き対向法を提案する。
PCAは各パッチの画素構造とコンテキスト情報を学習し、十分な勾配フィードバックを得る。
本手法は, 医用画像のセグメンテーションにおいて, 最先端の半教師付き手法より優れており, その有効性を示している。
論文 参考訳(メタデータ) (2022-07-24T07:45:47Z) - Federated Deep AUC Maximization for Heterogeneous Data with a Constant
Communication Complexity [77.78624443410216]
異種胸部データ検出のための改良型FDAMアルゴリズムを提案する。
本研究は,提案アルゴリズムの通信が機械数に強く依存し,精度レベルにも強く依存していることを示す。
FDAMアルゴリズムのベンチマークデータセットと、異なる組織の医療用胸部X線画像に対する効果を実験により実証した。
論文 参考訳(メタデータ) (2021-02-09T04:05:19Z) - Minimax Active Learning [61.729667575374606]
アクティブラーニングは、人間のアノテーションによってラベル付けされる最も代表的なサンプルをクエリすることによって、ラベル効率の高いアルゴリズムを開発することを目指している。
現在のアクティブラーニング技術は、最も不確実なサンプルを選択するためにモデルの不確実性に頼るか、クラスタリングを使うか、最も多様なラベルのないサンプルを選択するために再構築する。
我々は,不確実性と多様性を両立させる半教師付きミニマックスエントロピーに基づく能動学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-12-18T19:03:40Z) - On the Importance of Diversity in Re-Sampling for Imbalanced Data and
Rare Events in Mortality Risk Models [0.0]
外科的アウトカムリスクツール(SORT)は、英国の主要な選択的内科手術の期間を通して死亡リスクを予測するために開発されたツールの1つです。
本研究では,データセット内のクラス不均衡に対処することにより,SORT予測モデルの拡張を行う。
提案手法は,共通再サンプリング技術上での多様性に基づく選択の応用について検討する。
論文 参考訳(メタデータ) (2020-12-15T09:45:35Z) - Predictive Modeling of ICU Healthcare-Associated Infections from
Imbalanced Data. Using Ensembles and a Clustering-Based Undersampling
Approach [55.41644538483948]
本研究は,集中治療室における危険因子の同定と医療関連感染症の予測に焦点をあてる。
感染発生率の低減に向けた意思決定を支援することを目的とする。
論文 参考訳(メタデータ) (2020-05-07T16:13:12Z) - Rectified Meta-Learning from Noisy Labels for Robust Image-based Plant
Disease Diagnosis [64.82680813427054]
植物病は食料安全保障と作物生産に対する主要な脅威の1つである。
1つの一般的なアプローチは、葉画像分類タスクとしてこの問題を変換し、強力な畳み込みニューラルネットワーク(CNN)によって対処できる。
本稿では,正規化メタ学習モジュールを共通CNNパラダイムに組み込んだ新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-17T09:51:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。