論文の概要: Exploring a Hybrid Deep Learning Approach for Anomaly Detection in Mental Healthcare Provider Billing: Addressing Label Scarcity through Semi-Supervised Anomaly Detection
- arxiv url: http://arxiv.org/abs/2507.01924v1
- Date: Wed, 02 Jul 2025 17:33:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-03 14:23:00.402682
- Title: Exploring a Hybrid Deep Learning Approach for Anomaly Detection in Mental Healthcare Provider Billing: Addressing Label Scarcity through Semi-Supervised Anomaly Detection
- Title(参考訳): メンタルヘルス提供者請求書における異常検出のためのハイブリッドディープラーニングアプローチの探索:半監督的異常検出によるラベルの空白への対処
- Authors: Samirah Bakker, Yao Ma, Seyed Sahand Mohammadi Ziabari,
- Abstract要約: メンタルヘルスケア請求の複雑さは詐欺を含む異常を可能にする。
機械学習は異常検出に応用されているが、クラス不均衡、ラベル不足、複雑なシーケンシャルパターンに悩まされることが多い。
本研究では,Long Short-Term Memory(LSTM)ネットワークとTransformerを組み合わせたハイブリッドディープラーニングアプローチと,iForest(アイフォレスト)とオートエンコーダ(AE)による擬似ラベリングを提案する。
このアプローチは、メンタルヘルスに関連する2つの現実世界の請求データセットで評価される。
- 参考スコア(独自算出の注目度): 4.369362004113664
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The complexity of mental healthcare billing enables anomalies, including fraud. While machine learning methods have been applied to anomaly detection, they often struggle with class imbalance, label scarcity, and complex sequential patterns. This study explores a hybrid deep learning approach combining Long Short-Term Memory (LSTM) networks and Transformers, with pseudo-labeling via Isolation Forests (iForest) and Autoencoders (AE). Prior work has not evaluated such hybrid models trained on pseudo-labeled data in the context of healthcare billing. The approach is evaluated on two real-world billing datasets related to mental healthcare. The iForest LSTM baseline achieves the highest recall (0.963) on declaration-level data. On the operation-level data, the hybrid iForest-based model achieves the highest recall (0.744), though at the cost of lower precision. These findings highlight the potential of combining pseudo-labeling with hybrid deep learning in complex, imbalanced anomaly detection settings.
- Abstract(参考訳): メンタルヘルスケア請求の複雑さは詐欺を含む異常を可能にする。
機械学習手法は異常検出に応用されているが、クラス不均衡、ラベル不足、複雑なシーケンシャルパターンに悩まされることが多い。
本研究では,Long Short-Term Memory(LSTM)ネットワークとTransformersを組み合わせたハイブリッドなディープラーニングアプローチと,分離林(iForest)とオートエンコーダ(AE)による擬似ラベリングを提案する。
これまでの研究は、医療請求の文脈で擬似ラベル付きデータに基づいて訓練されたハイブリッドモデルを評価していない。
このアプローチは、メンタルヘルスに関連する2つの現実世界の請求データセットで評価される。
iForest LSTMベースラインは、宣言レベルデータ上で最も高いリコール(0.963)を達成する。
運用レベルのデータでは、iForestベースのハイブリッドモデルが最も高いリコール(0.744)を達成するが、精度は低い。
これらの知見は, 複雑で不均衡な異常検出設定において, 擬似ラベルとハイブリッドディープラーニングを組み合わせる可能性を強調した。
関連論文リスト
- Class-wise Autoencoders Measure Classification Difficulty And Detect Label Mistakes [22.45812577928658]
本稿では,個々のクラスで訓練されたオートエンコーダ間の再構成誤差の比率に基づいて,分類データセットを解析するための新しいフレームワークを提案する。
この分析フレームワークは、サンプル、クラス、およびデータセット全体のデータセットの効率的なキャラクタリゼーションを可能にする。
論文 参考訳(メタデータ) (2024-12-03T17:29:00Z) - LayerMatch: Do Pseudo-labels Benefit All Layers? [77.59625180366115]
半教師付き学習はラベル付きデータの依存性を軽減するための有望なソリューションを提供する。
我々はGrad-ReLUとAvg-Clusteringという2つの層固有の擬似ラベル戦略を開発した。
提案手法は,標準的な半教師付き学習ベンチマークにおいて,例外的な性能を示す。
論文 参考訳(メタデータ) (2024-06-20T11:25:50Z) - RoSAS: Deep Semi-Supervised Anomaly Detection with
Contamination-Resilient Continuous Supervision [21.393509817509464]
本稿では, テクスト汚染耐性連続監視信号を考案した, 半教師付き異常検出手法を提案する。
当社のアプローチは、AUC-PRにおいて最先端の競合他社を20%-30%上回っている。
論文 参考訳(メタデータ) (2023-07-25T04:04:49Z) - Is margin all you need? An extensive empirical study of active learning
on tabular data [66.18464006872345]
我々は,OpenML-CC18ベンチマークを用いて,69の実世界のデータセット上での各種能動学習アルゴリズムの性能を解析した。
意外なことに、古典的なマージンサンプリング技術は、現在の最先端技術を含む、他のすべてのものよりも優れている。
論文 参考訳(メタデータ) (2022-10-07T21:18:24Z) - Hierarchical Semi-Supervised Contrastive Learning for
Contamination-Resistant Anomaly Detection [81.07346419422605]
異常検出は、通常のデータ分布から逸脱したサンプルを特定することを目的としている。
コントラスト学習は、異常の効果的な識別を可能にする表現のサンプル化に成功している。
汚染耐性異常検出のための新しい階層型半教師付きコントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-24T18:49:26Z) - Semi-supervised Contrastive Outlier removal for Pseudo Expectation
Maximization (SCOPE) [2.33877878310217]
Pseudo expectation Maximization (SCOPE) のための半教師付きコントラスト外乱除去法を用いて, 共起誤差を抑制する新しい手法を提案する。
その結果,SCOPEはベースライン上での半教師付き分類精度を大幅に向上し,さらに整合正則化と組み合わせた場合,250と4000のラベル付きサンプルを用いた半教師付きCIFAR-10分類タスクにおいて最も高い精度が得られた。
論文 参考訳(メタデータ) (2022-06-28T19:32:50Z) - Federated Semi-supervised Medical Image Classification via Inter-client
Relation Matching [58.26619456972598]
フェデレートラーニング(FL)は、ディープ・ネットワークのトレーニングのために、分散医療機関とのコラボレーションで人気が高まっている。
本報告では,実践的かつ困難なFL問題であるtextitFederated Semi-supervised Learning (FSSL)について検討する。
本稿では, 従来の整合性正規化機構を改良し, クライアント間関係マッチング方式を提案する。
論文 参考訳(メタデータ) (2021-06-16T07:58:00Z) - Matching the Clinical Reality: Accurate OCT-Based Diagnosis From Few
Labels [2.891413712995642]
ラベルのないデータはクリニックで多用されることが多く、半教師付き学習に基づく機械学習手法がこの設定に適している。
最近提案されたMixMatchアルゴリズムとFixMatchアルゴリズムは有用な表現を抽出する有望な結果を証明している。
いずれのアルゴリズムも、ラベル付きデータの全ての部分において、転送学習ベースラインを上回ります。
論文 参考訳(メタデータ) (2020-10-23T11:47:28Z) - Semi-Supervised Active Learning for COVID-19 Lung Ultrasound
Multi-symptom Classification [13.878896181984262]
本稿では,複雑な特徴をモデル化し,ラベリングコストを削減するため,TSAL法を提案する。
そこで本研究では,多症状多ラベル(MSML)分類ネットワークを提案し,肺症状の識別的特徴について検討した。
678本の動画から6,836枚の画像が採取された71人の臨床患者を含む、COVID19-LUSMSという新しい肺データセットが構築されている。
論文 参考訳(メタデータ) (2020-09-09T10:45:34Z) - Uncovering the structure of clinical EEG signals with self-supervised
learning [64.4754948595556]
教師付き学習パラダイムは、しばしば利用可能なラベル付きデータの量によって制限される。
この現象は脳波(EEG)などの臨床関連データに特に問題となる。
ラベルのないデータから情報を抽出することで、ディープニューラルネットワークとの競合性能に到達することができるかもしれない。
論文 参考訳(メタデータ) (2020-07-31T14:34:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。