論文の概要: Classifying Dental Care Providers Through Machine Learning with Features Ranking
- arxiv url: http://arxiv.org/abs/2506.04474v1
- Date: Wed, 04 Jun 2025 21:45:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-06 21:53:49.439052
- Title: Classifying Dental Care Providers Through Machine Learning with Features Ranking
- Title(参考訳): 特徴ランキングを用いた機械学習による歯科ケアプロバイダの分類
- Authors: Mohammad Subhi Al-Batah, Mowafaq Salem Alzboon, Muhyeeddin Alqaraleh, Mohammed Hasan Abu-Arqoub, Rashiq Rafiq Marie,
- Abstract要約: 本研究では, 歯科医療機関の分類における機械学習(ML)モデルの適用について検討した。
データセットには、サービスカウント(予防、治療、試験)、デリバリーシステム(FFS、管理ケア)、受益者の人口統計が含まれる。
本研究は,モデル効率と精度の向上における特徴選択の重要性を浮き彫りにした。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This study investigates the application of machine learning (ML) models for classifying dental providers into two categories - standard rendering providers and safety net clinic (SNC) providers - using a 2018 dataset of 24,300 instances with 20 features. The dataset, characterized by high missing values (38.1%), includes service counts (preventive, treatment, exams), delivery systems (FFS, managed care), and beneficiary demographics. Feature ranking methods such as information gain, Gini index, and ANOVA were employed to identify critical predictors, revealing treatment-related metrics (TXMT_USER_CNT, TXMT_SVC_CNT) as top-ranked features. Twelve ML models, including k-Nearest Neighbors (kNN), Decision Trees, Support Vector Machines (SVM), Stochastic Gradient Descent (SGD), Random Forest, Neural Networks, and Gradient Boosting, were evaluated using 10-fold cross-validation. Classification accuracy was tested across incremental feature subsets derived from rankings. The Neural Network achieved the highest accuracy (94.1%) using all 20 features, followed by Gradient Boosting (93.2%) and Random Forest (93.0%). Models showed improved performance as more features were incorporated, with SGD and ensemble methods demonstrating robustness to missing data. Feature ranking highlighted the dominance of treatment service counts and annotation codes in distinguishing provider types, while demographic variables (AGE_GROUP, CALENDAR_YEAR) had minimal impact. The study underscores the importance of feature selection in enhancing model efficiency and accuracy, particularly in imbalanced healthcare datasets. These findings advocate for integrating feature-ranking techniques with advanced ML algorithms to optimize dental provider classification, enabling targeted resource allocation for underserved populations.
- Abstract(参考訳): 本研究は,歯のレンダリングプロバイダと安全ネットクリニック(SNC)プロバイダの2つのカテゴリに分類するための機械学習(ML)モデルの適用について,2018年のデータセットを用いて検討した。
このデータセットは、高い欠落(38.1%)を特徴とし、サービス数(予防、治療、試験)、配送システム(FFS、管理ケア)、受益者の人口統計を含んでいる。
情報ゲイン,ギニ指数,ANOVAといった特徴ランク付け手法を用いて重要な予測因子を同定し,治療関連指標(TXMT_USER_CNT,TXMT_SVC_CNT)を上位の指標として明らかにした。
k-Nearest Neighbors (kNN), Decision Trees, Support Vector Machines (SVM), Stochastic Gradient Descent (SGD), Random Forest, Neural Networks, Gradient BoostingなどのMLモデルを10倍のクロスバリデーションを用いて評価した。
分類精度は、ランクから派生したインクリメンタルな特徴サブセットで検証された。
ニューラルネットワークは20の全ての特徴を使って最高精度(94.1%)を達成し、続いてグラディエントブースティング(93.2%)とランダムフォレスト(93.0%)が続いた。
モデルでは、SGDとアンサンブルメソッドが欠落データに対して堅牢性を示すため、より多くの機能が組み込まれたため、パフォーマンスが向上した。
特徴ランキングでは、プロバイダタイプを区別する処理サービス数やアノテーションコードの支配が強調され、人口動態変数(AGE_GROUP, CALENDAR_YEAR)は最小限の影響を受けていた。
この研究は、特に不均衡な医療データセットにおいて、モデルの効率性と正確性を高めることにおける特徴選択の重要性を強調している。
これらの知見は, 高度MLアルゴリズムと特徴レベルの手法を統合し, 歯科医療機関の分類を最適化し, 未保存人口を対象とした資源配分を可能にすることを提唱する。
関連論文リスト
- Comparative performance of ensemble models in predicting dental provider types: insights from fee-for-service data [0.44998333629984877]
本研究は,2018年モデルを用いた歯科医療者分類における機械学習モデルの性能評価を目的とした。
Nerve Networks は AUC (0.975) と CA (94.1%) を達成し、Random Forest (AUC:0.948, CA:93.0%) を続いた。
高度な機械学習技術、特にアンサンブルと深層学習モデルは、歯科労働者の分類を大幅に強化する。
論文 参考訳(メタデータ) (2025-06-04T21:55:27Z) - A Comprehensive Machine Learning Framework for Heart Disease Prediction: Performance Evaluation and Future Perspectives [0.0]
本研究では,心臓病予測のための機械学習ベースのフレームワークを提案する。
提案モデルでは, 心疾患を効果的に予測し, 臨床的意思決定を支援する可能性を示す。
論文 参考訳(メタデータ) (2025-05-15T05:13:38Z) - Reproducible Machine Learning-based Voice Pathology Detection: Introducing the Pitch Difference Feature [1.7779568951268254]
本稿では,現在公開されているSaarbr"ucken Voice Databaseを用いた音声病理診断手法を提案する。
機械学習(ML)アルゴリズムを6つ評価する - サポートベクターマシン、kネアレスト隣人、ナイーブベイズ、決定木、ランダムフォレスト、AdaBoost。
アプローチは, 女性, 男性, 合計で85.61%, 84.69%, および85.22%であった。
論文 参考訳(メタデータ) (2024-10-14T14:17:52Z) - Prospector Heads: Generalized Feature Attribution for Large Models & Data [82.02696069543454]
本稿では,説明に基づく帰属手法の効率的かつ解釈可能な代替手段であるプロスペクタヘッドを紹介する。
入力データにおけるクラス固有のパターンの解釈と発見を、プロファイラヘッドがいかに改善できるかを実証する。
論文 参考訳(メタデータ) (2024-02-18T23:01:28Z) - Evaluating the Fairness of the MIMIC-IV Dataset and a Baseline
Algorithm: Application to the ICU Length of Stay Prediction [65.268245109828]
本稿では、MIMIC-IVデータセットを用いて、滞在時間を予測するXGBoostバイナリ分類モデルにおける公平性とバイアスについて検討する。
この研究は、人口統計属性にわたるデータセットのクラス不均衡を明らかにし、データ前処理と特徴抽出を採用する。
この論文は、偏見を緩和するための公正な機械学習技術と、医療専門家とデータサイエンティストの協力的な努力の必要性について結論付けている。
論文 参考訳(メタデータ) (2023-12-31T16:01:48Z) - An Evaluation of Machine Learning Approaches for Early Diagnosis of
Autism Spectrum Disorder [0.0]
自閉症スペクトラム障害(Autistic Spectrum disorder、ASD)は、社会的相互作用、コミュニケーション、反復活動の困難を特徴とする神経疾患である。
本研究は,診断プロセスの強化と自動化を目的として,多様な機械学習手法を用いて重要なASD特性を同定する。
論文 参考訳(メタデータ) (2023-09-20T21:23:37Z) - SCARF: Self-Supervised Contrastive Learning using Random Feature
Corruption [72.35532598131176]
本稿では,特徴のランダムなサブセットを乱してビューを形成するコントラスト学習手法であるSCARFを提案する。
SCARFは既存の戦略を補完し、オートエンコーダのような代替手段より優れていることを示す。
論文 参考訳(メタデータ) (2021-06-29T08:08:33Z) - No Fear of Heterogeneity: Classifier Calibration for Federated Learning
with Non-IID Data [78.69828864672978]
実世界のフェデレーションシステムにおける分類モデルのトレーニングにおける中心的な課題は、非IIDデータによる学習である。
このアルゴリズムは, 近似されたssian混合モデルからサンプリングした仮想表現を用いて分類器を調整する。
実験の結果,CIFAR-10,CIFAR-100,CINIC-10など,一般的なフェデレーション学習ベンチマークにおけるCCVRの現状が示された。
論文 参考訳(メタデータ) (2021-06-09T12:02:29Z) - Cervical Cytology Classification Using PCA & GWO Enhanced Deep Features
Selection [1.990876596716716]
子宮頸癌は世界でも最も致命的かつ一般的な疾患の1つである。
ディープラーニングと特徴選択を利用した完全自動化フレームワークを提案する。
このフレームワークは3つの公開ベンチマークデータセットで評価されている。
論文 参考訳(メタデータ) (2021-06-09T08:57:22Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。