論文の概要: Unsupervised Feature Selection to Identify Important ICD-10 Codes for
Machine Learning: A Case Study on a Coronary Artery Disease Patient Cohort
- arxiv url: http://arxiv.org/abs/2303.14303v1
- Date: Sat, 25 Mar 2023 00:05:43 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-28 20:46:56.681446
- Title: Unsupervised Feature Selection to Identify Important ICD-10 Codes for
Machine Learning: A Case Study on a Coronary Artery Disease Patient Cohort
- Title(参考訳): 機械学習のための重要なICD-10コード同定のための教師なし特徴選択:冠状動脈疾患患者コホートを事例として
- Authors: Peyman Ghasemi and Joon Lee
- Abstract要約: カナダアルバータ州で発症した冠動脈疾患49,075例のICDコードデータベースの特徴選択法について検討した。
マルチクラスタデータに対するラプラシアンスコア, 教師なし特徴選択, 教師なし特徴選択, 主特徴分析, およびICD木量調整を伴わないコンクリートオートエンコーダを用いた。
その結果, コンクリートオートエンコーダ法は, 両タスクの他の手法よりも優れていた。
- 参考スコア(独自算出の注目度): 2.2060666847121864
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The use of International Classification of Diseases (ICD) codes in healthcare
presents a challenge in selecting relevant codes as features for machine
learning models due to this system's large number of codes. In this study, we
compared several unsupervised feature selection methods for an ICD code
database of 49,075 coronary artery disease patients in Alberta, Canada.
Specifically, we employed Laplacian Score, Unsupervised Feature Selection for
Multi-Cluster Data, Autoencoder Inspired Unsupervised Feature Selection,
Principal Feature Analysis, and Concrete Autoencoders with and without ICD tree
weight adjustment to select the 100 best features from over 9,000 codes. We
assessed the selected features based on their ability to reconstruct the
initial feature space and predict 90-day mortality following discharge. Our
findings revealed that the Concrete Autoencoder methods outperformed all other
methods in both tasks. Furthermore, the weight adjustment in the Concrete
Autoencoder method decreased the complexity of features.
- Abstract(参考訳): 医療における国際疾患分類(ICD)コードの使用は、このシステムの多数のコードのために、機械学習モデルの機能として関連するコードを選択することの難しさを示している。
本研究では,カナダアルバータ州で発症した冠動脈疾患49,075例のICDコードデータベースについて,教師なしの特徴選択法を比較した。
具体的には,マルチクラスタデータに対する教師なし特徴選択,オートエンコーダによる教師なし特徴選択,主特徴解析,icd木重み調整なしの具体的オートエンコーダを用いた。
初期特徴空間を再構築し,退院後90日間の死亡率を予測する能力に基づいて,選択した特徴を評価した。
その結果, コンクリートオートエンコーダ法は, 両タスクの他の手法よりも優れていた。
さらに, コンクリートオートエンコーダ法の重量調整により, 特性の複雑さが減少した。
関連論文リスト
- CoRelation: Boosting Automatic ICD Coding Through Contextualized Code
Relation Learning [56.782963838838036]
我々は,ICDコード表現の学習を促進するために,文脈的かつ柔軟なフレームワークである新しい手法を提案する。
提案手法では,可能なすべてのコード関係をモデル化する際の臨床ノートのコンテキストを考慮した,依存型学習パラダイムを採用している。
論文 参考訳(メタデータ) (2024-02-24T03:25:28Z) - Towards Semi-Structured Automatic ICD Coding via Tree-based Contrastive
Learning [18.380293890624102]
本稿では,臨床ノートの半構造化特性について検討し,それらをセクションに分割する自動アルゴリズムを提案する。
データ制限のある既存のICD符号化モデルにおける可変性問題に対処するため、セクションに対して対照的な事前学習アプローチを導入する。
論文 参考訳(メタデータ) (2023-10-14T22:07:13Z) - Automated clinical coding using off-the-shelf large language models [10.365958121087305]
診断用ICD符号を患者病院入院に割り当てる作業は、典型的には、熟練した人間のコーダーによって行われる。
自動ICD符号化への取り組みは、教師付きディープラーニングモデルによって支配されている。
本研究では,既製の事前学習型大規模言語モデルを活用し,実用的ソリューションを開発する。
論文 参考訳(メタデータ) (2023-10-10T11:56:48Z) - Automatic Coding at Scale: Design and Deployment of a Nationwide System
for Normalizing Referrals in the Chilean Public Healthcare System [0.0]
本稿では,チリの公共医療システムからの紹介で,疾患を自動的にコードする2段階のシステムを提案する。
具体的には,病名認識のための最新のNERモデルと,これらの疾患名に関連付けられた最も関連性の高いコードを割り当てるための検索エンジンシステムを用いている。
本システムでは,カテゴリレベルのMAPスコアが0.63,カテゴリレベルの0.83を得た。
論文 参考訳(メタデータ) (2023-07-09T16:19:35Z) - A Two-Stage Decoder for Efficient ICD Coding [10.634394331433322]
ICD符号の予測のための2段階復号機構を提案する。
まず、まず親コードを予測し、その子コードを前回の予測に基づいて予測する。
公開MIMIC-IIIデータセット実験により,本モデルが単一モデル設定で良好に動作することを示す。
論文 参考訳(メタデータ) (2023-05-27T17:25:13Z) - Exploring linguistic feature and model combination for speech
recognition based automatic AD detection [61.91708957996086]
音声ベースの自動ADスクリーニングシステムは、他の臨床スクリーニング技術に代わる非侵襲的でスケーラブルな代替手段を提供する。
専門的なデータの収集は、そのようなシステムを開発する際に、モデル選択と特徴学習の両方に不確実性をもたらす。
本稿では,BERT と Roberta の事前学習したテキストエンコーダのドメイン微調整の堅牢性向上のための特徴とモデルの組み合わせ手法について検討する。
論文 参考訳(メタデータ) (2022-06-28T05:09:01Z) - Active learning for medical code assignment [55.99831806138029]
臨床領域における多ラベルテキスト分類におけるアクティブラーニング(AL)の有効性を示す。
MIMIC-IIIデータセットにICD-9コードを自動的に割り当てるために、よく知られたALメソッドのセットを適用します。
その結果、有益なインスタンスの選択は、大幅に減少したトレーニングセットで満足のいく分類を提供する。
論文 参考訳(メタデータ) (2021-04-12T18:11:17Z) - TransICD: Transformer Based Code-wise Attention Model for Explainable
ICD Coding [5.273190477622007]
国際疾患分類法 (ICD) は, 医療分野の請求システムにおいて有効かつ重要であることが示されている。
現在、ICDコードは手動で臨床メモに割り当てられており、多くのエラーを引き起こす可能性がある。
本稿では,文書のトークン間の相互依存を捉えるためにトランスフォーマーベースのアーキテクチャを適用し,コードワイド・アテンション・メカニズムを用いて文書全体のコード固有表現を学習する。
論文 参考訳(メタデータ) (2021-03-28T05:34:32Z) - A Meta-embedding-based Ensemble Approach for ICD Coding Prediction [64.42386426730695]
国際疾病分類 (icd) は、世界中で臨床コーディングに使われているデファクトコードである。
これらのコードにより、医療提供者は償還を請求し、診断情報の効率的な保管と検索を容易にします。
提案手法は,日常的な医学データと科学論文の外部知識を用いて,効果的に単語ベクトルを訓練することにより,神経モデルの性能を高める。
論文 参考訳(メタデータ) (2021-02-26T17:49:58Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - Inheritance-guided Hierarchical Assignment for Clinical Automatic
Diagnosis [50.15205065710629]
臨床診断は、臨床ノートに基づいて患者に診断符号を割り当てることを目的としており、臨床意思決定において重要な役割を担っている。
本稿では,臨床自動診断のための継承誘導階層と共起グラフの伝播を組み合わせた新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-01-27T13:16:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。