論文の概要: Automated SNOMED CT Concept Annotation in Clinical Text Using Bi-GRU Neural Networks
- arxiv url: http://arxiv.org/abs/2508.02556v1
- Date: Mon, 04 Aug 2025 16:08:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 18:25:22.421059
- Title: Automated SNOMED CT Concept Annotation in Clinical Text Using Bi-GRU Neural Networks
- Title(参考訳): Bi-GRUニューラルネットを用いた臨床テキストにおけるSNOMEDCT概念アノテーションの自動作成
- Authors: Ali Noori, Pratik Devkota, Somya Mohanty, Prashanti Manda,
- Abstract要約: 本研究では,双方向GRUモデルを用いたSNOMEDCT概念認識のためのニューラルネットワークラベリング手法を提案する。
ドメイン適応型SpaCyおよびSciBERTベースのトークン化を用いてテキストを前処理し,テキストを文脈,構文,形態に富んだ重なり合う19個のチャンクに分割する。
Bi-GRUモデルは、IOBタグを指定してコンセプトスパンを特定し、検証セット上で90%のF1スコアで強力なパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 0.31457219084519
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automated annotation of clinical text with standardized medical concepts is critical for enabling structured data extraction and decision support. SNOMED CT provides a rich ontology for labeling clinical entities, but manual annotation is labor-intensive and impractical at scale. This study introduces a neural sequence labeling approach for SNOMED CT concept recognition using a Bidirectional GRU model. Leveraging a subset of MIMIC-IV, we preprocess text with domain-adapted SpaCy and SciBERT-based tokenization, segmenting sentences into overlapping 19-token chunks enriched with contextual, syntactic, and morphological features. The Bi-GRU model assigns IOB tags to identify concept spans and achieves strong performance with a 90 percent F1-score on the validation set. These results surpass traditional rule-based systems and match or exceed existing neural models. Qualitative analysis shows effective handling of ambiguous terms and misspellings. Our findings highlight that lightweight RNN-based architectures can deliver high-quality clinical concept annotation with significantly lower computational cost than transformer-based models, making them well-suited for real-world deployment.
- Abstract(参考訳): 医療概念を標準化した臨床テキストの自動アノテーションは,構造化データ抽出と意思決定支援の実現に不可欠である。
SNOMED CTは、臨床エンティティをラベル付けするための豊富なオントロジーを提供するが、手動のアノテーションは労働集約的で、大規模では実用的ではない。
本研究では,双方向GRUモデルを用いたSNOMEDCT概念認識のためのニューラルネットワークラベリング手法を提案する。
MIMIC-IVのサブセットを活用することで、ドメイン適応型SpaCyおよびSciBERTベースのトークン化によるテキストの事前処理を行い、文をコンテキスト、構文、形態的特徴に富んだ19個のチャンクに分割する。
Bi-GRUモデルは、IOBタグを指定してコンセプトスパンを特定し、検証セット上で90%のF1スコアで強力なパフォーマンスを達成する。
これらの結果は、従来のルールベースのシステムを超え、既存のニューラルモデルと一致するか、あるいは超える。
定性的分析は曖昧な言葉と誤用を効果的に扱うことを示す。
この結果から,軽量なRNNベースのアーキテクチャはトランスフォーマーベースモデルよりも計算コストが大幅に低く,高品質な臨床概念アノテーションを提供することが可能であることが示唆された。
関連論文リスト
- Hybrid Interpretable Deep Learning Framework for Skin Cancer Diagnosis: Integrating Radial Basis Function Networks with Explainable AI [1.1049608786515839]
皮膚がんは世界中で最も流行し、致命的な疾患の1つである。
本稿では,畳み込みニューラルネットワーク(CNN)とラジアル基底関数(RBF)ネットワークを統合するハイブリッドディープラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-24T19:19:02Z) - SNOBERT: A Benchmark for clinical notes entity linking in the SNOMED CT clinical terminology [43.89160296332471]
本稿では,BERT モデルを用いた SNOMED CT のテキストスパンと特定の概念をリンクする手法を提案する。
本手法は, 候補選択と候補マッチングの2段階からなる。これらのモデルは, ラベル付き臨床ノートの公開データセットの中で, 最大規模で訓練された。
論文 参考訳(メタデータ) (2024-05-25T08:00:44Z) - ClinLinker: Medical Entity Linking of Clinical Concept Mentions in Spanish [39.81302995670643]
本研究は、医療エンティティリンクのための2相パイプラインを用いた新しいアプローチであるClinLinkerを提示する。
SapBERTベースのバイエンコーダに基づいており、その後クロスエンコーダで再ランクされ、スペインの医療概念に合わせた対照的な学習戦略に従って訓練されている。
論文 参考訳(メタデータ) (2024-04-09T15:04:27Z) - Cross-modal Clinical Graph Transformer for Ophthalmic Report Generation [116.87918100031153]
眼科報告生成(ORG)のためのクロスモーダルな臨床グラフ変換器(CGT)を提案する。
CGTは、デコード手順を駆動する事前知識として、臨床関係を視覚特徴に注入する。
大規模FFA-IRベンチマークの実験は、提案したCGTが従来のベンチマーク手法より優れていることを示した。
論文 参考訳(メタデータ) (2022-06-04T13:16:30Z) - InDuDoNet+: A Model-Driven Interpretable Dual Domain Network for Metal
Artifact Reduction in CT Images [53.4351366246531]
InDuDoNet+と呼ばれる新しい解釈可能な二重ドメインネットワークを構築し、CT画像の微細な埋め込みを行う。
異なる組織間のCT値を分析し,InDuDoNet+の事前観測ネットワークにマージすることで,その一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2021-12-23T15:52:37Z) - Fine-tuning Pretrained Language Models with Label Attention for
Explainable Biomedical Text Classification [1.066048003460524]
PTMの微調整プロセスに意味ラベル記述を注入するための改良されたラベルアテンションに基づくアーキテクチャを開発した。
2つの公開医療データセットの結果、提案手法は従来の微調整PTMと先行技術モデルよりも優れていた。
論文 参考訳(メタデータ) (2021-08-26T14:23:06Z) - A Meta-embedding-based Ensemble Approach for ICD Coding Prediction [64.42386426730695]
国際疾病分類 (icd) は、世界中で臨床コーディングに使われているデファクトコードである。
これらのコードにより、医療提供者は償還を請求し、診断情報の効率的な保管と検索を容易にします。
提案手法は,日常的な医学データと科学論文の外部知識を用いて,効果的に単語ベクトルを訓練することにより,神経モデルの性能を高める。
論文 参考訳(メタデータ) (2021-02-26T17:49:58Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - Drug and Disease Interpretation Learning with Biomedical Entity
Representation Transformer [9.152161078854146]
自由形式のテキストにおける概念正規化は、あらゆるテキストマイニングパイプラインにおいて重要なステップです。
微調整BERTアーキテクチャに基づくシンプルで効果的な2段階のニューラルアプローチを提案する。
論文 参考訳(メタデータ) (2021-01-22T20:01:25Z) - An Interpretable End-to-end Fine-tuning Approach for Long Clinical Text [72.62848911347466]
EHRにおける非構造化臨床テキストには、意思決定支援、トライアルマッチング、振り返り研究を含むアプリケーションにとって重要な情報が含まれている。
最近の研究は、これらのモデルが他のNLPドメインにおける最先端の性能を考慮し、BERTベースのモデルを臨床情報抽出およびテキスト分類に応用している。
本稿では,SnipBERTという新しい微調整手法を提案する。SnipBERTは全音符を使用する代わりに,重要なスニペットを識別し,階層的に切り刻まれたBERTベースのモデルに供給する。
論文 参考訳(メタデータ) (2020-11-12T17:14:32Z) - UmlsBERT: Clinical Domain Knowledge Augmentation of Contextual
Embeddings Using the Unified Medical Language System Metathesaurus [73.86656026386038]
事前学習プロセス中にドメイン知識を統合するコンテキスト埋め込みモデルであるUmlsBERTを紹介する。
これらの2つの戦略を適用することで、UmlsBERTは、臨床領域の知識を単語埋め込みにエンコードし、既存のドメイン固有モデルより優れている。
論文 参考訳(メタデータ) (2020-10-20T15:56:31Z) - Multi-domain Clinical Natural Language Processing with MedCAT: the
Medical Concept Annotation Toolkit [5.49956798378633]
オープンソースMedical Concept EHR Toolkit(MedMedCAT)について紹介する。
UMLS/SNOMED-CTを含む任意の概念語彙を用いて概念を抽出するための、新しい自己教師型機械学習アルゴリズムを提供する。
オープンデータセットからUMLS概念を抽出する際の性能改善を示す。
SNOMED-CTの実際の検証は、ロンドンの3大病院で、17万件の臨床記録から8.8Bワード以上の自己監督訓練が実施されている。
論文 参考訳(メタデータ) (2020-10-02T19:01:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。