論文の概要: CLiGNet: Clinical Label-Interaction Graph Network for Medical Specialty Classification from Clinical Transcriptions
- arxiv url: http://arxiv.org/abs/2603.22752v1
- Date: Tue, 24 Mar 2026 03:30:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-25 19:53:37.275434
- Title: CLiGNet: Clinical Label-Interaction Graph Network for Medical Specialty Classification from Clinical Transcriptions
- Title(参考訳): CLiGNet:臨床記録からの専門性分類のための臨床ラベル-相互作用グラフネットワーク
- Authors: Pronob Kumar Barman, Pronoy Kumar Barman,
- Abstract要約: われわれはまず、この方法論上の欠陥を文書化し、40の専門分野にまたがるリークフリーベンチマーク(4966レコード)を確立する。
次に、Bio ClinicalBERTテキストエンコーダと2層グラフ畳み込みネットワークを組み合わせたニューラルネットワークであるCLiGNetを紹介します。
本報告では,一対の専門的混乱,希少なクラス行動,文書長効果,トークンレベルの統合的グラディエント属性を包括的に解析し,臨床NLPシステム展開に対する実用的な洞察を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Automated classification of clinical transcriptions into medical specialties is essential for routing, coding, and clinical decision support, yet prior work on the widely used MTSamples benchmark suffers from severe data leakage caused by applying SMOTE oversampling before train test splitting. We first document this methodological flaw and establish a leakage free benchmark across 40 medical specialties (4966 records), revealing that the true task difficulty is substantially higher than previously reported. We then introduce CLiGNet (Clinical Label Interaction Graph Network), a neural architecture that combines a Bio ClinicalBERT text encoder with a two layer Graph Convolutional Network operating on a specialty label graph constructed from semantic similarity and ICD 10 chapter priors. Per label attention gates fuse document and label graph representations, trained with focal binary cross entropy loss to handle extreme class imbalance (181 to 1 ratio). Across seven baselines ranging from TF IDF classifiers to Clinical Longformer, CLiGNet without calibration achieves the highest macro F1 of 0.279, with an ablation study confirming that the GCN label graph provides the single largest component gain (increase of 0.066 macro F1). Adding per label Platt scaling calibration yields an expected calibration error of 0.007, demonstrating a principled trade off between ranking performance and probability reliability. We provide comprehensive failure analysis covering pairwise specialty confusions, rare class behaviour, document length effects, and token level Integrated Gradients attribution, offering actionable insights for clinical NLP system deployment.
- Abstract(参考訳): 臨床転写を医療専門分野に自動分類することは、ルーティング、コーディング、臨床決定支援に不可欠であるが、広く使われているMTSamplesベンチマークの以前の研究は、テスト分割前にSMOTEオーバーサンプリングを施すことによって引き起こされる深刻なデータ漏洩に悩まされている。
われわれはまず,この方法論上の欠陥を文書化し,40の専門分野(4966レコード)にわたるリークフリーベンチマークを確立する。
次に、CLiGNet(Clinical Label Interaction Graph Network)を導入し、Bio ClinicalBERTテキストエンコーダと2層グラフ畳み込みネットワークを組み合わせたニューラルネットワークを、セマンティックな類似性とICD 10章の先行から構築した専門ラベルグラフ上で運用する。
ラベルアテンションゲートは文書とラベルグラフ表現を融合させ、極度のクラス不均衡(181対1の比率)を扱うために焦点二分対クロスエントロピー損失を訓練する。
TF IDF分類器からクリニカルロングフォーマーまでの7つの基準線で、キャリブレーションのないCLiGNetは最高マクロF1の0.279を達成し、GCNラベルグラフは最大成分ゲイン(0.066マクロF1の増加)を提供することを確認した。
ラベルごとのPlattスケーリングキャリブレーションを追加すると、期待するキャリブレーション誤差は0.007となり、ランキング性能と確率信頼性のトレードオフを示す。
本報告では,一対の専門的混乱,希少なクラス行動,文書長効果,トークンレベルの統合的グラディエント属性を包括的に解析し,臨床NLPシステム展開に対する実用的な洞察を提供する。
関連論文リスト
- A Detection-Gated Pipeline for Robust Glottal Area Waveform Extraction and Clinical Pathology Assessment [0.0]
本稿では,ローカライザとセグメンタを統合した検出ゲートパイプラインを提案する。
パイプラインはGIRAFEとBAGLSベンチマークで最先端の一貫性を達成した。
論文 参考訳(メタデータ) (2026-03-02T17:05:41Z) - MIRNet: Integrating Constrained Graph-Based Reasoning with Pre-training for Diagnostic Medical Imaging [67.74482877175797]
MIRNetは、自己教師付き事前学習と制約付きグラフベースの推論を統合する新しいフレームワークである。
TongueAtlas-4Kは,22の診断ラベルを付した4,000枚の画像からなるベンチマークである。
論文 参考訳(メタデータ) (2025-11-13T06:30:41Z) - Clinically-Inspired Hierarchical Multi-Label Classification of Chest X-rays with a Penalty-Based Loss Function [1.264536505250038]
本稿では,臨床診断性を高めるマルチラベル胸部X線(CXR)画像分類法を提案する。
臨床的に有意な診断関係を捉えるため,階層的なラベル分類を取り入れた。
実験では,受信機動作特性曲線(AUROC)の0.903の平均値を得た。
論文 参考訳(メタデータ) (2025-02-05T20:15:06Z) - Diagnosis extraction from unstructured Dutch echocardiogram reports using span- and document-level characteristic classification [0.0]
本研究は,非構造オランダ心エコー図による自動スパンレベル診断と文書レベル診断の有用性について検討した。
本研究では,重み付きおよびマクロF1スコア,精度,性能評価のためのリコールを用いて,スパンレベルと文書レベルの両方で自動ラベリング手法を開発し,試験した。
SpanCategorizerとMedRoBERTa$.$nlモデルは、他のすべてのスパンと文書分類器よりも優れていた。
論文 参考訳(メタデータ) (2024-08-13T14:33:32Z) - Graph-Ensemble Learning Model for Multi-label Skin Lesion Classification
using Dermoscopy and Clinical Images [7.159532626507458]
本研究では,グラフ畳み込みネットワーク(GCN)を導入し,相関行列として各カテゴリ間の先行的共起を多ラベル分類のためのディープラーニングモデルに活用する。
本稿では,GCNからの予測を融合モデルからの予測の補完情報とみなすグラフ・アンサンブル学習モデルを提案する。
論文 参考訳(メタデータ) (2023-07-04T13:19:57Z) - LESS: Label-efficient Multi-scale Learning for Cytological Whole Slide
Image Screening [19.803614403803962]
スライドレベルラベルのみを用いた細胞学的WSI解析において,LESSと呼ばれる弱教師付きラベル効率WSIスクリーニング法を提案する。
スライドレベルのラベルを用いて適切な監視を行い、パッチレベルの特徴の学習を改善する。
病理組織WSIにおける最新のMIL法よりも優れており、細胞学的WSI検診の自動化を実現している。
論文 参考訳(メタデータ) (2023-06-06T05:09:20Z) - Learning to diagnose cirrhosis from radiological and histological labels
with joint self and weakly-supervised pretraining strategies [62.840338941861134]
そこで本稿では, 放射線学者が注釈付けした大規模データセットからの転写学習を活用して, 小さい付加データセットで利用できる組織学的スコアを予測することを提案する。
我々は,肝硬変の予測を改善するために,異なる事前訓練法,すなわち弱い指導法と自己指導法を比較した。
この方法は、METAVIRスコアのベースライン分類を上回り、AUCが0.84、バランスの取れた精度が0.75に達する。
論文 参考訳(メタデータ) (2023-02-16T17:06:23Z) - Cross-modal Clinical Graph Transformer for Ophthalmic Report Generation [116.87918100031153]
眼科報告生成(ORG)のためのクロスモーダルな臨床グラフ変換器(CGT)を提案する。
CGTは、デコード手順を駆動する事前知識として、臨床関係を視覚特徴に注入する。
大規模FFA-IRベンチマークの実験は、提案したCGTが従来のベンチマーク手法より優れていることを示した。
論文 参考訳(メタデータ) (2022-06-04T13:16:30Z) - Collaborative Boundary-aware Context Encoding Networks for Error Map
Prediction [65.44752447868626]
本稿では,AEP-Net と呼ばれる協調的コンテキスト符号化ネットワークを提案する。
具体的には、画像とマスクのより優れた特徴融合のための協調的な特徴変換分岐と、エラー領域の正確な局所化を提案する。
AEP-Netはエラー予測タスクの平均DSCが0.8358,0.8164であり、ピアソン相関係数が0.9873である。
論文 参考訳(メタデータ) (2020-06-25T12:42:01Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z) - ECG-DelNet: Delineation of Ambulatory Electrocardiograms with Mixed
Quality Labeling Using Neural Networks [69.25956542388653]
ディープラーニング(DL)アルゴリズムは、学術的、産業的にも重くなっている。
セグメンテーションフレームワークにECGの検出とデライン化を組み込むことにより、低解釈タスクにDLをうまく適用できることを実証する。
このモデルは、PhyloNetのQTデータベースを使用して、105個の増幅ECG記録から訓練された。
論文 参考訳(メタデータ) (2020-05-11T16:29:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。