論文の概要: Clinical Term Extraction using Open-Source Small Language Models
- arxiv url: http://arxiv.org/abs/2606.21689v1
- Date: Fri, 19 Jun 2026 18:59:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-26 22:01:12.779852
- Title: Clinical Term Extraction using Open-Source Small Language Models
- Title(参考訳): オープンソース小言語モデルを用いた臨床用語抽出
- Authors: Noah Marchal, William E. Janes, Mihail Popescu, Xing Song,
- Abstract要約: 患者文書におけるALS関連臨床用語に対するオープンソースの小言語モデルの評価を行った。
集約,ラベルレベル,手動検証を用いた26のオープンソースモデルを比較した。
これらの知見は,既存のルールベースの手法を置き換えるのではなく,ハイブリッド抽出を対象とする。
- 参考スコア(独自算出の注目度): 2.5316486726943843
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Clinical information for amyotrophic lateral sclerosis (ALS) care documented in unstructured clinical notes limits downstream analysis without extraction into structured formats. Open-source small language models with few-shot prompting for detecting the presence of ALS-relevant clinical terms in patient documentation were evaluated without task-specific training data. The detection task targeted 17 categories spanning functional scores, respiratory measures, medications, and related clinical and non-clinical attributes. Clinical note content was normalized from JSON-encoded discharge summaries and processed with a prompt template having structured JSON outputs. We compared 26 open-source models using aggregate, label-level, and manual-validation multilabel classification metrics. Manual validation showed that a regex rule baseline had higher overall micro-F1 and lower Hamming loss than any single SLM or TF-IDF baseline, while Qwen3-4B-Instruct-2507 was the highest-performing SLM by micro-F1. Model rankings varied by metric and label category, with the TF-IDF baseline showing high recall but low precision, some SLMs showing higher precision but lower recall, and Hammer2.1-7b showing strong performance for ALSFRS-R subscore detection. These findings support targeted hybrid extraction workflows rather than replacement of existing rule-based methods.
- Abstract(参考訳): 筋萎縮性側索硬化症(ALS)診療における臨床情報は,非構造的臨床ノートに記録され,非構造的フォーマットへの抽出を伴わない下流分析に制限される。
患者文書におけるALS関連臨床用語の存在を検出するため, 課題特化訓練データを用いずにオープンソースの小言語モデルの評価を行った。
対象は, 機能スコア, 呼吸対策, 薬物, 関連臨床および非臨床属性を含む17項目であった。
臨床ノートの内容はJSONエンコードされた放電サマリーから正規化され,JSON出力が構造化されたプロンプトテンプレートで処理された。
集約,ラベルレベル,手動検証を用いた26のオープンソースモデルを比較した。
手動による検証の結果、レゲックス則のベースラインは1つのSLMまたはTF-IDFベースラインよりも全体的なマイクロF1とハミング損失が低く、Qwen3-4B-Instruct-2507はマイクロF1で最高の性能を示した。
TF-IDFベースラインは高いリコールだが低い精度を示すもの、より高精度だが低いリコールを示すもの、Hammer2.1-7bはALSFRS-Rサブスコア検出の性能を示す。
これらの知見は、既存のルールベースの手法を置き換えるのではなく、ハイブリッド抽出ワークフローをターゲットにしている。
関連論文リスト
- Beyond Scalar Scores: Exploring LLM-based Metrics for Clinical Significance Evaluation in Radiology Reports [49.5225801722164]
既存のメトリクスは、医学的に根拠のないスカラーにレポートの品質を低下させることによって、この要件を曖昧にしている。
テストベッドとしてReEvalMedベンチマークを用いて,この境界について検討し,計量レベルの臨床的意義を評価する。
論文 参考訳(メタデータ) (2026-06-17T08:10:30Z) - Systematic Evaluation of Large Language Models for Post-Discharge Clinical Action Extraction [0.0]
本稿では,CLIP分泌ノートデータセットを用いた安全クリティカルな臨床行動抽出のためのゼロショットおよび少数ショット大言語モデル (LLMs) について検討する。
そこで本稿では,物語形式で記述された2段階の退院記譜を,よりきめ細やかに動作可能な臨床タスクに分解する2段階の抽出フレームワークを提案する。
論文 参考訳(メタデータ) (2026-05-07T13:05:07Z) - Self-Prompting Small Language Models for Privacy-Sensitive Clinical Information Extraction [5.6073733544594395]
我々は,小言語モデルを自己生成し,検証し,洗練し,エンティティ固有のプロンプトを評価するためのフレームワークを開発した。
我々は,QLoRAに基づく教師付き微調整と直接選好最適化を用いて,マルチプロンプトアンサンブル推論と選択モデルを用いた候補オープンウェイトモデルの評価を行った。
これらの結果から,自動プロンプト最適化と軽量な嗜好ベースのポストトレーニングが,スケーラブルな臨床情報抽出を支援することが示唆された。
論文 参考訳(メタデータ) (2026-05-05T19:03:40Z) - CLiGNet: Clinical Label-Interaction Graph Network for Medical Specialty Classification from Clinical Transcriptions [0.0]
われわれはまず、この方法論上の欠陥を文書化し、40の専門分野にまたがるリークフリーベンチマーク(4966レコード)を確立する。
次に、Bio ClinicalBERTテキストエンコーダと2層グラフ畳み込みネットワークを組み合わせたニューラルネットワークであるCLiGNetを紹介します。
本報告では,一対の専門的混乱,希少なクラス行動,文書長効果,トークンレベルの統合的グラディエント属性を包括的に解析し,臨床NLPシステム展開に対する実用的な洞察を提供する。
論文 参考訳(メタデータ) (2026-03-24T03:30:06Z) - AgentScore: Autoformulation of Deployable Clinical Scoring Systems [45.88028371034407]
本稿では,単位重み付き臨床チェックリストのセマンティックガイドによる最適化を行うAgentScoreを紹介する。
AgentScoreは既存のスコア生成方法より優れており、より柔軟な解釈可能なモデルに匹敵するAUCを実現している。
さらに2つの外部検証タスクにおいて、AgentScoreは、確立されたガイドラインベースのスコアよりも高い差別を達成する。
論文 参考訳(メタデータ) (2026-01-29T21:11:06Z) - CNSight: Evaluation of Clinical Note Segmentation Tools [3.673249612734457]
また,MIMIC-IVから得られた1000音符のキュレートデータセットを用いて,ルールベースベースベースライン,ドメイン固有トランスフォーマーモデル,および臨床ノートセグメンテーションのための大規模言語モデルの評価を行った。
GPT-5-miniは文レベルと自由テキストセグメンテーションで平均72.4のF1に達する。
論文 参考訳(メタデータ) (2025-12-28T05:40:15Z) - Cross-Representation Benchmarking in Time-Series Electronic Health Records for Clinical Outcome Prediction [44.23284500920266]
このベンチマークは、2つの異なる臨床環境におけるデータキュレーションと評価を標準化する。
実験によると、イベントストリームモデルは、常に最強のパフォーマンスを提供する。
特徴選択戦略は臨床環境に適応する必要がある。
論文 参考訳(メタデータ) (2025-10-10T09:03:47Z) - Toward Reliable Clinical Coding with Language Models: Verification and Lightweight Adaptation [3.952186976672079]
本稿では,高速エンジニアリングや小型微調整を含む軽量な介入により,探索手法の計算オーバーヘッドを伴わずに精度を向上できることを示す。
階層的なニアミスエラーに対処するために,単体タスクとパイプラインコンポーネントの両方に臨床コード検証を導入する。
論文 参考訳(メタデータ) (2025-10-08T23:50:58Z) - Clinical NLP with Attention-Based Deep Learning for Multi-Disease Prediction [44.0876796031468]
本稿では,電子健康記録テキストの非構造的性質と高次元意味論的複雑さがもたらす課題について論じる。
情報抽出と多ラベル病予測のための統合モデリングを実現するために,注意機構に基づく深層学習手法を提案する。
論文 参考訳(メタデータ) (2025-07-02T07:45:22Z) - Few-Shot Cross-lingual Transfer for Coarse-grained De-identification of
Code-Mixed Clinical Texts [56.72488923420374]
事前学習型言語モデル (LM) は低リソース環境下での言語間移動に大きな可能性を示している。
脳卒中におけるコードミキシング(スペイン・カタラン)臨床ノートの低リソース・実世界の課題を解決するために,NER (name recognition) のためのLMの多言語間転写特性を示す。
論文 参考訳(メタデータ) (2022-04-10T21:46:52Z) - An Interpretable End-to-end Fine-tuning Approach for Long Clinical Text [72.62848911347466]
EHRにおける非構造化臨床テキストには、意思決定支援、トライアルマッチング、振り返り研究を含むアプリケーションにとって重要な情報が含まれている。
最近の研究は、これらのモデルが他のNLPドメインにおける最先端の性能を考慮し、BERTベースのモデルを臨床情報抽出およびテキスト分類に応用している。
本稿では,SnipBERTという新しい微調整手法を提案する。SnipBERTは全音符を使用する代わりに,重要なスニペットを識別し,階層的に切り刻まれたBERTベースのモデルに供給する。
論文 参考訳(メタデータ) (2020-11-12T17:14:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。