論文の概要: Towards Multidisciplinary Summarization of Hospital Stays: Efficient Sentence-Level Clinical Provenance Categorization
- arxiv url: http://arxiv.org/abs/2606.02487v1
- Date: Mon, 01 Jun 2026 16:57:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:32.518353
- Title: Towards Multidisciplinary Summarization of Hospital Stays: Efficient Sentence-Level Clinical Provenance Categorization
- Title(参考訳): 病院滞在者の複数学際的要約に向けて : 効果的な文素レベルクリニカル・プロヴァンス・カテゴリー化
- Authors: Baris Karacan, Vaibhav Bhargava, Barbara Di Eugenio, Natalie Parde, Mary Khetani, Yu-Shan Tseng, Vanessa Barbosa, Julie Vignato, Lindsey Knake, Rajashree Dahal, Emily Spellman, Danielle Hitzel, Janine Petitgout, Kristi Haughey, Amanda Karstens, Brianna Clarahan, Rachel Dawson, Lauren Boyd, Mackenzie Weis, Angie Tipton, Jaewon Bae, Catherine K. Craven, Karen Dunn Lopez, Andrew D. Boyd,
- Abstract要約: 本研究では,大規模言語モデル (LLM) の教師付き微調整 (SFT) を用いた臨床経験分類パイプラインを提案する。
2つのLlama-3モデルを2,002MIMIC-III(Adult ICU)コーパスであるMedSecIdに適応した。
モデル容量 (8B vs. 70B) と227文レベルのゴールド標準データセットを用いた定量化を行った。
- 参考スコア(独自算出の注目度): 10.976481873409531
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Effective "all-team" summarization in high-complexity settings like the Neonatal Intensive Care Unit (NICU) requires aggregating insights from diverse disciplines (physicians, nurses, therapists) spread across hundreds of clinical free-text notes. Simply pooling heterogeneous text often leads to incoherent outputs. Structured summarization therefore first requires accurate categorization of sentence-level provenance across multi-source notes. This pilot study introduces a clinical provenance categorization pipeline using supervised fine-tuning (SFT) of large language models (LLMs). We adapted two Llama-3 models (8B and 70B) to MedSecId, a corpus of 2,002 MIMIC-III (Adult ICU) notes annotated with clinical provenance headers, achieving in-domain Macro F1 scores above 92% for both models. To evaluate cross-domain generalization, we assessed model capacity (8B vs. 70B) and quantization on a gold-standard dataset of 227 sentence-level spans derived from three multi-disciplinary NICU summaries. Experimental results demonstrate a scale-dependent transfer effect: while SFT produced only marginal changes for the 8B model, it substantially improved the 70B model, increasing Macro F1 by 7%. Notably, the quantized fine-tuned 70B model outperformed its full-precision baseline while substantially reducing computational requirements. These findings suggest that sufficient model capacity is critical for preserving semantic flexibility during cross-domain clinical transfer and that efficient quantized adaptation can enable structured provenance modeling for downstream summarization.
- Abstract(参考訳): 新生児集中治療ユニット(NICU)のような複雑度の高い環境での効果的な「全チーム」要約は、何百もの臨床自由テキストノートに広がる様々な分野(医師、看護師、セラピスト)からの洞察を集約する必要がある。
単純な不均一なテキストのプールは、しばしば不整合出力につながる。
したがって、構造化要約は、まず、複数ソースノート間での文レベルの証明の正確な分類を必要とする。
本研究では,大規模言語モデル (LLM) の教師付き微調整 (SFT) を用いた臨床経過分類パイプラインを提案する。
2つのLlama-3モデル (8B, 70B) を2,002MIMIC-III (Adult ICU) のコーパスであるMedSecIdに適応させ, 両モデルともにマクロF1スコアが92%以上であった。
クロスドメインの一般化を評価するため,3つの学際的NICU要約から得られた227文レベルのゴールド標準データセット上で,モデル容量(8B vs. 70B)と量子化を評価した。
SFTは8Bモデルに対して限界変化しか生じなかったが、70Bモデルを大幅に改善し、マクロF1を7%増加させた。
特に、量子化された微調整70Bモデルは、計算要求を大幅に減らしながら、その完全精度ベースラインを上回った。
これらの結果から, ドメイン間転写におけるセマンティック・フレキシビリティの維持には十分なモデルキャパシティが不可欠であることが示唆された。
関連論文リスト
- UniField: A Unified Field-Aware MRI Enhancement Framework [45.03230466428695]
methodnameは、複数のモダリティと拡張タスクを統合する統合フレームワークである。
我々は、事前学習した3D基礎モデルを利用して、総合的な3Dボリューム情報を利用する。
我々は,総合的なマルチフィールドMRIデータセットを編成し,公開する。
論文 参考訳(メタデータ) (2026-03-10T05:45:12Z) - A Federated and Parameter-Efficient Framework for Large Language Model Training in Medicine [59.78991974851707]
大規模言語モデル(LLM)は、質問応答や診断など、医療ベンチマークにおいて強力なパフォーマンスを示している。
ほとんどの医療用LDMは、異種システムの一般化性と安全性の制限に直面している単一の機関のデータに基づいて訓練されている。
本稿では, LLMを医療応用に適用するためのモデルに依存しない, パラメータ効率のよいフェデレーション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-29T18:48:21Z) - Transparent Early ICU Mortality Prediction with Clinical Transformer and Per-Case Modality Attribution [42.85462513661566]
ICU滞在後48時間から, 生理的時系列測定と非構造的臨床記録とを融合した, 軽量で透明なマルチモーダルアンサンブルを提案する。
ロジスティック回帰モデルは、バイタル用双方向LSTMとノート用微調整された臨床ModernBERT変換器の2つのモード固有モデルからの予測を組み合わせる。
MIMIC-IIIベンチマークでは、遅延融合アンサンブルは、よく校正された予測を維持しながら、最高の単一モデルに対する差別を改善する。
論文 参考訳(メタデータ) (2025-11-19T20:11:49Z) - MedSeqFT: Sequential Fine-tuning Foundation Models for 3D Medical Image Segmentation [55.37355146924576]
MedSeqFTは、医用画像解析のためのシーケンシャルな微調整フレームワークである。
事前訓練されたモデルを新しいタスクに適応させ、表現能力を改善する。
最先端の微調整戦略を一貫して上回ります。
論文 参考訳(メタデータ) (2025-09-07T15:22:53Z) - Prismatic Synthesis: Gradient-based Data Diversification Boosts Generalization in LLM Reasoning [77.120955854093]
我々は,データ多様性が言語モデルにおける一般化の強力な予測因子であることを示す。
モデル誘起勾配のエントロピーを通して多様性を定量化する計量であるG-Vendiを導入する。
多様な合成データを生成するためのフレームワークであるPrismatic Synthesisを提案する。
論文 参考訳(メタデータ) (2025-05-26T16:05:10Z) - Integrating Large Language Models into a Tri-Modal Architecture for Automated Depression Classification on the DAIC-WOZ [0.0]
メジャー・うつ病(Major Depressive Disorder、MDD)は、世界中の3億人に影響を及ぼす広汎な精神疾患である。
本研究は, 臨床面接記録からのうつ病のバイナリ分類のための, BiLSTM に基づくトリモーダルモデルレベルの融合アーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-07-27T21:00:36Z) - SemioLLM: Evaluating Large Language Models for Diagnostic Reasoning from Unstructured Clinical Narratives in Epilepsy [45.2233252981348]
臨床知識を符号化するための言語モデル(LLM)が示されている。
6つの最先端モデルをベンチマークする評価フレームワークであるSemioLLMを提案する。
ほとんどのLSMは、脳内の発作発生領域の確率的予測を正確かつ確実に生成できることを示す。
論文 参考訳(メタデータ) (2024-07-03T11:02:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。