論文の概要: ClinStructor: AI-Powered Structuring of Unstructured Clinical Texts
- arxiv url: http://arxiv.org/abs/2511.11883v1
- Date: Fri, 14 Nov 2025 21:21:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:23.358126
- Title: ClinStructor: AI-Powered Structuring of Unstructured Clinical Texts
- Title(参考訳): ClinStructor: 構造化されていない臨床テキストのAIによる構造化
- Authors: Karthikeyan K, Raghuveer Thirukovalluru, David Carlson,
- Abstract要約: 我々は,ClinStructorについて述べる。ClinStructorは大規模言語モデル(LLM)を利用して,臨床自由テキストを予測モデルに先立って構造化されたタスク固有の質問応答ペアに変換するパイプラインである。
本手法は透明性と制御性を大幅に向上させ,予測性能の低下を招く。
- 参考スコア(独自算出の注目度): 3.073796943975155
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Clinical notes contain valuable, context-rich information, but their unstructured format introduces several challenges, including unintended biases (e.g., gender or racial bias), and poor generalization across clinical settings (e.g., models trained on one EHR system may perform poorly on another due to format differences) and poor interpretability. To address these issues, we present ClinStructor, a pipeline that leverages large language models (LLMs) to convert clinical free-text into structured, task-specific question-answer pairs prior to predictive modeling. Our method substantially enhances transparency and controllability and only leads to a modest reduction in predictive performance (a 2-3% drop in AUC), compared to direct fine-tuning, on the ICU mortality prediction task. ClinStructor lays a strong foundation for building reliable, interpretable, and generalizable machine learning models in clinical environments.
- Abstract(参考訳): 臨床ノートには、価値があり、文脈に富んだ情報が含まれているが、その構造化されていないフォーマットには、意図しないバイアス(例えば、性別や人種の偏見)、臨床環境における一般化の低さ(例えば、あるEHRシステムでトレーニングされたモデルが、フォーマットの違いによって他のシステムで不十分に動作すること)、解釈可能性の低さなど、いくつかの課題が伴う。
これらの問題に対処するために,ClinStructorを提案する。ClinStructorは大規模言語モデル(LLM)を利用して,臨床自由テキストを予測モデルに先立って構造化されたタスク固有の質問応答ペアに変換するパイプラインである。
本手法は透過性と制御性を大幅に向上させ,ICU死亡予測タスクにおける直接微調整と比較して,予測性能の緩やかな低下(AUCの2~3%低下)を招く。
ClinStructorは、臨床環境で信頼性があり、解釈可能で、一般化可能な機械学習モデルを構築するための強力な基盤を築いている。
関連論文リスト
- Additive Large Language Models for Semi-Structured Text [3.073796943975155]
CALMは半構造化テキストの解釈可能なフレームワークである。
各コンポーネントのコントリビューションの加算和として結果を予測する。
従来の大規模言語モデルに匹敵するパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-11-14T23:06:16Z) - Interpretable Clinical Classification with Kolgomorov-Arnold Networks [70.72819760172744]
Kolmogorov-Arnold Networks (KAN) は、透明で象徴的な表現を通じて固有の解釈能力を提供する。
Kansは、組み込みの患者レベルの洞察、直感的な可視化、最寄りの患者の検索をサポートする。
これらの結果は、カンを、臨床医が理解し、監査し、行動できる信頼できるAIへの有望なステップと位置づけている。
論文 参考訳(メタデータ) (2025-09-20T17:21:58Z) - Adaptable Cardiovascular Disease Risk Prediction from Heterogeneous Data using Large Language Models [70.64969663547703]
AdaCVDは、英国バイオバンクから50万人以上の参加者を対象に、大規模な言語モデルに基づいて構築された適応可能なCVDリスク予測フレームワークである。
包括的かつ可変的な患者情報を柔軟に取り込み、構造化データと非構造化テキストの両方をシームレスに統合し、最小限の追加データを使用して新規患者の集団に迅速に適応する。
論文 参考訳(メタデータ) (2025-05-30T14:42:02Z) - Representation Learning of Structured Data for Medical Foundation Models [29.10129199884847]
我々はUniStructアーキテクチャを導入し、構造化されていないテキストと構造化データのマルチモーダル医療基盤モデルを設計する。
本手法は,広範囲な内部医療データベースと構造化医療記録の公開リポジトリのモデル事前学習を通じて検証される。
論文 参考訳(メタデータ) (2024-10-17T09:02:28Z) - Improving Mortality Prediction After Radiotherapy with Large Language Model Structuring of Large-Scale Unstructured Electronic Health Records [2.608410928225647]
本研究は、構造化された臨床データとともに、構造化されていない電子健康記録を構造化するためのRTSurvフレームワークを開発し、検証した。
34,276人の非構造化データと852の外部コホートを用いて、非構造化情報を構造化形式に変換することに成功した。
論文 参考訳(メタデータ) (2024-08-09T14:02:24Z) - Attribute Structuring Improves LLM-Based Evaluation of Clinical Text Summaries [56.31117605097345]
大規模言語モデル(LLM)は、正確な臨床テキスト要約を生成する可能性を示しているが、根拠付けと評価に関する問題に苦慮している。
本稿では、要約評価プロセスを構成するAttribute Structuring(AS)を用いた一般的な緩和フレームワークについて検討する。
ASは、臨床テキスト要約における人間のアノテーションと自動メトリクスの対応性を一貫して改善する。
論文 参考訳(メタデータ) (2024-03-01T21:59:03Z) - Self-Verification Improves Few-Shot Clinical Information Extraction [73.6905567014859]
大規模言語モデル (LLMs) は、数発のテキスト内学習を通じて臨床キュレーションを加速する可能性を示している。
正確性や解釈可能性に関する問題、特に健康のようなミッションクリティカルな領域ではまだ苦戦している。
本稿では,自己検証を用いた汎用的な緩和フレームワークについて検討する。このフレームワークはLLMを利用して,自己抽出のための証明を提供し,その出力をチェックする。
論文 参考訳(メタデータ) (2023-05-30T22:05:11Z) - A Multimodal Transformer: Fusing Clinical Notes with Structured EHR Data
for Interpretable In-Hospital Mortality Prediction [8.625186194860696]
臨床ノートと構造化HRデータを融合し,院内死亡率の予測に役立てる新しいマルチモーダルトランスフォーマーを提案する。
そこで本研究では,臨床ノートにおいて重要な単語を選択するための統合的勾配(IG)手法を提案する。
また,臨床 BERT における領域適応型事前訓練とタスク適応型微調整の重要性についても検討した。
論文 参考訳(メタデータ) (2022-08-09T03:49:52Z) - Self-supervised Answer Retrieval on Clinical Notes [68.87777592015402]
本稿では,ドメイン固有パスマッチングのためのトランスフォーマー言語モデルをトレーニングするためのルールベースのセルフスーパービジョンであるCAPRを紹介する。
目的をトランスフォーマーベースの4つのアーキテクチャ、コンテキスト文書ベクトル、ビ-、ポリエンコーダ、クロスエンコーダに適用する。
本稿では,ドメイン固有パスの検索において,CAPRが強いベースラインを上回り,ルールベースおよび人間ラベル付きパスを効果的に一般化することを示す。
論文 参考訳(メタデータ) (2021-08-02T10:42:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。