論文の概要: Deep reflective reasoning in interdependence constrained structured data extraction from clinical notes for digital health
- arxiv url: http://arxiv.org/abs/2603.20435v1
- Date: Fri, 20 Mar 2026 19:05:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:38.910056
- Title: Deep reflective reasoning in interdependence constrained structured data extraction from clinical notes for digital health
- Title(参考訳): デジタル健康のための臨床ノートからの相互依存制約構造データ抽出における深部反射的推論
- Authors: Jingwei Huang, Kuroush Nezafati, Zhikai Chi, Ruichen Rong, Colin Treager, Tingyi Wanyan, Yueshuang Xu, Xiaowei Zhan, Patrick Leavey, Guanghua Xiao, Wenqi Shi, Yang Xie,
- Abstract要約: 既存のLarge Language Model (LLM)ベースの抽出パイプラインは、しばしば相互依存変数をキャプチャするのに苦労する。
本稿では,構造化された出力を反復的に自己批判し,修正する大規模言語モデルエージェントフレームワークであるディープリフレクティブ推論を提案する。
提案手法を3つの多様な腫瘍学応用において広範囲に評価した。
- 参考スコア(独自算出の注目度): 5.825527193340698
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Extracting structured information from clinical notes requires navigating a dense web of interdependent variables where the value of one attribute logically constrains others. Existing Large Language Model (LLM)-based extraction pipelines often struggle to capture these dependencies, leading to clinically inconsistent outputs. We propose deep reflective reasoning, a large language model agent framework that iteratively self-critiques and revises structured outputs by checking consistency among variables, the input text, and retrieved domain knowledge, stopping when outputs converge. We extensively evaluate the proposed method in three diverse oncology applications: (1) On colorectal cancer synoptic reporting from gross descriptions (n=217), reflective reasoning improved average F1 across eight categorical synoptic variables from 0.828 to 0.911 and increased mean correct rate across four numeric variables from 0.806 to 0.895; (2) On Ewing sarcoma CD99 immunostaining pattern identification (n=200), the accuracy improved from 0.870 to 0.927; (3) On lung cancer tumor staging (n=100), tumor stage accuracy improved from 0.680 to 0.833 (pT: 0.842 -> 0.884; pN: 0.885 -> 0.948). The results demonstrate that deep reflective reasoning can systematically improve the reliability of LLM-based structured data extraction under interdependence constraints, enabling more consistent machine-operable clinical datasets and facilitating knowledge discovery with machine learning and data science towards digital health.
- Abstract(参考訳): 臨床ノートから構造化情報を抽出するには、ある属性の値が他の属性を論理的に制約する、相互依存変数の密集した網をナビゲートする必要がある。
既存のLarge Language Model (LLM)ベースの抽出パイプラインは、これらの依存関係を捕捉するのにしばしば苦労し、臨床的に矛盾する出力をもたらす。
本稿では,変数間の整合性,入力テキスト,ドメイン知識の検索,出力の収束の停止などによって構造的出力を反復的に自己批判し,修正する,大規模言語モデルエージェントフレームワークであるDeep Reflective reasoningを提案する。
本手法は3つの腫瘍学的応用において広く評価されている:(1) 大腸癌シンプトグラフィー(n=217)、(n=217)、(pT: 0.842 -> 84;pN: 0.842 -> 84;pN: 0.885 -> 0.948)、(n=200)、(0.680 - 0.833)、(n=100)、(pT: 0.842 -> 84;pN: 0.8-> 0.948)、(0.680 - 0.848)、(pT: 0.842 -> 84;pN: 0.8-> 0.948)。
その結果、深い反射的推論は、相互依存制約下でのLLMに基づく構造化データ抽出の信頼性を体系的に向上し、より一貫したマシン操作可能な臨床データセットを可能にし、機械学習とデータサイエンスによる知識発見をデジタルヘルスに向けて促進することを示した。
関連論文リスト
- Agentic retrieval-augmented reasoning reshapes collective reliability under model variability in radiology question answering [1.295312759062166]
エージェント検索強化推論パイプラインは、より大きな言語モデルが臨床決定支援に外部証拠を組み込むかを構築するために、ますます使用されている。
これらのシステムは、計算済みのドメイン知識を反復的に検索し、回答の選択の前に構造化されたレポートに合成する。
このようなパイプラインはパフォーマンスを向上させることができるが、モデルの可変性の下での信頼性への影響は、まだ不明である。
論文 参考訳(メタデータ) (2026-03-06T13:31:54Z) - TwinWeaver: An LLM-Based Foundation Model Framework for Pan-Cancer Digital Twins [33.30007167473537]
Genie Digital Twin (GDT) は, がんのタイプ別に93,054人を対象に構築されている。
GDTは予測誤差を著しく低減し、平均絶対誤差(MASE)は0.87である。
GDTは、アウト・オブ・ディストリビューション・マッチング臨床試験に一般化し、ゼロショットでベースラインを訓練し、微調整でそれらを上回った。
論文 参考訳(メタデータ) (2026-01-28T15:40:54Z) - Robust Multicentre Detection and Classification of Colorectal Liver Metastases on CT: Application of Foundation Models [11.274035647041762]
我々は,CT上のCRLMの患者レベル分類と病変レベル検出のための基礎モデルに基づくAIパイプラインを開発した。
UMedPTは最高の成績を示し,分類用頭部と病変検出用FCOSベースの頭部を微調整した。
論文 参考訳(メタデータ) (2026-01-12T14:35:29Z) - CONFIDE: Hallucination Assessment for Reliable Biomolecular Structure Prediction and Design [46.12506067241116]
本稿では,位相的フラストレーションを定量化する自己評価尺度であるCODE(Chain of Diffusion Embeddings)を提案する。
エネルギー的およびトポロジ的視点を組み合わせた統合評価フレームワークであるCONFIDEを提案する。
データ駆動の埋め込みと理論的な洞察を組み合わせることで、CODEとConFIDEは、幅広い生体分子システムで既存の指標より優れています。
論文 参考訳(メタデータ) (2025-11-20T03:38:46Z) - Transparent Early ICU Mortality Prediction with Clinical Transformer and Per-Case Modality Attribution [42.85462513661566]
ICU滞在後48時間から, 生理的時系列測定と非構造的臨床記録とを融合した, 軽量で透明なマルチモーダルアンサンブルを提案する。
ロジスティック回帰モデルは、バイタル用双方向LSTMとノート用微調整された臨床ModernBERT変換器の2つのモード固有モデルからの予測を組み合わせる。
MIMIC-IIIベンチマークでは、遅延融合アンサンブルは、よく校正された予測を維持しながら、最高の単一モデルに対する差別を改善する。
論文 参考訳(メタデータ) (2025-11-19T20:11:49Z) - Glaucoma Detection and Structured OCT Report Generation via a Fine-tuned Multimodal Large Language Model [1.0925680160683622]
このモデルは,品質評価,緑内障検出,RAF薄型分類の3つの課題に対して,ホールドアウトテストセットで評価した。
このモデルは、画像品質の問題を特定し、緑内障を検出する上で高い精度を実現した。
論文 参考訳(メタデータ) (2025-10-01T22:37:28Z) - Translating Machine Learning Interpretability into Clinical Insights for ICU Mortality Prediction [0.18416014644193068]
我々は2つの機械学習モデルと解釈機構を開発し、厳格に評価した。
有意な欠失(130,810人,5.58% ICU死亡)と欠失(5,661人,23.65% ICU死亡)の2つのデータセットを検討した。
ランダムフォレスト(RF)モデルは、第1のデータセットで0.912のAUROC、第2のデータセットで0.839のAUROC、第1のデータセットで0.924のAUROC、第2のデータセットで0.834のAUROCを示した。
論文 参考訳(メタデータ) (2025-07-30T02:19:06Z) - PathBench: A comprehensive comparison benchmark for pathology foundation models towards precision oncology [33.51485504161335]
病理基盤モデル(PFM)の最初の包括的なベンチマークであるPathBenchを紹介する。
我々のフレームワークは大規模データを組み込んで,PFMの客観的比較を可能にする。
当院では10病院で8,549人の患者から15,888件のWSIを収集し,64件以上の診断・予後調査を行った。
論文 参考訳(メタデータ) (2025-05-26T16:42:22Z) - QuaLLM-Health: An Adaptation of an LLM-Based Framework for Quantitative Data Extraction from Online Health Discussions [30.089810404792]
本報告では,QuaLLMからQuaLLM-Healthに適応したフレームワークを用いて,非構造化テキストから臨床的に関連のある定量的データを抽出する。
2024年7月にReddit APIを使って5つのGLP-1関連コミュニティから410万の投稿とコメントを収集しました。
フレームワークを完全なデータセットに適用することで、下流分析に必要な変数の効率的な抽出が可能になった。
論文 参考訳(メタデータ) (2024-11-27T00:52:21Z) - Deep-Learning Tool for Early Identifying Non-Traumatic Intracranial
Hemorrhage Etiology based on CT Scan [40.51754649947294]
深層学習モデルは、2011年1月から2018年4月までに収集された非外傷性ICHを用いた1868個のNCCTスキャンを用いて開発された。
診断成績は臨床医の成績と比較した。
臨床医は, システム拡張による特定の出血エチオロジーの感度, 特異性, 精度を著しく改善した。
論文 参考訳(メタデータ) (2023-02-02T08:45:17Z) - Translating automated brain tumour phenotyping to clinical neuroimaging [0.4199844472131921]
我々は、自動腫瘍分割モデルの比較忠実度を定量化するために最先端の手法を用いる。
深層学習セグメンテーションモデルは、データ不足時に腫瘍をうまく特徴づけ、コントラストを使わずに拡張組織を検出できる。
論文 参考訳(メタデータ) (2022-06-13T12:58:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。