論文の概要: Uncertainty-Aware Structured Data Extraction from Full CMR Reports via Distilled LLMs
- arxiv url: http://arxiv.org/abs/2605.08045v1
- Date: Fri, 08 May 2026 17:35:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:39.244967
- Title: Uncertainty-Aware Structured Data Extraction from Full CMR Reports via Distilled LLMs
- Title(参考訳): 蒸留LDMによる全CMRレポートからの不確実性を考慮した構造化データ抽出
- Authors: Yi Yu, Parker Martin, Zhenyu Bu, Yixuan Liu, Yi-Yu Zheng, Orlando Simonetti, Yuchi Han, Yuan Xue,
- Abstract要約: 本稿では,自由テキスト型心臓磁気共鳴(CMR)レポートを構造化データに変換するフレームワークであるCMR-EXTRを提案する。
教師と学生の蒸留パイプラインは、マニュアルアノテーションを制限しながら完全にオフラインの推論を可能にする。
実験により、CMR-EXTR 99.65%の変数レベルの精度が示され、信頼性の高い抽出と情報的信頼性のスコアが示されている。
- 参考スコア(独自算出の注目度): 10.568897446015834
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Converting free-text cardiac magnetic resonance (CMR) reports into auditable structured data remains a bottleneck for cohort assembly, longitudinal curation, and clinical decision support. We present CMR-EXTR, a lightweight framework that converts free-text CMR reports into structured data and assigns per-field confidence for quality control. A teacher-student distillation pipeline enables fully offline inference while limiting manual annotation. Uncertainty integrates three complementary principles -- distribution plausibility, sampling stability, and cross-field consistency -- to triage human review. Experiments show that CMR-EXTR achieves 99.65% variable-level accuracy, demonstrating both reliable extraction and informative confidence scores. To our knowledge, this is the first CMR-specific extraction system with integrated confidence estimation. The code is available at https://github.com/yuyi1005/CMR-EXTR.
- Abstract(参考訳): 自由テキスト型心臓磁気共鳴(CMR)レポートを聴取可能な構造化データに変換することは、コホートアセンブリ、縦断的キュレーション、臨床診断支援のボトルネックとして残っている。
本稿では,自由文CMRレポートを構造化データに変換する軽量フレームワークであるCMR-EXTRについて述べる。
教師と学生の蒸留パイプラインは、マニュアルアノテーションを制限しながら完全にオフラインの推論を可能にする。
不確実性は、人間のレビューをトリアージするために、3つの相補的な原則 – 分散の可視性、サンプリングの安定性、フィールド間の一貫性 – を統合する。
実験により、CMR-EXTRは99.65%の可変レベルの精度を達成し、信頼性の高い抽出と情報的信頼スコアの両方を実証した。
我々の知る限り、これは信頼度を総合的に推定する初めてのCMR特異的抽出システムである。
コードはhttps://github.com/yuyi1005/CMR-EXTRで公開されている。
関連論文リスト
- From Completion to Editing: Unlocking Context-Aware Code Infilling via Search-and-Replace Instruction Tuning [81.97788535387286]
本稿では,エージェントによる検証・編集機構を統一された単一パス推論プロセスに内部化するフレームワークを提案する。
最小限のデータで、SRI-Coderは、ChatモデルがBaseモデルの完了性能を上回ることができる。
FIMスタイルのチューニングとは異なり、SRIは一般的なコーディング能力を保持し、標準のFIMに匹敵する推論遅延を維持する。
論文 参考訳(メタデータ) (2026-01-19T20:33:53Z) - Self-Rewarded Multimodal Coherent Reasoning Across Diverse Visual Domains [16.357026482329232]
マルチモーダルLSMは、流動的で信頼性の低い推論を生成する。
SR-MCRは軽量でラベルのないフレームワークであり、推論を整合させる。
SR-MCRは、幅広いビジュアルベンチマークで解答精度と推論コヒーレンスを改善する。
論文 参考訳(メタデータ) (2025-12-27T10:14:14Z) - Recursive Knowledge Synthesis for Multi-LLM Systems: Stability Analysis and Tri-Agent Audit Framework [0.0]
本稿では,大規模言語システムにおける安定性と説明可能性を分析するための三段階クロスバリデーションフレームワークを提案する。
このアーキテクチャは、セマンティックジェネレーション、分析整合性チェック、透明性監査に使用される3つの異種LCMを統合している。
論文 参考訳(メタデータ) (2025-12-17T16:42:45Z) - Self-Filtered Distillation with LLMs-generated Trust Indicators for Reliable Patent Classification [29.336193842747832]
本稿では,特許分類に適したフレームワークであるSelf-Filtered Distillationを紹介する。
LLM生成の合理性は、地道的な監督よりも信頼の信号として扱う。
本手法は, ラベルに基づく学習, 従来の蒸留の精度, 安定性, 解釈可能性に優れる。
論文 参考訳(メタデータ) (2025-10-06T22:50:01Z) - Revisiting Multivariate Time Series Forecasting with Missing Values [65.30332997607141]
現実の時系列では欠落値が一般的である。
現在のアプローチでは、計算モジュールを使用して、不足した値を補う、計算済みの予測フレームワークが開発されている。
このフレームワークは、致命的な問題を見落としている: 欠落した値に対して基礎的な真理は存在せず、予測精度を劣化させる可能性のあるエラーの影響を受けやすいようにしている。
本稿では,Information Bottleneck原則に基づく新しいフレームワークであるConsistency-Regularized Information Bottleneck(CRIB)を紹介する。
論文 参考訳(メタデータ) (2025-09-27T20:57:48Z) - Divide-Then-Align: Honest Alignment based on the Knowledge Boundary of RAG [51.120170062795566]
本稿では,問合せが知識境界外にある場合の"I don't know"で応答する機能を備えたRAGシステムを実現するためのDTAを提案する。
DTAは適切な棄権と精度のバランスをとり、検索強化システムの信頼性と信頼性を高める。
論文 参考訳(メタデータ) (2025-05-27T08:21:21Z) - Retrieval is Not Enough: Enhancing RAG Reasoning through Test-Time Critique and Optimization [58.390885294401066]
Retrieval-augmented Generation (RAG) は知識基底型大規模言語モデル(LLM)を実現するためのパラダイムとして広く採用されている。
RAGパイプラインは、モデル推論が得られた証拠と整合性を維持するのに失敗することが多く、事実上の矛盾や否定的な結論につながる。
批判駆動アライメント(CDA)に基づく新しい反復的枠組みであるAlignRAGを提案する。
AlignRAG-autoは、動的に洗練を終了し、批判的な反復回数を事前に指定する必要がなくなる自律的な変種である。
論文 参考訳(メタデータ) (2025-04-21T04:56:47Z) - k-Rater Reliability: The Correct Unit of Reliability for Aggregated
Human Annotations [2.538209532048867]
集約データセットの正しいデータ信頼性として、提案されたk-rater信頼性(kRR)を用いる必要がある。
我々は、WordSim-353上でkRRを計算するための経験的、分析的、ブートストラップに基づく手法を提案する。
論文 参考訳(メタデータ) (2022-03-24T08:05:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。