論文の概要: Checkup2Action: A Multimodal Clinical Check-up Report Dataset for Patient-Oriented Action Card Generation
- arxiv url: http://arxiv.org/abs/2605.11533v1
- Date: Tue, 12 May 2026 04:58:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.592776
- Title: Checkup2Action: A Multimodal Clinical Check-up Report Dataset for Patient-Oriented Action Card Generation
- Title(参考訳): Checkup2Action: 患者志向のアクションカード生成のためのマルチモーダル臨床チェックアップレポートデータセット
- Authors: Sike Xiang, Shuang Chen, Kevin Qinghong Lin, Jialin Yu, Yijia Sun, Philip Torr, Amir Atapour-Abarghouei,
- Abstract要約: textbfCheckup2Action, a multimodal clinical check-up report dataset and benchmark for structured textitAction Card generation。
このデータセットには、人口統計情報、身体検査、実験室のテスト、心臓血管アセスメント、画像関連証拠、医師の要約を含む2,000の未確認の現実世界のチェックアップレポートが含まれている。
我々は、制約付き構造化された生成タスクとしてチェックアップ・ツー・アクションの生成を定式化し、課題のカバレッジと精度、優先順位の整合性、部門と時間の推奨精度、アクションの複雑さ、有用性、可読性、安全コンプライアンスを網羅する評価プロトコルを導入する。
- 参考スコア(独自算出の注目度): 33.09776300622938
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Clinical check-up reports are multimodal documents that combine page layouts, tables, numerical biomarkers, abnormality flags, imaging findings, and domain-specific terminology. Such heterogeneous evidence is difficult for laypersons to interpret and translate into concrete follow-up actions. Although large language models show promise in medical summarisation and triage support, their ability to generate safe, prioritised, and patient-oriented actions from multimodal check-up reports remains under-benchmarked. We present \textbf{Checkup2Action}, a multimodal clinical check-up report dataset and benchmark for structured \textit{Action Card} generation. Each card describes one clinically relevant issue and specifies its priority, recommended department, follow-up time window, patient-facing explanation, and questions for clinicians, while avoiding diagnostic or treatment-prescriptive claims. The dataset contains 2,000 de-identified real-world check-up reports covering demographic information, physical examinations, laboratory tests, cardiovascular assessments, imaging-related evidence, and physician summaries. We formulate checkup-to-action generation as a constrained structured generation task and introduce an evaluation protocol covering issue coverage and precision, priority consistency, department and time recommendation accuracy, action complexity, usefulness, readability, and safety compliance. Experiments with general-purpose and medical large language models reveal clear trade-offs between issue coverage, action correctness, conciseness, and safety alignment. Checkup2Action provides a new multimodal benchmark for evaluating patient-oriented reasoning over clinical check-up reports.
- Abstract(参考訳): 臨床チェックアップレポートは、ページレイアウト、テーブル、数値バイオマーカー、異常フラグ、画像所見、ドメイン固有の用語を組み合わせたマルチモーダル文書である。
このような異質な証拠は、素人が解釈し、具体的な追従行動へと変換することが困難である。
大きな言語モデルは、医療の要約とトリアージサポートにおいて有望であるが、マルチモーダルなチェックアップレポートから安全で優先順位付けされ、患者指向のアクションを生成できる能力は、まだ未確認のままである。
本稿では, マルチモーダルな臨床チェックアップレポートデータセットである \textbf{Checkup2Action} を, 構造化された \textit{Action Card} 生成のためのベンチマークとして提示する。
各カードは1つの臨床的に関係のある問題を記述し、診断や治療規範的クレームを回避しつつ、その優先順位、推奨部署、フォローアップタイムウインドウ、患者に面した説明、および臨床医への質問を規定する。
このデータセットには、人口統計情報、身体検査、実験室のテスト、心臓血管アセスメント、画像関連証拠、医師の要約を含む2,000の未確認の現実世界のチェックアップレポートが含まれている。
制約付き構造化された生成タスクとしてチェックアップ・ツー・アクション生成を定式化し、課題のカバレッジと精度、優先順位の整合性、部門と時間の推薦精度、アクションの複雑さ、有用性、可読性、安全コンプライアンスを網羅する評価プロトコルを導入する。
汎用および医療用大規模言語モデルを用いた実験は、問題カバレッジ、アクションの正しさ、簡潔さ、安全性の整合性のトレードオフを明確に示している。
Checkup2Actionは、臨床検査報告よりも患者指向の推論を評価するための、新しいマルチモーダルベンチマークを提供する。
関連論文リスト
- CT-FineBench: A Diagnostic Fidelity Benchmark for Fine-Grained Evaluation of CT Report Generation [51.11942945171396]
従来の評価指標は、語彙重なり合いやエンティティマッチングの粗い尺度のみを提供する。
我々はCT-RATEとMerlinのベンチマークであるCT-FineBenchを提案し、CTレポートの微細な事実整合性を評価する。
我々のベンチマークは、綿密な質問回答(QA)ベースのプロセスによって構築されます。
論文 参考訳(メタデータ) (2026-04-27T03:32:46Z) - AgentsEval: Clinically Faithful Evaluation of Medical Imaging Reports via Multi-Agent Reasoning [73.50200033931148]
本稿では,放射線科医の協調診断ワークフローをエミュレートしたマルチエージェントストリーム推論フレームワークであるAgensEvalを紹介する。
評価プロセスを基準定義、エビデンス抽出、アライメント、一貫性スコアなどの解釈可能なステップに分割することで、AgensEvalは明確な推論トレースと構造化された臨床フィードバックを提供する。
実験結果から,AgensEvalは,言い換え,意味的,スタイリスティックな摂動の下でも頑健な臨床的整合性,意味的忠実性,解釈可能な評価を提供することが示された。
論文 参考訳(メタデータ) (2026-01-23T11:59:13Z) - Clinically Grounded Agent-based Report Evaluation: An Interpretable Metric for Radiology Report Generation [32.410641778559544]
ICARE (Interpretable and Clinicallygrounded Agent-based Report Evaluation) は、解釈可能な評価フレームワークである。
2つのエージェントは、それぞれが基礎的真実または生成されたレポートを持ち、臨床的に有意義な質問を発生し、互いにクイズする。
スコアを質問応答ペアにリンクすることで、ICAREは透明で解釈可能な評価を可能にする。
論文 参考訳(メタデータ) (2025-08-04T18:28:03Z) - On the Risk of Misleading Reports: Diagnosing Textual Biases in Multimodal Clinical AI [4.866086225040713]
本稿では,モデルが二項分類タスクにおける各モータリティに依存することを定量化するための摂動に基づくアプローチを提案する。
画像やテキストを反対のラベルと交換することで、モダリティ固有のバイアスを露呈する。
論文 参考訳(メタデータ) (2025-07-31T21:35:52Z) - Uncertainty-aware Medical Diagnostic Phrase Identification and Grounding [72.18719355481052]
MRG(Messical Report Grounding)と呼ばれる新しい課題について紹介する。
MRGは医療報告から診断フレーズとその対応する接地箱を直接エンドツーエンドで識別することを目的としている。
マルチモーダルな大規模言語モデルを用いて診断フレーズを予測する,堅牢で信頼性の高いフレームワークである uMedGround を提案する。
論文 参考訳(メタデータ) (2024-04-10T07:41:35Z) - Controllable Chest X-Ray Report Generation from Longitudinal
Representations [13.151444796296868]
レポートをスピードアップする1つの戦略は、自動レポートシステムを統合することである。
自動放射線診断への従来のアプローチは、入力として事前の研究を提供していないのが一般的である。
筆者らは,(1) 縦断学習 -- マルチモーダルレポート生成モデルに提供可能な関節長手表現に,現在のスキャン情報と先行スキャン情報を整合し,活用する手法を提案する。(2) 文解剖学的ドロップアウト -- レポート生成モデルを用いて,入力として与えられた解剖学的領域のサブセットに対応する元のレポートからのみ文を予測する訓練戦略。
論文 参考訳(メタデータ) (2023-10-09T17:22:58Z) - C^2M-DoT: Cross-modal consistent multi-view medical report generation
with domain transfer network [67.97926983664676]
ドメイン転送ネットワーク(C2M-DoT)を用いたクロスモーダルなマルチビュー医療レポート生成を提案する。
C2M-DoTは、すべてのメトリクスで最先端のベースラインを大幅に上回る。
論文 参考訳(メタデータ) (2023-10-09T02:31:36Z) - Unifying Relational Sentence Generation and Retrieval for Medical Image
Report Composition [142.42920413017163]
現在の手法は、個々のケースのデータセットバイアスにより、しばしば最も一般的な文を生成する。
テンプレート検索と文生成を一体化し、共通およびまれな異常に対処する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-01-09T04:33:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。