論文の概要: Reasoning Before Diagnosis: Physician-Inspired Structured Thinking for ECG Classification
- arxiv url: http://arxiv.org/abs/2605.17308v1
- Date: Sun, 17 May 2026 07:55:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:47.893593
- Title: Reasoning Before Diagnosis: Physician-Inspired Structured Thinking for ECG Classification
- Title(参考訳): 診断前の推論:心電図分類のための物理学者にヒントを得た構造化思考
- Authors: Yang Wu, Xiaoyan Yuan, Hau-San Wong, Xiping Hu,
- Abstract要約: 既存のアプローチのほとんどは、明確な臨床推論なしでECG信号から直接ラベルを予測する。
CardioThinkは、医師にインスパイアされたマルチモーダル言語モデル(MLLM)フレームワークであり、診断推論プロセスを明示的にモデル化する。
本稿では,この構造的推論形式と可変サイズ診断セットの精度を協調的に最適化するために,構造的集合ポリシー最適化(SSPO)を導入する。
- 参考スコア(独自算出の注目度): 42.25934029112465
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Electrocardiogram (ECG) diagnosis in clinical practice relies on structured reasoning over multiple hierarchical aspects, including cardiac rhythm, conduction properties, waveform morphology, and overall diagnostic impression. However, most existing approaches predict labels directly from ECG signals without explicit clinical reasoning, resulting in opaque decisions that lack clinical alignment. To bridge this gap, we propose CardioThink, a physician-inspired multimodal large language model (MLLM) framework that explicitly models the diagnostic reasoning process through human-interpretable intermediate stages (rhythm, conduction, morphology, and impression) to derive final classification results. Furthermore, we introduce Structured Set Policy Optimization (SSPO) to jointly optimize adherence to this structured reasoning format and the accuracy of variable-size diagnostic sets, without requiring manually annotated reasoning traces. Extensive experiments on diverse ECG benchmarks demonstrate the significant superiority of our approach in diagnostic accuracy, while simultaneously providing interpretable clinical reasoning. Notably, reasoning quality evaluations confirm that SSPO substantially enhances the clinical validity of the generated rationales. These findings reveal that moving beyond direct label prediction toward structured reasoning offers a more clinically aligned direction for future ECG modeling.
- Abstract(参考訳): 臨床における心電図(ECG)の診断は、心臓のリズム、伝導特性、波形形態、全体的な診断印象など、複数の階層的な側面における構造的推論に依存する。
しかし、既存のほとんどのアプローチは、明確な臨床推論なしにECG信号から直接ラベルを予測し、臨床の整合性に欠ける不透明な決定をもたらす。
このギャップを埋めるために、CardioThinkは医師にインスパイアされたマルチモーダル言語モデル(MLLM)フレームワークを提案し、人間の解釈可能な中間段階(リズム、伝導、形態、印象)を通して診断推論プロセスを明示的にモデル化し、最終的な分類結果を導出する。
さらに,この構造的推論形式と可変サイズ診断セットの精度を,手動で注釈付けされた推論トレースを必要とせず,協調的に最適化する構造的集合ポリシー最適化(SSPO)を導入する。
各種心電図ベンチマークによる広範囲な実験により,診断精度において本手法が有意な優位性を示した。
特に、推論品質評価は、SSPOが生成した理論的根拠の臨床的妥当性を大幅に向上することを確認する。
これらの結果から, 直接ラベル予測から構造化推論への移動は, 将来の心電図モデリングにおいて, より臨床的に整合した方向を示すことが明らかとなった。
関連論文リスト
- MultiDx: A Multi-Source Knowledge Integration Framework towards Diagnostic Reasoning [66.94527468532843]
2段階の診断推論フレームワークであるMultiDxを提案する。
まず Web 検索,SOAP 形式の症例,臨床症例データベースから知識を活用することにより,疑わしい診断と推論経路を生成する。
そして、マッチング、投票、および差分診断を通じて、複数のパースペクティブエビデンスを統合し、最終的な予測を生成する。
論文 参考訳(メタデータ) (2026-04-27T08:46:29Z) - CARE-ECG: Causal Agent-based Reasoning for Explainable and Counterfactual ECG Interpretation [3.4920018472301866]
本稿では,1つのパイプラインで表現学習,診断,説明を統一する因果的に構造化されたECG言語推論フレームワークであるCARE-ECGを提案する。
CARE-ECGは、因果検索拡張生成と、履歴、診断、応答を検証と統合したモジュール型エージェントパイプラインを通じて、言語出力を基盤とする。
全体として、CARE-ECGは重要な潜伏ドライバ、因果的エビデンスパス、代替的な生理状態が結果をどのように変えるかを明らかにすることによって、追跡可能な推論を提供する。
論文 参考訳(メタデータ) (2026-04-12T02:35:23Z) - Clinical Cognition Alignment for Gastrointestinal Diagnosis with Multimodal LLMs [63.535652574541764]
MLLM(Multimodal Large Language Models)は医用画像解析において顕著な可能性を示した。
消化器内視鏡におけるそれらの応用は、現在、2つの重要な限界によって妨げられている。
本稿では,これらの課題に対処する新しい臨床認知アライメント(CogAlign)フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-21T07:47:37Z) - AgentsEval: Clinically Faithful Evaluation of Medical Imaging Reports via Multi-Agent Reasoning [73.50200033931148]
本稿では,放射線科医の協調診断ワークフローをエミュレートしたマルチエージェントストリーム推論フレームワークであるAgensEvalを紹介する。
評価プロセスを基準定義、エビデンス抽出、アライメント、一貫性スコアなどの解釈可能なステップに分割することで、AgensEvalは明確な推論トレースと構造化された臨床フィードバックを提供する。
実験結果から,AgensEvalは,言い換え,意味的,スタイリスティックな摂動の下でも頑健な臨床的整合性,意味的忠実性,解釈可能な評価を提供することが示された。
論文 参考訳(メタデータ) (2026-01-23T11:59:13Z) - ClinDEF: A Dynamic Evaluation Framework for Large Language Models in Clinical Reasoning [58.01333341218153]
ClinDEF(ClinDEF)は, LLMにおける臨床推論をシミュレートされた診断対話を用いて評価する動的フレームワークである。
本手法は, 患者を発症し, LLMをベースとした医師と自動患者エージェントとのマルチターンインタラクションを容易にする。
実験により、ClinDEFは最先端のLSMにおいて重要な臨床推論ギャップを効果的に露呈することが示された。
論文 参考訳(メタデータ) (2025-12-29T12:58:58Z) - Interpretable Multimodal Zero-Shot ECG Diagnosis via Structured Clinical Knowledge Alignment [10.34278624026891]
ZETAは、臨床知識に合わせて心電図の診断を解釈するために設計されたゼロショットマルチモーダルフレームワークである。
今後の研究を促進するため、キュレートされた観測データセットとコードをリリースする。
論文 参考訳(メタデータ) (2025-10-24T15:09:09Z) - Simulating Viva Voce Examinations to Evaluate Clinical Reasoning in Large Language Models [51.91760712805404]
大規模言語モデル(LLM)におけるシーケンシャルな臨床推論を評価するためのベンチマークであるVivaBenchを紹介する。
本データセットは,医療訓練における(口頭)検査をシミュレートする対話的シナリオとして構成された1762名の医師による臨床ヴィグネットから構成される。
本分析では,臨床における認知的誤りを反映するいくつかの障害モードを同定した。
論文 参考訳(メタデータ) (2025-10-11T16:24:35Z) - Integrating clinical reasoning into large language model-based diagnosis through etiology-aware attention steering [7.092919468004549]
LLM(Large Language Models)は、医学的テキスト理解と生成において重要な機能を示す。
本研究の目的は,LSMの診断精度と臨床推論能力を高めることである。
論文 参考訳(メタデータ) (2025-08-01T03:05:43Z) - Refine Medical Diagnosis Using Generation Augmented Retrieval and Clinical Practice Guidelines [16.56254046507092]
GARMLE-Gは、医療用言語モデルの出力を権威的ガイドラインに根拠づけた、世代別検索フレームワークである。
従来のRetrieval-Augmented Generationベースのアプローチとは異なり、GARMLE-Gは権威的なガイドラインコンテンツを直接検索することで幻覚のない出力を可能にする。
高血圧診断のためのプロトタイプシステムを開発し, 検索精度, 意味的関連性, 臨床ガイドラインの適合性を実証した。
論文 参考訳(メタデータ) (2025-06-22T11:31:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。