論文の概要: Clinically-Grounded Counterfactual Reasoning for Medical Video Diagnosis
- arxiv url: http://arxiv.org/abs/2605.26483v1
- Date: Tue, 26 May 2026 02:46:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.589631
- Title: Clinically-Grounded Counterfactual Reasoning for Medical Video Diagnosis
- Title(参考訳): 医用ビデオ診断における臨床応用例の検討
- Authors: Jianzhe Gao, Churan Wang, Weiyi Zhang, Jianghua Li, Li-An Li, Wenguan Wang, Yixin Zhu, Yizhou Wang,
- Abstract要約: この研究は、臨床診断思考を模倣する対実的推論フレームワークであるMedVCRを導入している。
MedVCRは3つの構成要素から構成されている。
これは、完全に監督された(例えば、大腸内視鏡)と弱監督された(例えば、大腸内視鏡)ビデオ診断設定の両方で評価され、パフォーマンスは2.6%-10.2%向上した。
- 参考スコア(独自算出の注目度): 47.559337485629904
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Medical video diagnosis involves inferring clinical decisions from dynamic tissue responses throughout examination processes. Existing methods rely on an end-to-end learning paradigm that i) focuses on appearance rather than pathology, ii) lacks clinical priors, and iii) reasons solely from observations without counterfactual comparison. This work introduces MedVCR, a counterfactual reasoning framework that mimics clinical diagnostic thinking. MedVCR comprises three components: a Counterfactual Generator that synthesizes tissue evolution under specified pathological states via a diffusion-based manner; a Counterfactual Representation Learning module that encodes diagnostic knowledge through clinical rules (i.e., temporal consistency, pathological separability, and counterfactual alignment); and a Dual Diagnostic Prediction strategy that integrates video-level assessment with frame-level counterfactual analysis. MedVCR is evaluated under both fully supervised (e.g., colposcopy) and weakly supervised (e.g., colonoscopy) video diagnosis settings, yielding 2.6%-10.2% performance gains compared with leading baselines. Comprehensive ablation studies further validate the effectiveness of each component. The code will be released.
- Abstract(参考訳): 医用ビデオ診断は、検査プロセス全体を通して、動的組織反応から臨床上の決定を推測することを含む。
既存の手法はエンド・ツー・エンドの学習パラダイムに依存している。
i) 病理学よりも外見に焦点を当てる
二 臨床上の先行権がないこと、及び
三 反実的比較のない観察のみによる理由
この研究は、臨床診断思考を模倣する対実的推論フレームワークであるMedVCRを導入している。
MedVCRは、拡散に基づく方法で特定の病理状態下で組織進化を合成する対物生成装置と、臨床規則(時間的一貫性、病理的分離性、および反物的アライメント)を介して診断知識を符号化する対物表現学習モジュールと、フレームレベルの反物解析とビデオレベルのアセスメントを統合する対物診断戦略の3つの構成要素から構成される。
MedVCRは、完全に監督された(例えば、大腸内視鏡)と弱監督された(例えば、大腸内視鏡)ビデオ診断設定の両方で評価され、主要なベースラインと比較して2.6%-10.2%のパフォーマンス向上が得られた。
包括的アブレーション研究は、各コンポーネントの有効性をさらに検証する。
コードはリリースされます。
関連論文リスト
- Divide-then-Diagnose: Weaving Clinician-Inspired Contexts for Ultra-Long Capsule Endoscopy Videos [83.01543151239254]
我々は、診断駆動型CEビデオ要約という新しいタスクを定義する。
VideoCAPは、診断駆動アノテーションを備えた最初のCEデータセットである。
DiCEはクリニックにインスパイアされたフレームワークで、標準的なCE読み込みワークフローを反映している。
論文 参考訳(メタデータ) (2026-04-23T16:07:51Z) - Clinical Cognition Alignment for Gastrointestinal Diagnosis with Multimodal LLMs [63.535652574541764]
MLLM(Multimodal Large Language Models)は医用画像解析において顕著な可能性を示した。
消化器内視鏡におけるそれらの応用は、現在、2つの重要な限界によって妨げられている。
本稿では,これらの課題に対処する新しい臨床認知アライメント(CogAlign)フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-21T07:47:37Z) - AgentsEval: Clinically Faithful Evaluation of Medical Imaging Reports via Multi-Agent Reasoning [73.50200033931148]
本稿では,放射線科医の協調診断ワークフローをエミュレートしたマルチエージェントストリーム推論フレームワークであるAgensEvalを紹介する。
評価プロセスを基準定義、エビデンス抽出、アライメント、一貫性スコアなどの解釈可能なステップに分割することで、AgensEvalは明確な推論トレースと構造化された臨床フィードバックを提供する。
実験結果から,AgensEvalは,言い換え,意味的,スタイリスティックな摂動の下でも頑健な臨床的整合性,意味的忠実性,解釈可能な評価を提供することが示された。
論文 参考訳(メタデータ) (2026-01-23T11:59:13Z) - MedKGI: Iterative Differential Diagnosis with Medical Knowledge Graphs and Information-Guided Inquiring [39.776843923694244]
臨床実践を基盤とした診断フレームワークであるMedKGIを提案する。
MedKGI は診断精度と検査効率の両方において強力な LLM ベースラインより優れていることを示す。
論文 参考訳(メタデータ) (2025-12-30T12:31:53Z) - ClinDEF: A Dynamic Evaluation Framework for Large Language Models in Clinical Reasoning [58.01333341218153]
ClinDEF(ClinDEF)は, LLMにおける臨床推論をシミュレートされた診断対話を用いて評価する動的フレームワークである。
本手法は, 患者を発症し, LLMをベースとした医師と自動患者エージェントとのマルチターンインタラクションを容易にする。
実験により、ClinDEFは最先端のLSMにおいて重要な臨床推論ギャップを効果的に露呈することが示された。
論文 参考訳(メタデータ) (2025-12-29T12:58:58Z) - Simulating Viva Voce Examinations to Evaluate Clinical Reasoning in Large Language Models [51.91760712805404]
大規模言語モデル(LLM)におけるシーケンシャルな臨床推論を評価するためのベンチマークであるVivaBenchを紹介する。
本データセットは,医療訓練における(口頭)検査をシミュレートする対話的シナリオとして構成された1762名の医師による臨床ヴィグネットから構成される。
本分析では,臨床における認知的誤りを反映するいくつかの障害モードを同定した。
論文 参考訳(メタデータ) (2025-10-11T16:24:35Z) - Ensemble Deep Learning and LLM-Assisted Reporting for Automated Skin Lesion Diagnosis [2.9307254086347427]
皮膚科診断のためのAI統合を再定義する統合フレームワークを導入する。
第一に、アーキテクチャ的に多様である畳み込みニューラルネットワークの目的的にヘテロジニアスなアンサンブルは、相補的な診断の視点を提供する。
第2に、診断ワークフローに直接大きな言語モデル機能を組み込んで、分類出力を臨床的に意味のある評価に変換する。
論文 参考訳(メタデータ) (2025-10-05T08:07:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。