論文の概要: RAPTOR+: A Visually Grounded Vision-Language Framework to Improve Clinical Trust and Auditability in Automated Cancer Referral Processing
- arxiv url: http://arxiv.org/abs/2605.25956v1
- Date: Mon, 25 May 2026 15:30:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:20.438713
- Title: RAPTOR+: A Visually Grounded Vision-Language Framework to Improve Clinical Trust and Auditability in Automated Cancer Referral Processing
- Title(参考訳): RAPTOR+: 自動がん参照処理における臨床信頼と聴覚性向上のための視覚基盤型視覚言語フレームワーク
- Authors: Sofiat Abioye, Ufaq Khan, Shazad Ashraf, Anusha Jose, Benjamin Wallace, William Poulett, Adam Byfield, Lukman Akanbi, Muhammad Bilal,
- Abstract要約: 本稿では,視覚言語モデル(VLM)を終端参照理解に用いるマルチモーダル拡張であるRAPTOR+を提案する。
223例のクリニカルレファレンシャルレファレンシャルレファレンスフォーム上で,精細調整VLM,商用およびオープンソースゼロショットVLM,オリジナルOCRベースのパイプラインの評価を行った。
- 参考スコア(独自算出の注目度): 1.384221236843682
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Urgent suspected colorectal cancer (CRC) referrals create operational bottlenecks because semi-structured clinical documents often require manual review and transcription. The original RAPTOR system used Large Language Models for structured extraction but relied on a separate OCR stage, making it vulnerable to handwriting, layout variation, and loss of visual evidence linkage. We present RAPTOR+, a multimodal extension that uses Vision-Language Models (VLMs) for end-to-end referral understanding. We evaluate fine-tuned VLMs, commercial and open-source zero-shot VLMs, and the original OCR-based pipeline on 223 clinically curated CRC urgent referral forms. We also introduce a grounding-aware evaluation framework that measures both extraction accuracy and evidence localisation. Results show a clear grounding gap in zero-shot models. Gemini 2.5 Flash achieved 92.6% Reading Accuracy but only 1.2% Strict Safety. In contrast, fine-tuned Qwen3-VL-8B achieved 96.1% Reading Accuracy and 60.6% Strict Safety, substantially improving verifiable evidence grounding. These findings show that task-specific fine-tuning is essential for reliable, auditable clinical document understanding. RAPTOR+ enables extracted referral decisions to be linked to visual evidence, supporting safer and more efficient cancer referral triage.
- Abstract(参考訳): 早期に疑われた大腸癌(CRC)レファラールは、半構造化された臨床文書が手書きのレビューと転写を必要とすることが多いため、運用上のボトルネックを生じさせる。
元々のRAPTORシステムは構造化抽出にLarge Language Modelsを使用していたが、別のOCRステージに依存しており、手書き、レイアウトのバリエーション、視覚的エビデンスリンクの喪失に弱い。
本稿では,視覚言語モデル(VLM)を終端参照理解に用いるマルチモーダル拡張であるRAPTOR+を提案する。
223例のクリニカルレファレンシャルレファレンシャルレファレンスフォーム上で,精細調整VLM,商用およびオープンソースゼロショットVLM,オリジナルOCRベースのパイプラインの評価を行った。
また,抽出精度とエビデンスローカライゼーションの両方を測定するグラウンドディング・アウェア評価フレームワークを導入する。
その結果、ゼロショットモデルでは明確な接地ギャップが示される。
Gemini 2.5 Flashは92.6%の読み取り精度を達成したが、Strict Safetyはわずか1.2%だった。
対照的に、微調整されたQwen3-VL-8Bは96.1%の読み出し精度と60.6%の厳密な安全を達成した。
これらの結果から, タスク特異的微調整は信頼性, 監査可能な臨床文書理解に不可欠であることが示唆された。
RAPTOR+は、抽出された参照決定を視覚的証拠と関連づけることを可能にし、より安全で効率的ながん参照トリアージをサポートする。
関連論文リスト
- CuraView: A Multi-Agent Framework for Medical Hallucination Detection with GraphRAG-Enhanced Knowledge Verification [3.422186949568493]
本報告では,文レベル検出のためのフレームワークであるCuraViewについて述べる。
CuraViewは、患者レベルのEHRからGraphRAGベースの知識グラフを構築する。
我々は,50例の患者を対象に,Ex Discharge-Meベンチマークから250例のCuraViewを評価した。
論文 参考訳(メタデータ) (2026-05-05T08:05:31Z) - Trust but Verify: Introducing DAVinCI -- A Framework for Dual Attribution and Verification in Claim Inference for Language Models [53.279391576560755]
大規模言語モデル(LLM)は、広範囲のNLPタスクにおいて顕著な流速と汎用性を示してきたが、実際的な不正確さと制限が伴う傾向にある。
これは、信頼と妥当性が最優先される医療、法律、科学コミュニケーションといった、高リスク領域に重大なリスクをもたらす。
LLM出力の事実的信頼性と解釈可能性を高めるために設計されたDAVinCI - Dual Attribution and Verificationフレームワークを紹介する。
論文 参考訳(メタデータ) (2026-04-23T01:37:50Z) - Calibrated Confidence Expression for Radiology Report Generation [33.24673060327421]
放射線学レポート生成における大規模視覚言語モデル(LVLM)は、正確な予測と臨床的に解釈可能な指標を必要とする。
現在の最先端言語モデルはしばしば自信過剰であり、放射線学レポート生成などのマルチモーダル設定における校正に関する研究は限られている。
本稿では,LVLMを微調整する医療強化学習フレームワークであるConRadを紹介する。
論文 参考訳(メタデータ) (2026-03-31T09:37:33Z) - EviSearch: A Human in the Loop System for Extracting and Auditing Clinical Evidence for Systematic Reviews [7.325762712182949]
EviSearchは臨床エビデンステーブルのためのマルチエージェント抽出システムである。
パイプラインはマルチモーダルエビデンスソース間の高精度抽出のために設計されている。
EviSearchは、生きた体系的なレビューを加速し、手作業によるキュレーションの負担を軽減し、LCMベースの抽出をエビデンス合成パイプラインに統合するための安全で監査可能なパスを提供することを目的としている。
論文 参考訳(メタデータ) (2026-03-23T22:36:54Z) - Guideline-Grounded Evidence Accumulation for High-Stakes Agent Verification [60.18369393468405]
既存の検証器は通常、ドメイン知識の欠如と限られた校正のために性能が劣る。
GLEANは専門家によって計算されたプロトコルをトラジェクトリインフォームされ、よく校正された正当性信号にコンパイルする。
我々は,MIMIC-IVデータセットから得られた3つの疾患の薬物的臨床診断でGLEANを実証的に検証した。
論文 参考訳(メタデータ) (2026-03-03T09:36:43Z) - NAACL: Noise-AwAre Verbal Confidence Calibration for LLMs in RAG Systems [53.52419750390942]
大型言語モデル(LLM)はミッションクリティカルな事実領域で使用される。
LLMのキャリブレーション性能は, ノイズが回復した状況によって低下する。
我々は、ノイズ下での過信を解決するための原則的基盤を提供するため、NAACLルール(Noise-AwAre Confidence CaLibration Rules)を提案する。
論文 参考訳(メタデータ) (2026-01-16T05:38:25Z) - CARE-RAG - Clinical Assessment and Reasoning in RAG [43.1450755645803]
大規模言語モデル(LLM)における検索と推論のギャップについて検討する。
推論の正確性,一貫性,忠実度を計測する評価フレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-20T02:44:55Z) - Look As You Think: Unifying Reasoning and Visual Evidence Attribution for Verifiable Document RAG via Reinforcement Learning [55.232400251303794]
Look As You Think (LAT)は、モデルをトレーニングし、一貫した帰属性を持った検証可能な推論パスを生成するための強化学習フレームワークである。
LATはシングルイメージとマルチイメージの両方でバニラモデルを一貫して改善し、平均ゲインは8.23%、IoU@0.5では47.0%となる。
論文 参考訳(メタデータ) (2025-11-15T02:50:23Z) - Decoupling Clinical and Class-Agnostic Features for Reliable Few-Shot Adaptation under Shift [12.373281238541296]
医療ビジョン言語モデル(VLM)は、臨床診断支援を約束するが、分布シフトによる信頼性は、安全なデプロイメントにとって大きな関心事である。
そこで我々はDRiFtを提案する。DRiFtは機能分離フレームワークで、臨床的に関連する信号をタスク非依存のノイズから明確に分離する。
提案手法は,従来のプロンプトベースの手法に比べて,Top-1精度+11.4%,Macro-F1+3.3%向上する。
論文 参考訳(メタデータ) (2025-09-11T12:26:57Z) - Retrieval is Not Enough: Enhancing RAG Reasoning through Test-Time Critique and Optimization [58.390885294401066]
Retrieval-augmented Generation (RAG) は知識基底型大規模言語モデル(LLM)を実現するためのパラダイムとして広く採用されている。
RAGパイプラインは、モデル推論が得られた証拠と整合性を維持するのに失敗することが多く、事実上の矛盾や否定的な結論につながる。
批判駆動アライメント(CDA)に基づく新しい反復的枠組みであるAlignRAGを提案する。
AlignRAG-autoは、動的に洗練を終了し、批判的な反復回数を事前に指定する必要がなくなる自律的な変種である。
論文 参考訳(メタデータ) (2025-04-21T04:56:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。