論文の概要: SCOPE:Planning for Hybrid Querying over Clinical Trial Data
- arxiv url: http://arxiv.org/abs/2604.25120v2
- Date: Thu, 30 Apr 2026 19:49:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 13:37:10.82905
- Title: SCOPE:Planning for Hybrid Querying over Clinical Trial Data
- Title(参考訳): SCOPE:臨床試験データを用いたハイブリッドクエリのためのプランニング
- Authors: Suparno Roy Chowdhury, Manan Roy Choudhury, Tejas Anvekar, Muhammad Ali Khan, Kaneez Zahra Rubab Khakwani, Mohamad Bassam Sonbol, Irbaz Bin Riaz, Vivek Gupta,
- Abstract要約: 本研究は, 可視細胞に直接保存されるのではなく, セマンティックな理解から解答を導出する必要がある臨床治験表推論について検討する。
現在のLCMアプローチは、暗黙の計画仮定の下で「悪い推論」に悩まされることが多く、暗黙の属性を復元しなければならない設定に焦点を当てている。
本報告では,タスクを行選択,構造化計画,実行に分解するマルチLLMプランナベースのフレームワークであるSCOPEを提案する。
- 参考スコア(独自算出の注目度): 10.080176148010247
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: We study clinical trial table reasoning, where answers are not directly stored in visible cells but must be reasoned from semantic understanding through normalization, classification, extraction, or lightweight domain reasoning. Motivated by the observation that current LLM approaches often suffer from "bad reasoning" under implicit planning assumptions, we focus on settings in which the model must recover implicit attributes such as therapy type, added agents, endpoint roles, or follow-up status from partially observed clinical-trial tables. We propose SCOPE (Structured Clinical hybrid Planning for Evidence retrieval in clinical trials), a multi-LLM planner-based framework that decomposes the task into row selection, structured planning, and execution. The planner makes the source field, reasoning rules, and output constraints explicit before answer generation, reducing ambiguity relative to direct prompting. We evaluate SCOPE on 1,500 hybrid reasoning questions over oncology clinical-trial tables against zero-shot, few-shot, chain-of-thought, TableGPT2, Blend-SQL, and EHRAgent. Results show that explicit multi-LLM planning improves accuracy for reasoning-based questions while offering a stronger accuracy-efficiency tradeoff than heavier agentic baselines. Our findings position clinical trial reasoning as a distinct table understanding problem and highlight hybrid planner-based decomposition as an effective solution
- Abstract(参考訳): 本研究は, 可視細胞に直接保存されるのではなく, 正常化, 分類, 抽出, 軽量領域推論による意味理解から解答を導出する必要がある臨床試験表推論について検討する。
現在のLCMアプローチは、暗黙の計画的前提の下で「悪い推論」に悩まされることが多いことから、治療タイプ、追加のエージェント、エンドポイントロール、または部分的に観察された臨床・臨床の表からのフォローアップステータスなどの暗黙的な属性をモデルが回復しなければならない設定に焦点を当てた。
本報告では,タスクを行選択,構造化計画,実行に分解するマルチLLMプランナベースのフレームワークであるSCOPEを提案する。
プランナーは、応答生成の前に、ソースフィールド、推論ルール、出力制約を明確にし、直接プロンプトに対するあいまいさを減らす。
本研究は, 眼科臨床検診表とゼロショット, 少数ショット, チェーン・オブ・シント, TableGPT2, Blend-SQL, EHRAgentに対する1500のハイブリッド推論質問に対してSCOPEを評価した。
その結果、明示的なマルチLLM計画により、より重いエージェントベースラインよりも高い精度と効率のトレードオフを提供しながら、推論に基づく質問の精度が向上することが示された。
本研究は, テーブル理解問題として臨床治験推論を位置づけ, ハイブリットプランナーによる分解を有効解として強調した。
関連論文リスト
- Learning Diagnostic Reasoning for Decision Support in Toxicology [34.623049546258294]
緊急毒性学への最初の強化学習(Reinforcement Learning, RL)であるDeToxRを提案する。
14種類の物質クラスにまたがる多ラベル予測のためのロバストなデータ融合エンジンを設計する。
臨床成績報酬を直接利用してモデルの推論を最適化する。
論文 参考訳(メタデータ) (2026-03-31T11:26:45Z) - Clinical Cognition Alignment for Gastrointestinal Diagnosis with Multimodal LLMs [63.535652574541764]
MLLM(Multimodal Large Language Models)は医用画像解析において顕著な可能性を示した。
消化器内視鏡におけるそれらの応用は、現在、2つの重要な限界によって妨げられている。
本稿では,これらの課題に対処する新しい臨床認知アライメント(CogAlign)フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-21T07:47:37Z) - TableMind++: An Uncertainty-Aware Programmatic Agent for Tool-Augmented Table Reasoning [44.20336483508951]
テーブル推論は、意味的理解と正確な数値操作を共同で行うモデルを必要とする。
これらの制約に対処するため、我々は以前TableMindをチューニングベースの自律型プログラムエージェントとして提案した。
この基盤をTableMind++に拡張し、新しい不確実性を認識した推論フレームワークを導入しました。
論文 参考訳(メタデータ) (2026-03-08T08:31:33Z) - Closing Reasoning Gaps in Clinical Agents with Differential Reasoning Learning [16.144050164828794]
本稿では, 臨床薬品の理性差を学習し, 臨床薬品の改善を図るためのフレームワークDRLを提案する。
DRLは、有向非巡回グラフ(DAG)として推論グラフを抽出し、臨床重み付きグラフ編集距離(GED)に基づく不一致解析を行う。
推論では、エージェントプロンプトを増強し、可能性のあるロジックギャップをパッチするために、トップ$k$命令を検索します。
論文 参考訳(メタデータ) (2026-02-10T16:29:32Z) - Automated stereotactic radiosurgery planning using a human-in-the-loop reasoning large language model agent [3.1808466401480984]
Gy単回放射線治療を施行した41例の脳転移例の振り返りコホートにおいて,チェーン・オブ・シント推論が薬剤的計画を改善するか否かを検討した。
推論の変種は、一次エンドポイント上の人間のプランナーと同等のプランドシメトリを示した。
論文 参考訳(メタデータ) (2025-12-23T18:32:17Z) - MedAlign: A Synergistic Framework of Multimodal Preference Optimization and Federated Meta-Cognitive Reasoning [52.064286116035134]
我々はMed-VQA(Med-VQA)のための視覚的LVLM応答を保証するフレームワークであるMedAlignを開発した。
まず、優先学習を視覚的コンテキストに合わせるために、マルチモーダルな直接選好最適化(mDPO)の目的を提案する。
次に、画像とテキストの類似性を生かし、クエリを専門的でコンテキスト拡張されたLVLMにルーティングする検索型混合処理(RA-MoE)アーキテクチャを設計する。
論文 参考訳(メタデータ) (2025-10-24T02:11:05Z) - Timely Clinical Diagnosis through Active Test Selection [49.091903570068155]
本稿では,現実の診断推論をよりうまくエミュレートするためのACTMED (Adaptive Clinical Test selection via Model-based Experimental Design)を提案する。
LLMは柔軟なシミュレータとして機能し、構造化されたタスク固有のトレーニングデータを必要とせずに、患者状態のもっともらしい分布を生成し、信念の更新をサポートする。
我々は、実世界のデータセット上でACTMEDを評価し、診断精度、解釈可能性、リソース使用量を改善するためにテスト選択を最適化できることを示す。
論文 参考訳(メタデータ) (2025-10-21T18:10:45Z) - Simulating Viva Voce Examinations to Evaluate Clinical Reasoning in Large Language Models [51.91760712805404]
大規模言語モデル(LLM)におけるシーケンシャルな臨床推論を評価するためのベンチマークであるVivaBenchを紹介する。
本データセットは,医療訓練における(口頭)検査をシミュレートする対話的シナリオとして構成された1762名の医師による臨床ヴィグネットから構成される。
本分析では,臨床における認知的誤りを反映するいくつかの障害モードを同定した。
論文 参考訳(メタデータ) (2025-10-11T16:24:35Z) - Clinically Grounded Agent-based Report Evaluation: An Interpretable Metric for Radiology Report Generation [32.410641778559544]
ICARE (Interpretable and Clinicallygrounded Agent-based Report Evaluation) は、解釈可能な評価フレームワークである。
2つのエージェントは、それぞれが基礎的真実または生成されたレポートを持ち、臨床的に有意義な質問を発生し、互いにクイズする。
スコアを質問応答ペアにリンクすることで、ICAREは透明で解釈可能な評価を可能にする。
論文 参考訳(メタデータ) (2025-08-04T18:28:03Z) - Adaptive Identification of Populations with Treatment Benefit in
Clinical Trials: Machine Learning Challenges and Solutions [78.31410227443102]
確定的臨床試験において,特定の治療の恩恵を受ける患者サブポピュレーションを適応的に同定する問題について検討した。
サブポピュレーション構築のためのメタアルゴリズムであるAdaGGIとAdaGCPIを提案する。
論文 参考訳(メタデータ) (2022-08-11T14:27:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。