論文の概要: TheraAgent: Multi-Agent Framework with Self-Evolving Memory and Evidence-Calibrated Reasoning for PET Theranostics
- arxiv url: http://arxiv.org/abs/2603.13676v1
- Date: Sat, 14 Mar 2026 00:50:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-17 16:19:35.336404
- Title: TheraAgent: Multi-Agent Framework with Self-Evolving Memory and Evidence-Calibrated Reasoning for PET Theranostics
- Title(参考訳): TheraAgent:PET Theranosticsのための自己進化記憶とエビデンス校正推論を備えたマルチエージェントフレームワーク
- Authors: Zhihao Chen, Jiahui Wang, Yizhou Chen, Xiaozhong Ji, Xiaobin Hu, Jimin Hong, Wolfram Andreas Bosbach, Axel Rominger, Ali Afshar-Oromieh, Hongming Shan, Kuangyu Shi,
- Abstract要約: TheraAgentは、PET Theranosticsの最初のエージェント・フレームワークであり、3つのコア・イノベーションがある。
TheraAgentは、実際の患者で75.7%、合成ケースで87.0%、MDAgentsとMedAgent-Proを20%以上上回っている。
- 参考スコア(独自算出の注目度): 39.42148615773585
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: PET theranostics is transforming precision oncology, yet treatment response varies substantially; many patients receiving 177Lu-PSMA radioligand therapy (RLT) for metastatic castration-resistant prostate cancer (mCRPC) fail to respond, demanding reliable pre-therapy prediction. While LLM-based agents have shown remarkable potential in complex medical diagnosis, their application to PET theranostic outcome prediction remains unexplored, which faces three key challenges: (1) data and knowledge scarcity: RLT was only FDA-approved in 2022, yielding few training cases and insufficient domain knowledge in general LLMs; (2) heterogeneous information integration: robust prediction hinges on structured knowledge extraction from PET/CT, laboratory tests, and free-text clinical documentation; (3) evidence-grounded reasoning: clinical decisions must be anchored in trial evidence rather than LLM hallucinations. In this paper, we present TheraAgent, to our knowledge, the first agentic framework for PET theranostics, with three core innovations: (1) Multi-Expert Feature Extraction with Confidence-Weighted Consensus, where three specialized experts process heterogeneous inputs with uncertainty quantification; (2) Self-Evolving Agentic Memory (SEA-Mem), which learns prognostic patterns from accumulated cases, enabling case-based reasoning from limited data; (3) Evidence-Calibrated Reasoning, integrating a curated theranostics knowledge base to ground predictions in VISION/TheraP trial evidence. Evaluated on 35 real patients and 400 synthetic cases, TheraAgent achieves 75.7% overall accuracy on real patients and 87.0% on synthetic cases, outperforming MDAgents and MedAgent-Pro by over 20%. These results highlight a promising blueprint for trustworthy AI agents in PET theranostics, enabling trial-calibrated, multi-source decision support. Code will be released upon acceptance.
- Abstract(参考訳): 177Lu-PSMAラジオリガンド療法(RLT)を施行した多くの患者は、mCRPC(mCRPC)に対する反応が得られず、確実なプレセラピー予測を必要としている。
データと知識の不足: RLTは2022年にFDAによって承認され、訓練ケースは少なく、一般のLLMではドメイン知識が不足している。
本稿では,PET セラノスティックの最初のエージェント・フレームワークである TheraAgent について,(1) 専門専門家3人が不確実な定量化で不均一な入力を処理するマルチエキスパート特徴抽出,(2) 蓄積されたケースから予後パターンを学習するセルフ進化エージェント記憶,(3) 限定データからケースベース推論を可能にする,(3) 検証済みセラノスティック知識ベースをVision/TheraP 試験証拠に組み込んだ,3つの中心的革新について述べる。
35人の実際の患者と400人の合成患者で評価され、TheraAgentは実際の患者で75.7%、合成ケースで87.0%、MDAgentsとMedAgent-Proを20%以上上回っている。
これらの結果は、PET Theranosticsにおける信頼できるAIエージェントのための有望な青写真を強調し、トライアル校正されたマルチソース決定サポートを可能にした。
コードは受理時にリリースされる。
関連論文リスト
- PET-F2I: A Comprehensive Benchmark and Parameter-Efficient Fine-Tuning of LLMs for PET/CT Report Impression Generation [25.57267405761328]
LLMを用いたPET/CT印象生成のための大規模ベンチマークであるPET-F2I-41K(PET Findings-to-Impression Benchmark)を紹介する。
PET-F2I-41K を用いて,プロプライエタリなフロンティア LLM,オープンソースジェネラリストモデル,医療ドメイン LLM にまたがる27モデルの総合的な評価を行う。
PET-F2I-7Bは、最強のベースラインよりも大幅に向上し、エンティティカバレッジが3.0倍向上する。
論文 参考訳(メタデータ) (2026-03-11T09:08:25Z) - A Multi-Agent Framework for Medical AI: Leveraging Fine-Tuned GPT, LLaMA, and DeepSeek R1 for Evidence-Based and Bias-Aware Clinical Query Processing [0.4349324020366305]
大規模言語モデル(LLM)は、医療問題に対する回答を約束するが、臨床的使用は、弱い検証、不十分な証拠の根拠、信頼できない信頼のシグナルによって制限される。
本稿では,補完的なLCMとエビデンス検索,不確実性推定,バイアスチェックを組み合わせて回答信頼性を向上させるマルチエージェント医療QAフレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-15T14:17:27Z) - Unveiling and Bridging the Functional Perception Gap in MLLMs: Atomic Visual Alignment and Hierarchical Evaluation via PET-Bench [48.60251555171943]
MLLM(Multimodal Large Language Models)は、異常検出や解剖学的モダリティのレポート生成などのタスクにおいて、顕著な熟練性を示した。
本研究では, 機能的トレーサの生体分布を, 形態的先行性とは無関係に復号化できない現状の視覚エンコーダについて, 基本的な機能的知覚ギャップを定量化する。
PET-Benchは52,308個の階層型QAペアからなるPET-Benchの最初の大規模機能評価ベンチマークである。
AVAは認知ギャップを効果的に橋渡しし、CoTを幻覚源から頑健な推論ツールに変換し、診断を改善していることを示す。
論文 参考訳(メタデータ) (2026-01-06T05:58:50Z) - SurvAgent: Hierarchical CoT-Enhanced Case Banking and Dichotomy-Based Multi-Agent System for Multimodal Survival Prediction [49.355973075150075]
マルチモーダルサバイバル予測のための最初の階層的チェーン・オブ・シント(CoT)強化マルチエージェントシステムであるSurvAgentを紹介する。
SurvAgentは2つの段階から構成される: WSI-Gene CoT-Enhanced Case Bank Constructionは、低磁化スクリーニング、クロスモーダル類似性-アウェアパッチマイニング、および病理画像に対する信頼-アウェアパッチマイニングを通じて階層解析を使用する。
二分法に基づくMulti-Expert Agent Inferenceは、RAGを介して類似の事例を検索し、段階的間隔改善による専門家予測とマルチモーダルレポートを統合する。
論文 参考訳(メタデータ) (2025-11-20T18:41:44Z) - Rethinking Retrieval-Augmented Generation for Medicine: A Large-Scale, Systematic Expert Evaluation and Practical Insights [42.23030568766672]
大きな言語モデル(LLM)は医学の風景を変えつつある。
Retrieval-augmented Generation (RAG) はこれらの制限に対処するために広く採用されている。
今回,医学におけるRAGの総合的評価について紹介する。
論文 参考訳(メタデータ) (2025-11-10T06:00:12Z) - A Multi-Agent Approach to Neurological Clinical Reasoning [0.0]
大規模言語モデル(LLM)は医学領域において有望であるが、専門的な神経学的推論を扱う能力は体系的な評価を必要とする。
我々は,イスラエルの神経学の認定試験から305の質問を用いたベンチマークを開発した。
ベースモデル,検索拡張生成(RAG),新しいマルチエージェントシステムを用いて10個のLLMを評価した。
論文 参考訳(メタデータ) (2025-08-10T14:52:27Z) - Agentic large language models improve retrieval-based radiology question answering [4.208637377704778]
Radiology Retrieval and Reasoning (RaR)は、放射線学的質問応答のための多段階の検索および推論フレームワークである。
RaRはゼロショットプロンプトや従来のオンラインRAGよりも平均診断精度が有意に向上した。
RaRの検索は幻覚を減少させ(平均9.4%)、臨床的に関連のあるコンテキストを46%の症例で検索した。
論文 参考訳(メタデータ) (2025-08-01T16:18:52Z) - An Agentic System for Rare Disease Diagnosis with Traceable Reasoning [69.46279475491164]
大型言語モデル(LLM)を用いた最初のまれな疾患診断エージェントシステムであるDeepRareを紹介する。
DeepRareは、まれな疾患の診断仮説を分類し、それぞれに透明な推論の連鎖が伴う。
このシステムは2,919の疾患に対して異常な診断性能を示し、1013の疾患に対して100%の精度を達成している。
論文 参考訳(メタデータ) (2025-06-25T13:42:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。