論文の概要: LLM-Guided Evolution for Medical Decision Pipelines
- arxiv url: http://arxiv.org/abs/2606.07342v1
- Date: Fri, 05 Jun 2026 14:53:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.797321
- Title: LLM-Guided Evolution for Medical Decision Pipelines
- Title(参考訳): 医療用パイプラインのLCMガイドによる進化
- Authors: Ivan Sviridov, Artem Oskin, Ivan Panin, Iaroslav Bespalov, Dmitry Dylov, Ivan Oseledets, Aleksandr Nesterov,
- Abstract要約: LLM誘導MAP-Elitesの進化を医学的意思決定戦略の発見のための推論時代替として検討する。
我々は,タスク固有の適合関数によって最適化された実行可能アーティファクトの進化的探索として,トリアージ,インタラクティブコンサルテーション,医用画像分類を定式化する。
- 参考スコア(独自算出の注目度): 36.34631320654623
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Adapting large language models (LLMs) to clinical workflows often requires costly fine-tuning or manual prompt and pipeline engineering. We study LLM-guided MAP-Elites evolution as an inference-time alternative for discovering medical decision strategies and provide an implementation repository at https://github.com/univanxx/llm_guided_evo_medical. We formulate urgency triage, interactive consultation, and medical image classification as evolutionary searches over executable artifacts optimized by task-specific fitness functions. Across all three settings, evolution improves over manually designed baselines under practical constraints. In triage, evolved programs increase Semigran accuracy from $77.3\%$ to $87.1\%$ and emergency recall from $0.60$ to $0.97$, while improving safety-weighted held-out MIMIC-ESI performance. In interactive consultation, evolved policies improve the accuracy--cost frontier across Llama-3, Qwen-3.5, and Gemma-4 and transfer to held-out iCRAFTMD. In PneumoniaMNIST, prompt-only evolution improves frozen MedGemma VLMs while preserving strict JSON outputs. Qualitative analysis shows that the gains come from interpretable program-level mechanisms, calibrated triage boundaries, targeted evidence acquisition, selective commitment, and finding-oriented visual decision rules, rather than superficial prompt rewording alone.
- Abstract(参考訳): 大規模言語モデル(LLM)を臨床ワークフローに適合させるには、手動のプロンプトとパイプラインエンジニアリングのコストがかかることが多い。
我々は LLM 誘導 MAP-Elites の進化を,医学的意思決定戦略を発見するための推論時代替手段として検討し, https://github.com/univanxx/llm_guided_evo_medical で実装リポジトリを提供する。
タスク固有のフィットネス機能によって最適化された実行可能アーティファクトの進化的探索として、緊急トリアージ、インタラクティブコンサルテーション、医用画像分類を定式化する。
これら3つの設定全体で、実践的な制約の下で手作業で設計されたベースラインよりも進化が改善される。
トリアージでは、進化したプログラムは、セミグラの精度を7.3.%から87.1.%に引き上げ、緊急時のリコールを0.60ドルから0.97ドルに引き上げ、安全性に富んだMIMIC-ESIのパフォーマンスを改善した。
インタラクティブなコンサルティングにおいて、進化したポリシーは、Llama-3、Qwen-3.5、Gemma-4をまたいだ精度・コストのフロンティアを改善し、保留中のiCRAFTMDに転送する。
PneumoniaMNISTでは、プロンプトのみの進化は、厳格なJSON出力を保持しながら、凍結したMedGemma VLMを改善する。
質的な分析は、プログラムレベルのメカニズム、校正されたトリアージ境界、標的となる証拠の取得、選択的なコミットメント、探索指向の視覚的決定規則から得られる利益が、表面的なプロンプトの言い換えだけでは得られないことを示している。
関連論文リスト
- MedSeqFT: Sequential Fine-tuning Foundation Models for 3D Medical Image Segmentation [55.37355146924576]
MedSeqFTは、医用画像解析のためのシーケンシャルな微調整フレームワークである。
事前訓練されたモデルを新しいタスクに適応させ、表現能力を改善する。
最先端の微調整戦略を一貫して上回ります。
論文 参考訳(メタデータ) (2025-09-07T15:22:53Z) - Med-R$^3$: Enhancing Medical Retrieval-Augmented Reasoning of LLMs via Progressive Reinforcement Learning [25.67288561609553]
本稿では、**Med-R$3$*, a*Med*ical **R**etrieval-augmented **R**easoning framework driven by Progress **R**einforcement learningを紹介する。
本稿ではまず,医学的問題に対する論理的推論を行うモデルの開発を行う。
次に,知識コーパスの特性と外部情報の利用性に適合するように,検索機能を適応的に最適化する。
論文 参考訳(メタデータ) (2025-07-31T13:31:01Z) - Assessing and Mitigating Medical Knowledge Drift and Conflicts in Large Language Models [11.003805668697117]
大規模言語モデル(LLM)は医療の分野で大きな可能性を秘めているが、急速に発展する医療知識に適応する上で大きな課題に直面している。
本研究は, LLMが臨床ガイドラインの進展にどう反応するかを考察し, 概念の漂流と内的矛盾に着目した。
4,290のシナリオにまたがる7つの最先端モデルの評価は、時代遅れのレコメンデーションを拒絶することの難しさを証明した。
論文 参考訳(メタデータ) (2025-05-12T18:08:02Z) - Structured Outputs Enable General-Purpose LLMs to be Medical Experts [50.02627258858336]
大規模言語モデル(LLM)は、しばしばオープンエンドの医学的問題に苦しむ。
本稿では,構造化医療推論を利用した新しいアプローチを提案する。
我々の手法は85.8のファクチュアリティスコアを達成し、微調整されたモデルを上回る。
論文 参考訳(メタデータ) (2025-03-05T05:24:55Z) - MMed-RAG: Versatile Multimodal RAG System for Medical Vision Language Models [49.765466293296186]
近年,Med-LVLM (Med-LVLMs) の進歩により,対話型診断ツールの新たな可能性が高まっている。
Med-LVLMは、しばしば事実の幻覚に悩まされ、誤った診断につながることがある。
我々は,Med-LVLMの現実性を高めるために,多目的マルチモーダルRAGシステムMMed-RAGを提案する。
論文 参考訳(メタデータ) (2024-10-16T23:03:27Z) - Large Language Model Distilling Medication Recommendation Model [58.94186280631342]
大規模言語モデル(LLM)の強力な意味理解と入力非依存特性を利用する。
本研究は, LLMを用いて既存の薬剤推奨手法を変換することを目的としている。
これを軽減するため,LLMの習熟度をよりコンパクトなモデルに伝達する機能レベルの知識蒸留技術を開発した。
論文 参考訳(メタデータ) (2024-02-05T08:25:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。