論文の概要: BiomedXPro: Prompt Optimization for Explainable Diagnosis with Biomedical Vision Language Models
- arxiv url: http://arxiv.org/abs/2510.15866v1
- Date: Fri, 17 Oct 2025 17:58:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-20 20:17:34.738565
- Title: BiomedXPro: Prompt Optimization for Explainable Diagnosis with Biomedical Vision Language Models
- Title(参考訳): BiomedXPro: バイオメディカルビジョン言語モデルを用いた説明可能な診断のためのプロンプト最適化
- Authors: Kaushitha Silva, Mansitha Eashwara, Sanduni Ubayasiri, Ruwan Tennakoon, Damayanthi Herath,
- Abstract要約: そこで我々は,解釈可能な自然言語プロンプトの多種多様なアンサンブルを生成するBiomedXProを紹介した。
実験の結果、BiomedXProは最先端のプロンプトチューニング方法よりも一貫して優れていることがわかった。
BiomedXProは、解釈可能なプロンプトの多様なアンサンブルを生成することで、モデル予測の検証可能な基盤を提供する。
- 参考スコア(独自算出の注目度): 0.16419687521433918
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The clinical adoption of biomedical vision-language models is hindered by prompt optimization techniques that produce either uninterpretable latent vectors or single textual prompts. This lack of transparency and failure to capture the multi-faceted nature of clinical diagnosis, which relies on integrating diverse observations, limits their trustworthiness in high-stakes settings. To address this, we introduce BiomedXPro, an evolutionary framework that leverages a large language model as both a biomedical knowledge extractor and an adaptive optimizer to automatically generate a diverse ensemble of interpretable, natural-language prompt pairs for disease diagnosis. Experiments on multiple biomedical benchmarks show that BiomedXPro consistently outperforms state-of-the-art prompt-tuning methods, particularly in data-scarce few-shot settings. Furthermore, our analysis demonstrates a strong semantic alignment between the discovered prompts and statistically significant clinical features, grounding the model's performance in verifiable concepts. By producing a diverse ensemble of interpretable prompts, BiomedXPro provides a verifiable basis for model predictions, representing a critical step toward the development of more trustworthy and clinically-aligned AI systems.
- Abstract(参考訳): 生体医用視覚言語モデルの臨床的導入は、解釈不能な潜伏ベクトルまたは単一のテキストプロンプトを生成するプロンプト最適化技術によって妨げられている。
透明性の欠如と臨床診断の多面的な性質を捉えることの欠如は、様々な観察を統合することに依存し、ハイテイク環境での信頼性を制限している。
そこで本研究では,バイオメディカル知識抽出器と適応最適化器の両方として,大規模言語モデルを活用する進化的フレームワークであるBiomedXProを導入し,疾患診断のための解釈可能な自然言語プロンプトペアの多種多様なアンサンブルを自動生成する。
複数のバイオメディカルベンチマークの実験によると、BiomedXProは最先端のプロンプトチューニング方法、特にデータスカースな数ショット設定で一貫して性能が向上している。
さらに,本分析では,発見プロンプトと統計的に有意な臨床特徴のセマンティックアライメントを強く示し,モデルの性能を検証可能な概念で評価する。
BiomedXProは、解釈可能なプロンプトの多様なアンサンブルを生成することで、モデル予測の検証可能な基盤を提供する。
関連論文リスト
- Intelligent Healthcare Imaging Platform: A VLM-Based Framework for Automated Medical Image Analysis and Clinical Report Generation [0.0]
本稿では,視覚言語モデル(VLM)を活用した医用画像解析のためのインテリジェントマルチモーダルフレームワークを提案する。
このフレームワークはGoogle Gemini 2.5 Flashを統合し、腫瘍を自動的に検出し、CT、MRI、X線、超音波などの複数の画像モダリティで臨床報告を生成する。
論文 参考訳(メタデータ) (2025-09-16T23:15:44Z) - Medical Reasoning in the Era of LLMs: A Systematic Review of Enhancement Techniques and Applications [59.721265428780946]
医学における大きな言語モデル(LLM)は印象的な能力を実現しているが、体系的で透明で検証可能な推論を行う能力に重大なギャップが残っている。
本稿は、この新興分野に関する最初の体系的なレビューを提供する。
本稿では,学習時間戦略とテスト時間メカニズムに分類した推論強化手法の分類法を提案する。
論文 参考訳(メタデータ) (2025-08-01T14:41:31Z) - Explainable Artificial Intelligence in Biomedical Image Analysis: A Comprehensive Survey [14.834301782789277]
我々はXAI法を体系的に分類し,その基礎となる原理,強度,限界をバイオメディカルな文脈で分析する。
説明可能なバイオメディカルAIにおけるマルチモーダル学習と視覚言語モデルの役割について検討する。
論文 参考訳(メタデータ) (2025-07-09T08:42:14Z) - Prompt Mechanisms in Medical Imaging: A Comprehensive Survey [18.072753363565322]
深層学習は医療画像に変革をもたらす。
しかし、その臨床導入は、データの不足、分散シフト、堅牢なタスクの一般化の必要性といった課題によって、しばしば妨げられている。
深層学習モデルを導くための重要な戦略として,プロンプトベースの方法論が登場している。
論文 参考訳(メタデータ) (2025-06-28T03:06:25Z) - Advancing AI Research Assistants with Expert-Involved Learning [84.30323604785646]
大規模言語モデル (LLM) と大規模マルチモーダルモデル (LMM) は、生物医学的な発見を促進することを約束するが、その信頼性は未定である。
ARIEL(AI Research Assistant for Expert-in-the-Loop Learning)は,オープンソースの評価・最適化フレームワークである。
LMMは詳細な視覚的推論に苦しむのに対し、最先端のモデルでは流動性はあるが不完全な要約を生成する。
論文 参考訳(メタデータ) (2025-05-03T14:21:48Z) - UniBiomed: A Universal Foundation Model for Grounded Biomedical Image Interpretation [18.550642453062228]
バイオメディカル画像解釈のための基礎モデルUniBiomedを紹介する。
UniBiomedは正確な診断結果を生成し、対応するバイオメディカルターゲットを同時にセグメンテーションすることができる。
UniBiomedを開発するために,2700万以上の画像,領域アノテーション,テキスト記述を含む大規模データセットをキュレートする。
論文 参考訳(メタデータ) (2025-04-30T05:51:48Z) - An Explainable Biomedical Foundation Model via Large-Scale Concept-Enhanced Vision-Language Pre-training [40.16314726875265]
ConceptCLIPは、最先端の診断精度を達成する最初の説明可能なバイオメディカル基礎モデルである。
本研究では,グローバルな画像テキスト表現と細粒度領域概念関連を同時に学習する,新しいデュアルアライメントアプローチにより,概念CLIPを開発する。
論文 参考訳(メタデータ) (2025-01-26T16:07:11Z) - Uncertainty-aware Medical Diagnostic Phrase Identification and Grounding [72.18719355481052]
MRG(Messical Report Grounding)と呼ばれる新しい課題について紹介する。
MRGは医療報告から診断フレーズとその対応する接地箱を直接エンドツーエンドで識別することを目的としている。
マルチモーダルな大規模言語モデルを用いて診断フレーズを予測する,堅牢で信頼性の高いフレームワークである uMedGround を提案する。
論文 参考訳(メタデータ) (2024-04-10T07:41:35Z) - BiomedGPT: A Generalist Vision-Language Foundation Model for Diverse Biomedical Tasks [68.39821375903591]
汎用AIは、さまざまなデータ型を解釈する汎用性のために、制限に対処する可能性を秘めている。
本稿では,最初のオープンソースかつ軽量な視覚言語基盤モデルであるBiomedGPTを提案する。
論文 参考訳(メタデータ) (2023-05-26T17:14:43Z) - Ambiguous Medical Image Segmentation using Diffusion Models [60.378180265885945]
我々は,グループ洞察の分布を学習することで,複数の可算出力を生成する単一拡散モデルに基づくアプローチを提案する。
提案モデルでは,拡散の固有のサンプリングプロセスを利用してセグメンテーションマスクの分布を生成する。
その結果,提案手法は既存の最先端曖昧なセグメンテーションネットワークよりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-04-10T17:58:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。