論文の概要: Learning from Medical Entity Trees: An Entity-Centric Medical Data Engineering Framework for MLLMs
- arxiv url: http://arxiv.org/abs/2604.25296v1
- Date: Tue, 28 Apr 2026 07:05:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-29 16:49:17.74672
- Title: Learning from Medical Entity Trees: An Entity-Centric Medical Data Engineering Framework for MLLMs
- Title(参考訳): 医療エンティティツリーから学ぶ:MLLMのためのエンティティ中心の医療データエンジニアリングフレームワーク
- Authors: Jianghang Lin, Haihua Yang, Deli Yu, Kai Wu, Kai Ye, Jinghao Lin, Zihan Wang, Yuhang Wu, Liujuan Cao,
- Abstract要約: MLLM(Multimodal Large Language Models)は、医療応用における変革の可能性を示しているが、その性能は従来のデータキュレーション戦略によって妨げられている。
本稿では,Entity-Centric Medical Data Engineering フレームワークを提案する。
我々は権威ある医学文献からエンティティを自動的に抽出し、疾患、解剖学的構造、モダリティ、症状を体系的に統合された知識リポジトリにエンコードする階層構造であるメディカルエンティティツリー(MET)を構築する。
- 参考スコア(独自算出の注目度): 34.87373678921793
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multimodal Large Language Models (MLLMs) have shown transformative potential in medical applications, yet their performance is hindered by conventional data curation strategies that rely on coarse-grained partitioning by modality or department. Such fragmented approaches fail to capture the hierarchical and interconnected nature of clinical medical knowledge, limiting the models' ability to perform fine-grained recognition and complex reasoning. In this paper, we propose a novel Entity-Centric Medical Data Engineering framework. We automatically extract entities from authoritative medical literature to construct a Medical Entity Tree (MET), a hierarchical structure that systematically encodes diseases, anatomical structures, modalities, and symptoms into a unified knowledge repository. Building upon the MET, we propose an advanced data engine that includes: (1) node-guided retrieval to anchor raw data to specific medical concepts, (2) a two-stage hybrid filtering and alignment pipeline to ensure precise visual-semantic correspondence, and (3) knowledge-aware data synthesis to generate enriched captions and targeted reasoning VQA pairs, leveraging structural constraints. Extensive evaluations across six medical benchmarks demonstrate that our approach significantly enhances the medical capabilities of general-purpose MLLMs, improving their ability to handle complex clinical queries and achieve state-of-the-art performance in diverse medical contexts.
- Abstract(参考訳): MLLM(Multimodal Large Language Models)は、医療応用における変革の可能性を示しているが、その性能は、粗い粒度の分割に依存する従来のデータキュレーション戦略によって妨げられている。
このような断片化されたアプローチは、臨床医学知識の階層的および相互接続的な性質を捉えることができず、モデルが微粒な認識と複雑な推論を行う能力を制限する。
本稿では,新しいEntity-Centric Medical Data Engineeringフレームワークを提案する。
我々は権威ある医学文献からエンティティを自動的に抽出し、疾患、解剖学的構造、モダリティ、症状を体系的に統合された知識リポジトリにエンコードする階層構造であるメディカルエンティティツリー(MET)を構築する。
本稿では,(1)特定の医学的概念に生データを固定するためのノード誘導検索,(2)正確な視覚的意味的対応を保証するための2段階のハイブリッドフィルタリングとアライメントパイプライン,(3)豊富なキャプションを生成するための知識認識データ合成,そして,構造的制約を活用するためのVQAペアをターゲットとするVQAペアをターゲットとする,高度なデータエンジンを提案する。
6つの医学ベンチマークを総合的に比較したところ,本手法は汎用MLLMの医療能力を大幅に向上させ,複雑な臨床クエリを処理し,様々な医学的文脈で最先端のパフォーマンスを達成する能力を向上させることが示唆された。
関連論文リスト
- MED-COPILOT: A Medical Assistant Powered by GraphRAG and Similar Patient Case Retrieval [12.265116154395434]
MED-COPILOTは,臨床医と研修医を対象としたインタラクティブな臨床意思決定支援システムである。
このシステムはWHOとNICEのガイドラインから構造化知識グラフを構築し、効率的な検索にコミュニティレベルの要約を適用し、36,000ケースの類似患者データベースを維持している。
論文 参考訳(メタデータ) (2026-02-28T04:32:03Z) - MedVerse: Efficient and Reliable Medical Reasoning via DAG-Structured Parallel Execution [63.128360383691295]
複雑な医学推論のための推論フレームワークであるMedVerseを提案する。
データ作成には、知識に基づく医学推論経路を合成するMedVerse Curatorを導入する。
我々は、追加のオーバーヘッドを伴わずに並列実行をサポートするカスタマイズされた推論エンジンを開発した。
論文 参考訳(メタデータ) (2026-02-07T12:54:01Z) - Evaluating Strategies for Synthesizing Clinical Notes for Medical Multimodal AI [1.8648093673053043]
バイオメディカル人工知能(AI)応用において,マルチモーダル(MM)学習は有望なパラダイムとして浮上している。
本研究は, 迅速な設計と医用メタデータの包摂の観点から, 合成テキスト臨床ノートを作成するための戦略について検討する。
論文 参考訳(メタデータ) (2025-11-26T19:01:12Z) - Utilizing Large Language Models for Zero-Shot Medical Ontology Extension from Clinical Notes [13.564947974902429]
CLOZEは大規模言語モデル(LLM)を用いて臨床ノートから医療機関を自動的に抽出する新しいフレームワークである。
CLOZEは、言語理解と事前訓練されたLLMの広範な知識を活かして、病気に関連する概念を効果的に識別し、複雑な階層関係を捉える。
論文 参考訳(メタデータ) (2025-11-20T17:00:46Z) - Lingshu: A Generalist Foundation Model for Unified Multimodal Medical Understanding and Reasoning [57.873833577058]
医療知識の豊富なマルチモーダルデータセットを構築した。
次に医学専門のMLLMであるLingshuを紹介します。
Lingshuは、医療専門知識の組み込みとタスク解決能力の向上のために、マルチステージトレーニングを行っている。
論文 参考訳(メタデータ) (2025-06-08T08:47:30Z) - MedBookVQA: A Systematic and Comprehensive Medical Benchmark Derived from Open-Access Book [5.318470975871017]
MedBookVQAは、オープンアクセス医療教科書から派生した、体系的で包括的なマルチモーダルベンチマークである。
当科では, モダリティ認識, 分類, 解剖学的診断, 症状診断, 外科的手術を含む, 5000の臨床的関連質問項目を作成した。
我々は、プロプライエタリ、オープンソース、医療、推論モデルを含む幅広いMLLMを評価し、タスクタイプとモデルカテゴリ間での大幅なパフォーマンス格差を明らかにした。
論文 参考訳(メタデータ) (2025-06-01T06:28:36Z) - Large Language Models for Biomedical Knowledge Graph Construction:
Information extraction from EMR notes [0.0]
大規模言語モデル(LLM)に基づくエンドツーエンド機械学習ソリューションを提案する。
KG構築プロセスで使用される物質は、疾患、因子、治療、および疾患を経験中に患者と共存する症状である。
提案手法の応用は加齢に伴う黄斑変性に対して実証される。
論文 参考訳(メタデータ) (2023-01-29T15:52:33Z) - A Meta-embedding-based Ensemble Approach for ICD Coding Prediction [64.42386426730695]
国際疾病分類 (icd) は、世界中で臨床コーディングに使われているデファクトコードである。
これらのコードにより、医療提供者は償還を請求し、診断情報の効率的な保管と検索を容易にします。
提案手法は,日常的な医学データと科学論文の外部知識を用いて,効果的に単語ベクトルを訓練することにより,神経モデルの性能を高める。
論文 参考訳(メタデータ) (2021-02-26T17:49:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。