論文の概要: LA-MARRVEL: A Knowledge-Grounded and Language-Aware LLM Reranker for AI-MARRVEL in Rare Disease Diagnosis
- arxiv url: http://arxiv.org/abs/2511.02263v3
- Date: Thu, 06 Nov 2025 03:00:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-07 13:46:06.492627
- Title: LA-MARRVEL: A Knowledge-Grounded and Language-Aware LLM Reranker for AI-MARRVEL in Rare Disease Diagnosis
- Title(参考訳): LA-MARRVEL:レア疾患診断におけるAI-MARRVELのための知識と言語を意識したLLMリランカ
- Authors: Jaeyeon Lee, Hyun-Hwan Jeong, Zhandong Liu,
- Abstract要約: 大規模言語モデル(LLM)はそのようなテキストを読むことができるが、臨床利用には正確な知識と安定的で反復可能な行動の基盤が必要である。
LA-MARRVELには3つの部分がある: 表現型と疾患情報を豊かにする専門家工学的コンテキスト、複数のLSMを組み合わせた投票アルゴリズムが実行され、コンセンサスにランク付けされた遺伝子リストを選択する。
- 参考スコア(独自算出の注目度): 6.8308581520283225
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diagnosing rare diseases requires linking gene findings with often unstructured reference text. Current pipelines collect many candidate genes, but clinicians still spend a lot of time filtering false positives and combining evidence from papers and databases. A key challenge is language: phenotype descriptions and inheritance patterns are written in prose, not fully captured by tables. Large language models (LLMs) can read such text, but clinical use needs grounding in citable knowledge and stable, repeatable behavior. We explore a knowledge-grounded and language-aware reranking layer on top of a high-recall first-stage pipeline. The goal is to improve precision and explainability, not to replace standard bioinformatics steps. We use expert-built context and a consensus method to reduce LLM variability, producing shorter, better-justified gene lists for expert review. LA-MARRVEL achieves the highest accuracy, outperforming other methods -- including traditional bioinformatics diagnostic tools (AI-MARRVEL, Exomiser, LIRICAL) and naive large language models (e.g., Anthropic Claude) -- with an average Recall@5 of 94.10%, a +3.65 percentage-point improvement over AI-MARRVEL. The LLM-generated reasoning provides clear prose on phenotype matching and inheritance patterns, making clinical review faster and easier. LA-MARRVEL has three parts: expert-engineered context that enriches phenotype and disease information; a ranked voting algorithm that combines multiple LLM runs to choose a consensus ranked gene list; and the AI-MARRVEL pipeline that provides first-stage ranks and gene annotations, already known as a state-of-the-art method in Rare Disease Diagnosis on BG, DDD, and UDN cohorts. The online AI-MARRVEL includes LA-MARRVEL as an LLM feature at https://ai.marrvel.org . We evaluate LA-MARRVEL on three datasets from independent cohorts of real-world diagnosed patients.
- Abstract(参考訳): 稀な疾患の診断には、しばしば構造化されていない参照テキストと遺伝子発見を関連付ける必要がある。
現在のパイプラインは多くの候補遺伝子を集めているが、臨床医は偽陽性をフィルタリングし、論文とデータベースの証拠を組み合わせるのに多くの時間を費やしている。
表現型記述と継承パターンは散文で書かれており、テーブルによって完全にキャプチャされていない。
大規模言語モデル(LLM)はそのようなテキストを読むことができるが、臨床利用には正確な知識と安定的で反復可能な行動の基盤が必要である。
我々は,ハイリコールファーストステージパイプライン上に,知識ベースで言語対応の階層を配置する。
目標は、標準的なバイオインフォマティクスのステップを置き換えるのではなく、精度と説明性を改善することである。
我々は、専門家が構築したコンテキストとコンセンサス手法を用いて、LSMの多様性を低減し、専門家レビューのために、より短く、より適切な遺伝子リストを生成する。
LA-MARRVELは、従来のバイオインフォマティクス診断ツール(AI-MARRVEL、Exomiser、LIRICAL)や、AI-MARRVELよりも3.65ポイント向上した平均的なRecall@5(94.10%)で、大きな言語モデル(例えば、Arthhropic Claude)などよりも高い精度を実現している。
LLMが生成する推論は、表現型マッチングと継承パターンの明確な散文を提供し、臨床レビューを迅速かつ容易にする。
LA-MARRVELには3つの部分がある: 表現型と疾患情報を豊かにする専門家工学的コンテキスト、複数のLSMを組み合わせたランク投票アルゴリズムは、コンセンサスされたランク付けされた遺伝子リストを選択するために実行され、AI-MARRVELパイプラインは、すでにBG、DDD、UDNコホート上で、レア病診断における最先端の方法として知られている第1段階のランク付けと遺伝子アノテーションを提供する。
オンラインAI-MARRVELには、 https://ai.marrvel.org で LLM 機能として LA-MARRVEL が含まれている。
LA-MARRVELを実地診断患者の独立したコホートから抽出した3つのデータセットで評価した。
関連論文リスト
- Knowledge Elicitation with Large Language Models for Interpretable Cancer Stage Identification from Pathology Reports [2.5829043503611318]
本稿では,大きな言語モデルによるがんステージングのためのドメイン固有のルールの推論と適用を可能にすることにより,制限を克服する2つの知識抽出手法を提案する。
1つ目は、KEwLTM(Knowledge Elicitation with Long-Term Memory)で、未発表の病理報告から直接ステージングルールを導出するために反復的なプロンプト戦略を使用している。
第2のKEwRAG(Knowledge Elicitation with Retrieval-Augmented Generation)では、ルールを関連するガイドラインから1ステップで事前抽出し、適用することで、解釈可能性を高め、繰り返しのリカバリオーバーヘッドを回避するという、RAGのバリエーションを採用している。
論文 参考訳(メタデータ) (2025-11-02T19:00:40Z) - HeteroRAG: A Heterogeneous Retrieval-Augmented Generation Framework for Medical Vision Language Tasks [22.597677744620295]
We present HeteroRAG, a novel framework that enhances Med-LVLMs through heterogeneous knowledge sources。
HeteroRAGは、ほとんどの医療ビジョン言語ベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-08-18T09:54:10Z) - Leaps Beyond the Seen: Reinforced Reasoning Augmented Generation for Clinical Notes [10.897880916802864]
ReinRAG (ReinRAG) は、入力前情報に基づく長期放電命令のための推論拡張生成(RAG)である。
情報ギャップを埋めるため,グループ正規化報酬による検索品質の向上を目的としたグループベースレトリバー最適化(GRO)を提案する。
実世界のデータセットの実験では、ReinRAGは臨床効果と自然言語生成の指標の両方においてベースラインを上回っている。
論文 参考訳(メタデータ) (2025-06-03T12:59:52Z) - A Multimodal Multi-Agent Framework for Radiology Report Generation [2.1477122604204433]
放射線診断レポート生成(RRG)は、医療画像から診断レポートを自動生成することを目的としている。
本稿では,段階的臨床推論ワークフローに適合するRRG用マルチモーダルマルチエージェントフレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-14T20:28:04Z) - Survey and Improvement Strategies for Gene Prioritization with Large Language Models [61.24568051916653]
大規模言語モデル (LLM) は, 医学検査において良好に機能しているが, 希少な遺伝疾患の診断における有効性は評価されていない。
表現型と可溶性レベルに基づいて, マルチエージェントとヒトフェノタイプオントロジー(HPO)を分類した。
ベースラインでは、GPT-4は他のLLMよりも優れており、因果遺伝子を正しくランク付けする際の精度は30%近く向上した。
論文 参考訳(メタデータ) (2025-01-30T23:03:03Z) - MMed-RAG: Versatile Multimodal RAG System for Medical Vision Language Models [49.765466293296186]
近年,Med-LVLM (Med-LVLMs) の進歩により,対話型診断ツールの新たな可能性が高まっている。
Med-LVLMは、しばしば事実の幻覚に悩まされ、誤った診断につながることがある。
我々は,Med-LVLMの現実性を高めるために,多目的マルチモーダルRAGシステムMMed-RAGを提案する。
論文 参考訳(メタデータ) (2024-10-16T23:03:27Z) - KARGEN: Knowledge-enhanced Automated Radiology Report Generation Using Large Language Models [39.831976458410864]
本稿では,大規模言語モデルに基づく知識向上型自動放射線学レポートジェネレーションフレームワークであるKARGENについて述べる。
このフレームワークは、LLM内の胸部疾患関連知識を解き放つための知識グラフを統合し、生成された報告の臨床的有用性を高める。
提案手法はMIMIC-CXRとIU-Xrayのデータセットに対して有望な結果を示す。
論文 参考訳(メタデータ) (2024-09-09T06:57:22Z) - Assessing and Enhancing Large Language Models in Rare Disease Question-answering [64.32570472692187]
本稿では,レアな疾患の診断におけるLarge Language Models (LLMs) の性能を評価するために,レアな疾患問合せデータセット(ReDis-QA)を導入する。
ReDis-QAデータセットでは1360の高品質な質問応答ペアを収集し,205の稀な疾患をカバーした。
その後、いくつかのオープンソースのLCMをベンチマークし、希少疾患の診断がこれらのモデルにとって重要な課題であることを示した。
実験の結果,ReCOPは,ReDis-QAデータセット上でのLCMの精度を平均8%向上できることがわかった。
論文 参考訳(メタデータ) (2024-08-15T21:09:09Z) - Cross-Modal Causal Intervention for Medical Report Generation [107.76649943399168]
放射線医学報告生成(RRG)は, コンピュータ支援診断と薬剤指導に不可欠である。
視覚言語的バイアスによる急激な相関により、正確な病変記述の生成は依然として困難である。
我々はCrossModal Causal Representation Learning (CMCRL)という2段階のフレームワークを提案する。
IU-XrayとMIMIC-CXRの実験により、我々のCMCRLパイプラインは最先端の手法よりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2023-03-16T07:23:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。