論文の概要: Retrieving and Refining: A Hybrid Framework with Large Language Models for Rare Disease Identification
- arxiv url: http://arxiv.org/abs/2405.10440v1
- Date: Thu, 16 May 2024 20:59:28 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-20 17:21:37.790383
- Title: Retrieving and Refining: A Hybrid Framework with Large Language Models for Rare Disease Identification
- Title(参考訳): 検索と精錬: 希少疾患同定のための大規模言語モデルを用いたハイブリッドフレームワーク
- Authors: Jinge Wu, Hang Dong, Zexi Li, Arijit Patra, Honghan Wu,
- Abstract要約: 本研究では,従来の辞書ベースの自然言語処理(NLP)ツールと大規模言語モデル(LLM)の強力な機能を組み合わせた,新しいハイブリッド手法を提案する。
異なるサイズ・領域(一般・医療)の6つの大言語モデル(LLM)における様々なプロンプト戦略を評価する。
- 参考スコア(独自算出の注目度): 4.215595156143688
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The infrequency and heterogeneity of clinical presentations in rare diseases often lead to underdiagnosis and their exclusion from structured datasets. This necessitates the utilization of unstructured text data for comprehensive analysis. However, the manual identification from clinical reports is an arduous and intrinsically subjective task. This study proposes a novel hybrid approach that synergistically combines a traditional dictionary-based natural language processing (NLP) tool with the powerful capabilities of large language models (LLMs) to enhance the identification of rare diseases from unstructured clinical notes. We comprehensively evaluate various prompting strategies on six large language models (LLMs) of varying sizes and domains (general and medical). This evaluation encompasses zero-shot, few-shot, and retrieval-augmented generation (RAG) techniques to enhance the LLMs' ability to reason about and understand contextual information in patient reports. The results demonstrate effectiveness in rare disease identification, highlighting the potential for identifying underdiagnosed patients from clinical notes.
- Abstract(参考訳): 稀な疾患における臨床的プレゼンテーションの頻度と不均一性は、しばしば下垂体症と構造的データセットから除外される。
これは、包括的な分析のために構造化されていないテキストデータを利用する必要がある。
しかし、臨床報告から手動で識別することは困難で本質的な主観的課題である。
そこで本研究では,従来の辞書ベースの自然言語処理(NLP)ツールと大規模言語モデル(LLM)の強力な能力を相乗的に組み合わせて,非構造的臨床ノートからのまれな疾患の識別を強化する,新たなハイブリッドアプローチを提案する。
様々なサイズ・領域(一般・医療)の6つの大言語モデル(LLM)において,様々なプロンプト戦略を総合的に評価した。
この評価は、患者報告における文脈情報の推論と理解能力を高めるため、ゼロショット、少数ショット、検索強化生成(RAG)技術を含む。
その結果, 稀な疾患の鑑別に有効であることが示され, 臨床検査結果から診断下患者を同定する可能性が示唆された。
関連論文リスト
- Memorize and Rank: Elevating Large Language Models for Clinical Diagnosis Prediction [10.403187385041702]
本稿では,自然言語知識と医療実践を橋渡しする臨床診断予測モデルMERAを紹介する。
疾患候補ランキングリストに階層的コントラスト学習を適用し,大規模な意思決定空間の問題を軽減する。
論文 参考訳(メタデータ) (2025-01-28T22:38:45Z) - A Knowledge-enhanced Pathology Vision-language Foundation Model for Cancer Diagnosis [58.85247337449624]
本稿では,疾患知識を階層型セマンティックグループ内のアライメントに組み込む知識強化型視覚言語事前学習手法を提案する。
KEEPはゼロショット癌診断タスクにおいて最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-12-17T17:45:21Z) - Assessing and Enhancing Large Language Models in Rare Disease Question-answering [64.32570472692187]
本稿では,レアな疾患の診断におけるLarge Language Models (LLMs) の性能を評価するために,レアな疾患問合せデータセット(ReDis-QA)を導入する。
ReDis-QAデータセットでは1360の高品質な質問応答ペアを収集し,205の稀な疾患をカバーした。
その後、いくつかのオープンソースのLCMをベンチマークし、希少疾患の診断がこれらのモデルにとって重要な課題であることを示した。
実験の結果,ReCOPは,ReDis-QAデータセット上でのLCMの精度を平均8%向上できることがわかった。
論文 参考訳(メタデータ) (2024-08-15T21:09:09Z) - MMIL: A novel algorithm for disease associated cell type discovery [58.044870442206914]
単一細胞データセットは、しばしば個々の細胞ラベルを欠いているため、病気に関連する細胞を特定することは困難である。
セルレベルの分類器の訓練と校正を可能にする予測手法であるMixture Modeling for Multiple Learning Instance (MMIL)を導入する。
論文 参考訳(メタデータ) (2024-06-12T15:22:56Z) - AutoRD: An Automatic and End-to-End System for Rare Disease Knowledge Graph Construction Based on Ontologies-enhanced Large Language Models [25.966454809890227]
希少な病気は世界中で数百万人に影響を与えるが、その頻度が低いため研究の焦点が限られていることが多い。
近年のLarge Language Models (LLMs) の進歩は, 医療情報の抽出を自動化することを約束している。
本稿では,まれな疾患に関する医療用テキストから情報を自動的に抽出するAutoRDというエンドツーエンドシステムを提案する。
論文 参考訳(メタデータ) (2024-03-01T20:06:39Z) - Multimodal Neurodegenerative Disease Subtyping Explained by ChatGPT [15.942849233189664]
アルツハイマー病は最も多い神経変性疾患である。
現在のデータ駆動型アプローチでは、ADまたは関連する障害の後期段階でサブタイプを分類することができるが、無症状またはプロドロマル段階の予測では困難である。
本稿では,AD患者を早期にサブタイプに分類するために,画像,遺伝学,臨床評価などの早期指標を用いたマルチモーダルフレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-31T19:30:04Z) - Large Language Models with Retrieval-Augmented Generation for Zero-Shot
Disease Phenotyping [1.8630636381951384]
大規模言語モデル(LLM)はテキスト理解の約束を提供するが、実際の臨床文書を効率的に扱うことはできない。
検索拡張生成とMapReduceにより強化されたゼロショットLLM法を提案する。
肺動脈圧の上昇を特徴とする稀な疾患である肺高血圧症(PH)に対して本法を適用した。
論文 参考訳(メタデータ) (2023-12-11T15:45:27Z) - Rare Disease Identification from Clinical Notes with Ontologies and Weak
Supervision [3.6471045233540806]
テキストからUMLSのプロセスは、ドメインの専門家による注釈付きデータなしで、監督の弱さで大幅に改善できることを示す。
解析の結果, パイプライン処理の総放電サマリーは, 病院入院時の手動ICDコードにほとんど含まれていないケースを表面化できることがわかった。
論文 参考訳(メタデータ) (2021-05-05T11:49:09Z) - Inheritance-guided Hierarchical Assignment for Clinical Automatic
Diagnosis [50.15205065710629]
臨床診断は、臨床ノートに基づいて患者に診断符号を割り当てることを目的としており、臨床意思決定において重要な役割を担っている。
本稿では,臨床自動診断のための継承誘導階層と共起グラフの伝播を組み合わせた新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-01-27T13:16:51Z) - Graph-Evolving Meta-Learning for Low-Resource Medical Dialogue
Generation [150.52617238140868]
ソース疾患からターゲット疾患へ診断経験を移すために、低リソースの医療対話生成を提案します。
また,新しい疾患の症状相関を推論するためのコモンセンスグラフの進化を学習するグラフ進化メタラーニングフレームワークを開発した。
論文 参考訳(メタデータ) (2020-12-22T13:20:23Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。