論文の概要: Utilizing Large Language Models for Zero-Shot Medical Ontology Extension from Clinical Notes
- arxiv url: http://arxiv.org/abs/2511.16548v1
- Date: Thu, 20 Nov 2025 17:00:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-21 17:08:52.741729
- Title: Utilizing Large Language Models for Zero-Shot Medical Ontology Extension from Clinical Notes
- Title(参考訳): 臨床ノートからのゼロショット医療オントロジー拡張のための大規模言語モデルの利用
- Authors: Guanchen Wu, Yuzhang Xie, Huanwei Wu, Zhe He, Hui Shao, Xiao Hu, Carl Yang,
- Abstract要約: CLOZEは大規模言語モデル(LLM)を用いて臨床ノートから医療機関を自動的に抽出する新しいフレームワークである。
CLOZEは、言語理解と事前訓練されたLLMの広範な知識を活かして、病気に関連する概念を効果的に識別し、複雑な階層関係を捉える。
- 参考スコア(独自算出の注目度): 13.564947974902429
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Integrating novel medical concepts and relationships into existing ontologies can significantly enhance their coverage and utility for both biomedical research and clinical applications. Clinical notes, as unstructured documents rich with detailed patient observations, offer valuable context-specific insights and represent a promising yet underutilized source for ontology extension. Despite this potential, directly leveraging clinical notes for ontology extension remains largely unexplored. To address this gap, we propose CLOZE, a novel framework that uses large language models (LLMs) to automatically extract medical entities from clinical notes and integrate them into hierarchical medical ontologies. By capitalizing on the strong language understanding and extensive biomedical knowledge of pre-trained LLMs, CLOZE effectively identifies disease-related concepts and captures complex hierarchical relationships. The zero-shot framework requires no additional training or labeled data, making it a cost-efficient solution. Furthermore, CLOZE ensures patient privacy through automated removal of protected health information (PHI). Experimental results demonstrate that CLOZE provides an accurate, scalable, and privacy-preserving ontology extension framework, with strong potential to support a wide range of downstream applications in biomedical research and clinical informatics.
- Abstract(参考訳): 新規な医学概念と既存のオントロジーへの関連性の統合は、生体医学研究と臨床応用の両方において、その範囲と有用性を大幅に向上させる可能性がある。
臨床ノートは、詳細な患者の観察に富んだ構造化されていない文書として、貴重なコンテキスト特有の洞察を提供し、オントロジー拡張のための有望で未使用のソースを表現している。
この可能性にもかかわらず、オントロジー拡張のために臨床ノートを直接活用することは、ほとんど未発見のままである。
このギャップに対処するため,CLOZEは大規模言語モデル(LLM)を用いて臨床ノートから医療エンティティを自動的に抽出し,それらを階層的な医療オントロジーに統合する新しいフレームワークである。
CLOZEは、学習済みのLLMの強力な言語理解と広範な生物医学的知識を活用することにより、疾患に関連する概念を効果的に識別し、複雑な階層的関係を捉える。
ゼロショットフレームワークは、追加のトレーニングやラベル付きデータを必要としないため、コスト効率のよいソリューションである。
さらに、CLOZEは保護された健康情報(PHI)を自動削除することで患者のプライバシーを確保する。
実験により,CLOZEは,生物医学研究や臨床情報学において,幅広い下流の応用を支援する可能性が強い,正確でスケーラブルで,プライバシー保護のオントロジー拡張フレームワークを提供することが示された。
関連論文リスト
- KEEP: Integrating Medical Ontologies with Clinical Data for Robust Code Embeddings [0.555923706082834]
KEEP(Knowledge Preserving and Empirically refined Embedding Process)は、知識グラフの埋め込みと臨床データからの適応学習を組み合わせた効率的なフレームワークである。
KEEPは,意味的関係の把握や臨床結果の予測において,従来の言語モデルに基づくアプローチよりも優れていることを示す。
論文 参考訳(メタデータ) (2025-10-06T17:27:54Z) - Unified Representation of Genomic and Biomedical Concepts through Multi-Task, Multi-Source Contrastive Learning [45.6771125432388]
言語モデル(genEREL)を用いたジェノミクス表現について紹介する。
GENERELは遺伝学と生物医学の知識基盤を橋渡しするために設計されたフレームワークである。
本実験は,SNPと臨床概念のニュアンス関係を効果的に把握するgenERELの能力を実証するものである。
論文 参考訳(メタデータ) (2024-10-14T04:19:52Z) - Reasoning-Enhanced Healthcare Predictions with Knowledge Graph Community Retrieval [61.70489848327436]
KAREは、知識グラフ(KG)コミュニティレベルの検索と大規模言語モデル(LLM)推論を統合する新しいフレームワークである。
MIMIC-IIIでは最大10.8~15.0%、MIMIC-IVでは12.6~12.7%である。
論文 参考訳(メタデータ) (2024-10-06T18:46:28Z) - Explainable Biomedical Hypothesis Generation via Retrieval Augmented Generation enabled Large Language Models [46.05020842978823]
大規模言語モデル(LLM)はこの複雑なデータランドスケープをナビゲートする強力なツールとして登場した。
RAGGEDは、知識統合と仮説生成を伴う研究者を支援するために設計された包括的なワークフローである。
論文 参考訳(メタデータ) (2024-07-17T07:44:18Z) - A Hybrid Framework with Large Language Models for Rare Disease Phenotyping [4.550497164299771]
希少な疾患は、その頻度が低く、異質な臨床的プレゼンテーションのため、診断と治療において重大な課題となる。
本研究では,辞書ベースの自然言語処理(NLP)ツールと大規模言語モデル(LLM)を組み合わせたハイブリッドアプローチを開発することを目的とする。
本稿では,Orphanet Rare Disease Ontology (ORDO) とUnified Medical Language System (UMLS) を統合した新たなハイブリッドフレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-16T20:59:28Z) - REALM: RAG-Driven Enhancement of Multimodal Electronic Health Records
Analysis via Large Language Models [19.62552013839689]
既存のモデルは、しばしば臨床上の課題に医学的文脈を欠いているため、外部知識の組み入れが促される。
本稿では、マルチモーダルEHR表現を強化するためのRAG(Retrieval-Augmented Generation)駆動フレームワークREALMを提案する。
MIMIC-III 死亡率と可読化タスクに関する実験は,ベースラインよりもREALM フレームワークの優れた性能を示す。
論文 参考訳(メタデータ) (2024-02-10T18:27:28Z) - Diversifying Knowledge Enhancement of Biomedical Language Models using
Adapter Modules and Knowledge Graphs [54.223394825528665]
我々は、軽量なアダプターモジュールを用いて、構造化された生体医学的知識を事前訓練された言語モデルに注入するアプローチを開発した。
バイオメディカル知識システムUMLSと新しいバイオケミカルOntoChemの2つの大きなKGと、PubMedBERTとBioLinkBERTの2つの著名なバイオメディカルPLMを使用している。
計算能力の要件を低く保ちながら,本手法がいくつかの事例において性能改善につながることを示す。
論文 参考訳(メタデータ) (2023-12-21T14:26:57Z) - Self-Verification Improves Few-Shot Clinical Information Extraction [73.6905567014859]
大規模言語モデル (LLMs) は、数発のテキスト内学習を通じて臨床キュレーションを加速する可能性を示している。
正確性や解釈可能性に関する問題、特に健康のようなミッションクリティカルな領域ではまだ苦戦している。
本稿では,自己検証を用いた汎用的な緩和フレームワークについて検討する。このフレームワークはLLMを利用して,自己抽出のための証明を提供し,その出力をチェックする。
論文 参考訳(メタデータ) (2023-05-30T22:05:11Z) - EBOCA: Evidences for BiOmedical Concepts Association Ontology [55.41644538483948]
本論文は,生物医学領域の概念とそれらの関連性を記述するオントロジーであるEBOCAと,それらの関連性を支持するエビデンスを提案する。
DISNETのサブセットから得られるテストデータとテキストからの自動アソシエーション抽出が変換され、実際のシナリオで使用できる知識グラフが作成されるようになった。
論文 参考訳(メタデータ) (2022-08-01T18:47:03Z) - UmlsBERT: Clinical Domain Knowledge Augmentation of Contextual
Embeddings Using the Unified Medical Language System Metathesaurus [73.86656026386038]
事前学習プロセス中にドメイン知識を統合するコンテキスト埋め込みモデルであるUmlsBERTを紹介する。
これらの2つの戦略を適用することで、UmlsBERTは、臨床領域の知識を単語埋め込みにエンコードし、既存のドメイン固有モデルより優れている。
論文 参考訳(メタデータ) (2020-10-20T15:56:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。