論文の概要: Specialty-Specific Medical Language Model for Immune-Mediated Diseases
- arxiv url: http://arxiv.org/abs/2605.28838v1
- Date: Sun, 12 Apr 2026 13:40:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 07:09:36.553768
- Title: Specialty-Specific Medical Language Model for Immune-Mediated Diseases
- Title(参考訳): 免疫性疾患の専門医療用言語モデル
- Authors: Veysel Kocaman, Gursev Pirge, Yigit Gul, Ace Vo, Zhenya Nargizyan, David Talby,
- Abstract要約: 疾患関連エンティティを識別するために,ドメイン固有の名前付きエンティティ認識モデルを開発した。
2名の臨床専門医と共同で371件の症例報告のデータセットを作成した。
得られたモデルは、ケースレポートを分析するための構造化された方法を提供し、コホート識別、疾患モニタリング、臨床診断支援などの下流タスクをサポートすることができる。
- 参考スコア(独自算出の注目度): 2.339805471804333
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Extracting detailed clinical information from free-text medical narratives remains a practical challenge for researchers and healthcare systems. Terminology for immune-mediated and infectious diseases is especially inconsistent across sources, which often limits the ability of general-purpose Natural Language Processing (NLP) systems to capture the relevant biomedical concepts with sufficient granularity. We developed a domain-specific Named Entity Recognition (NER) model tailored to identify disease-related entities occurring in immunology and infectious disease contexts. We assembled and manually annotated a dataset of 371 case reports in collaboration with two clinical specialists, defining twelve entity classes covering immune-mediated and infectious conditions as well as related symptoms and clinical descriptors. We evaluated several modeling strategies, including the MedicalNER architecture with multiple healthcare-specific embeddings, a BERT-based token classification model, and zero-shot NER systems. The strongest performance was obtained with a transformer-based model trained on clinical-domain embeddings, which reached an F1 score of 0.89, consistently outperforming baseline and zero-shot approaches. The combination of specialized embeddings and expert annotation proved particularly valuable for capturing nuanced disease terminology and improving generalization across heterogeneous biomedical text. The prompted LLM baseline achieved substantially lower performance under the same evaluation protocol, reflecting difficulties in producing span-consistent outputs for fine-grained entity boundaries despite detailed prompting. The resulting model provides a structured way to analyze case reports and can support downstream tasks such as cohort identification, disease monitoring, and clinical decision support.
- Abstract(参考訳): フリーテキスト医療物語から詳細な臨床情報を抽出することは、研究者や医療システムにとって実践的な課題である。
免疫によって媒介される病気や感染症のターミノロジーは、一般的に自然言語処理(NLP)システムが、十分な粒度で関連する生体医学的概念を捉える能力を制限するため、ソース間で不整合である。
免疫学や感染症の文脈で発生する疾患関連物質を同定するために,ドメイン固有な名前付きエンティティ認識(NER)モデルを開発した。
臨床専門医2人と共同で371件の症例報告のデータセットを作成した。
我々は、複数のヘルスケア固有の埋め込みを持つMessageNERアーキテクチャ、BERTベースのトークン分類モデル、ゼロショットNERシステムなど、いくつかのモデリング戦略を評価した。
最強のパフォーマンスは、臨床ドメインの埋め込みを訓練したトランスフォーマーベースモデル(F1スコア0.89)で得られ、ベースラインとゼロショットのアプローチを一貫して上回った。
専門的な埋め込みと専門家のアノテーションの組み合わせは、ニュアンス病の用語を捉え、異種バイオメディカルテキストの一般化を改善するのに特に有用であることが証明された。
LLMベースラインは、詳細なプロンプトにもかかわらず、粒度の細かいエンティティ境界に対してスパン一貫性のある出力を生成することの難しさを反映して、同じ評価プロトコルの下で大幅に性能を低下させた。
得られたモデルは、ケースレポートを分析するための構造化された方法を提供し、コホート識別、疾患モニタリング、臨床診断支援などの下流タスクをサポートすることができる。
関連論文リスト
- Learning from Medical Entity Trees: An Entity-Centric Medical Data Engineering Framework for MLLMs [34.87373678921793]
MLLM(Multimodal Large Language Models)は、医療応用における変革の可能性を示しているが、その性能は従来のデータキュレーション戦略によって妨げられている。
本稿では,Entity-Centric Medical Data Engineering フレームワークを提案する。
我々は権威ある医学文献からエンティティを自動的に抽出し、疾患、解剖学的構造、モダリティ、症状を体系的に統合された知識リポジトリにエンコードする階層構造であるメディカルエンティティツリー(MET)を構築する。
論文 参考訳(メタデータ) (2026-04-28T07:05:26Z) - Clinical Cognition Alignment for Gastrointestinal Diagnosis with Multimodal LLMs [63.535652574541764]
MLLM(Multimodal Large Language Models)は医用画像解析において顕著な可能性を示した。
消化器内視鏡におけるそれらの応用は、現在、2つの重要な限界によって妨げられている。
本稿では,これらの課題に対処する新しい臨床認知アライメント(CogAlign)フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-21T07:47:37Z) - AgentsEval: Clinically Faithful Evaluation of Medical Imaging Reports via Multi-Agent Reasoning [73.50200033931148]
本稿では,放射線科医の協調診断ワークフローをエミュレートしたマルチエージェントストリーム推論フレームワークであるAgensEvalを紹介する。
評価プロセスを基準定義、エビデンス抽出、アライメント、一貫性スコアなどの解釈可能なステップに分割することで、AgensEvalは明確な推論トレースと構造化された臨床フィードバックを提供する。
実験結果から,AgensEvalは,言い換え,意味的,スタイリスティックな摂動の下でも頑健な臨床的整合性,意味的忠実性,解釈可能な評価を提供することが示された。
論文 参考訳(メタデータ) (2026-01-23T11:59:13Z) - MMedExpert-R1: Strengthening Multimodal Medical Reasoning via Domain-Specific Adaptation and Clinical Guideline Reinforcement [63.82954136824963]
医療ビジョンランゲージモデルでは、現実世界のシナリオで必要とされる複雑な臨床推論を伴う知覚タスクが優れている。
本稿ではドメイン固有の適応とガイドライン強化を通じてこれらの課題に対処する新しい推論MedVLMを提案する。
論文 参考訳(メタデータ) (2026-01-16T02:32:07Z) - DiagnoLLM: A Hybrid Bayesian Neural Language Framework for Interpretable Disease Diagnosis [9.694872671659484]
本報告では,ベイジアン・デコンボリューション,eQTL誘導深層学習,LCMを用いた診断用物語生成を併用したハイブリッドフレームワークであるtextttDiagnoLLMを提案する。
以上の結果から,LLMはエンドツーエンドの予測器ではなく,ポストホックな推論器としてデプロイされる場合,ハイブリッド診断パイプライン内の効果的なコミュニケータとして機能することが示唆された。
論文 参考訳(メタデータ) (2025-11-08T02:51:21Z) - Towards Scalable and Cross-Lingual Specialist Language Models for Oncology [4.824906329042275]
汎用大規模モデル(LLM)は、臨床用語、文脈に依存した解釈、マルチモーダルデータ統合といった課題に対処する。
本研究では,教師調律,検索強化生成(RAG),グラフベースの知識統合を組み合わせた,オンコロジー特化,効率的,適応可能なNLPフレームワークを開発する。
論文 参考訳(メタデータ) (2025-03-11T11:34:57Z) - Assessing and Enhancing Large Language Models in Rare Disease Question-answering [64.32570472692187]
本稿では,レアな疾患の診断におけるLarge Language Models (LLMs) の性能を評価するために,レアな疾患問合せデータセット(ReDis-QA)を導入する。
ReDis-QAデータセットでは1360の高品質な質問応答ペアを収集し,205の稀な疾患をカバーした。
その後、いくつかのオープンソースのLCMをベンチマークし、希少疾患の診断がこれらのモデルにとって重要な課題であることを示した。
実験の結果,ReCOPは,ReDis-QAデータセット上でのLCMの精度を平均8%向上できることがわかった。
論文 参考訳(メタデータ) (2024-08-15T21:09:09Z) - Potential of Multimodal Large Language Models for Data Mining of Medical Images and Free-text Reports [51.45762396192655]
特にGemini-Vision-Series (Gemini) と GPT-4-Series (GPT-4) は、コンピュータビジョンのための人工知能のパラダイムシフトを象徴している。
本研究は,14の医用画像データセットを対象に,Gemini,GPT-4,および4つの一般的な大規模モデルの性能評価を行った。
論文 参考訳(メタデータ) (2024-07-08T09:08:42Z) - A Hybrid Framework with Large Language Models for Rare Disease Phenotyping [4.550497164299771]
希少な疾患は、その頻度が低く、異質な臨床的プレゼンテーションのため、診断と治療において重大な課題となる。
本研究では,辞書ベースの自然言語処理(NLP)ツールと大規模言語モデル(LLM)を組み合わせたハイブリッドアプローチを開発することを目的とする。
本稿では,Orphanet Rare Disease Ontology (ORDO) とUnified Medical Language System (UMLS) を統合した新たなハイブリッドフレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-16T20:59:28Z) - Ontology-Driven and Weakly Supervised Rare Disease Identification from
Clinical Notes [13.096008602034086]
機械学習やドメインの専門家によるデータアノテーションの必要性から、希少な疾患の特定は困難である。
両方向変換器(例えばBERT)からの事前学習した文脈表現を用いた脳と弱い監督手法を提案する。
弱教師付きアプローチは、ドメインの専門家による注釈付きデータなしで、テキスト-UMLSリンクを改善するための確認表現型モデルを学ぶために提案される。
論文 参考訳(メタデータ) (2022-05-11T17:38:24Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。