論文の概要: DisEmbed: Transforming Disease Understanding through Embeddings
- arxiv url: http://arxiv.org/abs/2412.15258v1
- Date: Mon, 16 Dec 2024 12:04:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-23 19:51:05.310027
- Title: DisEmbed: Transforming Disease Understanding through Embeddings
- Title(参考訳): DisEmbed: 埋め込みによる疾患理解の変容
- Authors: Salman Faroz,
- Abstract要約: DisEmbedは病気に焦点を当てた埋め込みモデルである。
DisEmbedは、疾患の説明、症状、および疾患関連Q&Aペアを含むようにキュレートされた合成データセットでトレーニングされている。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: The medical domain is vast and diverse, with many existing embedding models focused on general healthcare applications. However, these models often struggle to capture a deep understanding of diseases due to their broad generalization across the entire medical field. To address this gap, I present DisEmbed, a disease-focused embedding model. DisEmbed is trained on a synthetic dataset specifically curated to include disease descriptions, symptoms, and disease-related Q\&A pairs, making it uniquely suited for disease-related tasks. For evaluation, I benchmarked DisEmbed against existing medical models using disease-specific datasets and the triplet evaluation method. My results demonstrate that DisEmbed outperforms other models, particularly in identifying disease-related contexts and distinguishing between similar diseases. This makes DisEmbed highly valuable for disease-specific use cases, including retrieval-augmented generation (RAG) tasks, where its performance is particularly robust.
- Abstract(参考訳): 医療領域は広く多様であり、多くの既存の埋め込みモデルは一般的な医療応用に焦点を当てている。
しかしながら、これらのモデルはしばしば、医療分野全体にわたって広く一般化されているため、病気の深い理解をつかむのに苦労する。
このギャップに対処するために、病気に焦点を当てた埋め込みモデルであるDisEmbedを紹介します。
DisEmbedは、疾患の説明、症状、および疾患関連Q\&Aペアを含む特別に訓練された合成データセットで訓練されており、疾患関連タスクに特に適している。
評価のために、疾患特異的データセットとトリプルト評価法を用いて、既存の医療モデルと比較した。
以上の結果から,DisEmbedは疾患関連コンテキストの同定や類似疾患の識別において,他のモデルよりも優れていることが示された。
これにより、DisEmbedはそのパフォーマンスが特に堅牢な検索強化世代(RAG)タスクを含む、疾患固有のユースケースにとって非常に価値の高いものとなる。
関連論文リスト
- A Learnable Multi-views Contrastive Framework with Reconstruction Discrepancy for Medical Time-Series [8.741139851597364]
本稿では、関連するタスクから外部データを取り込み、AE-GANを利用して事前知識を抽出することを提案する。
マルチヘッドアテンション機構を統合し,異なる視点から表現を適応的に学習するフレームワークであるLMCFを紹介する。
3つのターゲットデータセットの実験により、我々の手法が他の7つのベースラインを一貫して上回ることを示した。
論文 参考訳(メタデータ) (2025-01-30T14:20:11Z) - Assessing and Enhancing Large Language Models in Rare Disease Question-answering [64.32570472692187]
本稿では,レアな疾患の診断におけるLarge Language Models (LLMs) の性能を評価するために,レアな疾患問合せデータセット(ReDis-QA)を導入する。
ReDis-QAデータセットでは1360の高品質な質問応答ペアを収集し,205の稀な疾患をカバーした。
その後、いくつかのオープンソースのLCMをベンチマークし、希少疾患の診断がこれらのモデルにとって重要な課題であることを示した。
実験の結果,ReCOPは,ReDis-QAデータセット上でのLCMの精度を平均8%向上できることがわかった。
論文 参考訳(メタデータ) (2024-08-15T21:09:09Z) - Potential of Multimodal Large Language Models for Data Mining of Medical Images and Free-text Reports [51.45762396192655]
特にGemini-Vision-Series (Gemini) と GPT-4-Series (GPT-4) は、コンピュータビジョンのための人工知能のパラダイムシフトを象徴している。
本研究は,14の医用画像データセットを対象に,Gemini,GPT-4,および4つの一般的な大規模モデルの性能評価を行った。
論文 参考訳(メタデータ) (2024-07-08T09:08:42Z) - Domain Invariant Model with Graph Convolutional Network for Mammogram
Classification [49.691629817104925]
グラフ畳み込みネットワークを用いたドメイン不変モデル(DIM-GCN)を提案する。
まず,潜伏変数を病原性その他の疾患関連部位に明示的に分解するベイズネットワークを提案する。
マクロな特徴をよりよく捉えるために、我々は、GCN(Graph Convolutional Network)を介して、観察された臨床特性を再構築の目的として活用する。
論文 参考訳(メタデータ) (2022-04-21T08:23:44Z) - Context-aware Health Event Prediction via Transition Functions on
Dynamic Disease Graphs [15.17817233616652]
多くの機械学習アプローチは、患者の異なる訪問で病気の表現が静的であると仮定している。
動的疾患グラフ上の遷移関数を用いた文脈認識学習フレームワークを提案する。
2つの実世界のEHRデータセットの実験結果から、提案されたモデルは、健康事象を予測する上で、技術の現状よりも優れていることが示された。
論文 参考訳(メタデータ) (2021-12-09T20:06:39Z) - Co-occurrence of medical conditions: Exposing patterns through
probabilistic topic modeling of SNOMED codes [0.3867363075280544]
腎疾患に罹患している人には、特に共起状態が一般的である。
本研究の目的は,確率的枠組みを用いた患者の共起医療状況のパターンを同定し,特徴付けることである。
論文 参考訳(メタデータ) (2021-09-19T19:34:21Z) - Relational Subsets Knowledge Distillation for Long-tailed Retinal
Diseases Recognition [65.77962788209103]
本研究では,長尾データを知識に基づいて複数のクラスサブセットに分割し,クラスサブセット学習を提案する。
モデルがサブセット固有の知識の学習に集中するように強制する。
提案手法は長期網膜疾患認識タスクに有効であることが判明した。
論文 参考訳(メタデータ) (2021-04-22T13:39:33Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Dynamic Graph Correlation Learning for Disease Diagnosis with Incomplete
Labels [66.57101219176275]
胸部X線画像上の疾患診断は,多ラベル分類の課題である。
本稿では,異なる疾患間の相互依存を調査する新たな視点を提示する病的診断グラフ畳み込みネットワーク(DD-GCN)を提案する。
本手法は,相関学習のための動的隣接行列を用いた特徴写像上のグラフを初めて構築する手法である。
論文 参考訳(メタデータ) (2020-02-26T17:10:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。