論文の概要: QIME: Constructing Interpretable Medical Text Embeddings via Ontology-Grounded Questions
- arxiv url: http://arxiv.org/abs/2603.01690v2
- Date: Tue, 03 Mar 2026 03:49:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-04 14:54:12.626576
- Title: QIME: Constructing Interpretable Medical Text Embeddings via Ontology-Grounded Questions
- Title(参考訳): QIME:オントロジーを中心とした質問による解釈可能な医療用テキストの埋め込みの構築
- Authors: Yixuan Tang, Zhenghong Lin, Yandong Sun, Wynne Hsu, Mong Li Lee, Anthony K. H. Tung,
- Abstract要約: 解釈可能な医療用テキスト埋め込みを構築するためのオントロジーを基盤としたフレームワークであるQIMEを提案する。
QIMEは、バイオメディカルテキストのきめ細かい区別を捉える意味論的原子的質問を生成する。
そこで本研究では,QIMEが従来の解釈可能な埋め込み手法よりも優れており,そのギャップを強力なブラックボックスバイオメディカルエンコーダにかなり狭めていることを示す。
- 参考スコア(独自算出の注目度): 29.87717901839441
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: While dense biomedical embeddings achieve strong performance, their black-box nature limits their utility in clinical decision-making. Recent question-based interpretable embeddings represent text as binary answers to natural-language questions, but these approaches often rely on heuristic or surface-level contrastive signals and overlook specialized domain knowledge. We propose QIME, an ontology-grounded framework for constructing interpretable medical text embeddings in which each dimension corresponds to a clinically meaningful yes/no question. By conditioning on cluster-specific medical concept signatures, QIME generates semantically atomic questions that capture fine-grained distinctions in biomedical text. Furthermore, QIME supports a training-free embedding construction strategy that eliminates per-question classifier training while further improving performance. Experiments across biomedical semantic similarity, clustering, and retrieval benchmarks show that QIME consistently outperforms prior interpretable embedding methods and substantially narrows the gap to strong black-box biomedical encoders, while providing concise and clinically informative explanations.
- Abstract(参考訳): 濃厚なバイオメディカル埋め込みは高い性能を達成するが、ブラックボックスの性質は臨床的意思決定における有用性を制限している。
最近の質問ベースの解釈可能な埋め込みは、テキストを自然言語に対する二進的な回答として表現するが、これらのアプローチはしばしばヒューリスティックまたは表面レベルのコントラスト信号に依存し、特殊なドメイン知識を見落としている。
QIMEは,各次元が臨床的に有意なイエス・ノー質問に対応する解釈可能な医療用テキスト埋め込みを構築するためのオントロジー・グラウンドド・フレームワークである。
クラスター固有の医療概念シグネチャを条件にすることで、QIMEは、バイオメディカルテキストの微細な区別を捉える意味論的原子的質問を生成する。
さらに、QIMEは、クエリごとの分類器トレーニングを排除し、パフォーマンスをさらに向上する、トレーニング不要な埋め込み構成戦略をサポートしている。
バイオメディカルセマンティックな類似性、クラスタリング、および検索のベンチマークによる実験では、QIMEは解釈可能な埋め込み方法よりも一貫して優れており、強力なブラックボックスのバイオメディカルエンコーダとのギャップを大幅に狭くし、簡潔で臨床的に有益な説明を提供する。
関連論文リスト
- Lost in Tokenization: Context as the Key to Unlocking Biomolecular Understanding in Scientific LLMs [78.18336140706471]
Sci-LLMは、生物発見を加速するための有望なフロンティアとして登場した。
現在の戦略では生の生体分子配列を処理する際にSci-LLMの推論能力を制限する。
より効果的な戦略は、Sci-LLMに高レベルな構造化コンテキストを提供することである。
論文 参考訳(メタデータ) (2025-10-27T09:03:21Z) - Towards Multi-dimensional Explanation Alignment for Medical Classification [16.799101204390457]
Med-MICN (Medical Multi-dimensional Interpretable Concept Network) という新しいフレームワークを提案する。
Med-MICNは、ニューラルシンボリック推論、コンセプトセマンティクス、サリエンシマップなど、さまざまな角度の解釈可能性アライメントを提供する。
その利点は、高い予測精度、複数の次元にわたる解釈可能性、エンドツーエンドの概念ラベリングプロセスによる自動化である。
論文 参考訳(メタデータ) (2024-10-28T20:03:19Z) - Crafting Interpretable Embeddings by Asking LLMs Questions [89.49960984640363]
大規模言語モデル(LLM)は、自然言語処理タスクの増大に対して、テキスト埋め込みを急速に改善した。
質問応答埋め込み (QA-Emb) を導入し, 各特徴がLLMに対して質問された質問に対する回答を表す。
我々はQA-Embを用いて、言語刺激に対するfMRIボクセル応答を予測するための解釈可能なモデルを柔軟に生成する。
論文 参考訳(メタデータ) (2024-05-26T22:30:29Z) - Uncertainty-aware Medical Diagnostic Phrase Identification and Grounding [72.18719355481052]
MRG(Messical Report Grounding)と呼ばれる新しい課題について紹介する。
MRGは医療報告から診断フレーズとその対応する接地箱を直接エンドツーエンドで識別することを目的としている。
マルチモーダルな大規模言語モデルを用いて診断フレーズを予測する,堅牢で信頼性の高いフレームワークである uMedGround を提案する。
論文 参考訳(メタデータ) (2024-04-10T07:41:35Z) - HiPrompt: Few-Shot Biomedical Knowledge Fusion via Hierarchy-Oriented
Prompting [33.1455954220194]
HiPromptは、監督効率の良い知識融合フレームワークである。
階層指向のプロンプトを通じて、大規模言語モデルの数発の推論能力を引き出す。
収集したKG-Hi-BKFベンチマークデータセットの実験的結果は、HiPromptの有効性を示している。
論文 参考訳(メタデータ) (2023-04-12T16:54:26Z) - Large-scale investigation of weakly-supervised deep learning for the
fine-grained semantic indexing of biomedical literature [7.171698704686836]
本研究では,MeSH概念のレベルでのアノテーションの自動修正手法を提案する。
提案手法は,デクリプタに促進された概念に基づいて,大規模なふりかえりシナリオに基づいて評価する。
論文 参考訳(メタデータ) (2023-01-23T10:33:22Z) - MED-SE: Medical Entity Definition-based Sentence Embedding [1.0828616610785524]
本稿では,医学的実体の定義を生かした,臨床テキストのための新しい教師なしコントラスト学習フレームワークを提案する。
私たちが設計したエンティティ中心の環境では、MED-SEは性能が大幅に向上し、SimCSEを含む既存の教師なし手法では性能が劣化している。
論文 参考訳(メタデータ) (2022-12-09T09:10:19Z) - Automatic Biomedical Term Clustering by Learning Fine-grained Term
Representations [0.8154691566915505]
最先端の用語埋め込みは、事前訓練された言語モデルを利用して用語をエンコードし、知識グラフからの同義語と関係知識を使用して、対照的な学習を導く。
これらの埋め込みは、バイオメディカルな用語クラスタリングの失敗につながる小さなテキストの違いに敏感ではない。
この問題を軽減するため,動的ハード・ポジティと負のサンプルを提供することにより,プレトレーニング項埋め込みにおけるサンプリング戦略を調整した。
我々は提案手法をCODER++と命名し,新たにリリースされたBIOSというバイオメディカル知識グラフのバイオメディカル概念のクラスタリングに適用した。
論文 参考訳(メタデータ) (2022-04-01T12:30:58Z) - Self-supervised Answer Retrieval on Clinical Notes [68.87777592015402]
本稿では,ドメイン固有パスマッチングのためのトランスフォーマー言語モデルをトレーニングするためのルールベースのセルフスーパービジョンであるCAPRを紹介する。
目的をトランスフォーマーベースの4つのアーキテクチャ、コンテキスト文書ベクトル、ビ-、ポリエンコーダ、クロスエンコーダに適用する。
本稿では,ドメイン固有パスの検索において,CAPRが強いベースラインを上回り,ルールベースおよび人間ラベル付きパスを効果的に一般化することを示す。
論文 参考訳(メタデータ) (2021-08-02T10:42:52Z) - Clinical Named Entity Recognition using Contextualized Token
Representations [49.036805795072645]
本稿では,各単語の意味的意味をより正確に把握するために,文脈型単語埋め込み手法を提案する。
言語モデル(C-ELMo)とC-Flair(C-Flair)の2つの深い文脈型言語モデル(C-ELMo)を事前訓練する。
明示的な実験により、静的単語埋め込みとドメインジェネリック言語モデルの両方と比較して、我々のモデルは劇的に改善されている。
論文 参考訳(メタデータ) (2021-06-23T18:12:58Z) - Panoptic Feature Fusion Net: A Novel Instance Segmentation Paradigm for
Biomedical and Biological Images [91.41909587856104]
本稿では,本研究における意味的特徴とインスタンス的特徴を統一するPanoptic Feature Fusion Net(PFFNet)を提案する。
提案するPFFNetには,インスタンス予測を意味的特徴に組み込むための残注意特徴融合機構が組み込まれている。
様々なバイオメディカルおよび生物学的データセットにおいて、最先端のいくつかの手法を上回ります。
論文 参考訳(メタデータ) (2020-02-15T09:19:41Z) - Data Mining in Clinical Trial Text: Transformers for Classification and
Question Answering Tasks [2.127049691404299]
本研究は,医学的テキストに基づくエビデンス合成に自然言語処理の進歩を適用した。
主な焦点は、Population、Intervention、Comparator、Outcome(PICO)フレームワークを通じて特徴づけられる情報である。
トランスフォーマーに基づく最近のニューラルネットワークアーキテクチャは、トランスファーラーニングの能力を示し、下流の自然言語処理タスクのパフォーマンスが向上している。
論文 参考訳(メタデータ) (2020-01-30T11:45:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。