論文の概要: Hierarchical Retrieval with Out-Of-Vocabulary Queries: A Case Study on SNOMED CT
- arxiv url: http://arxiv.org/abs/2511.16698v1
- Date: Mon, 17 Nov 2025 19:18:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-24 18:08:18.75859
- Title: Hierarchical Retrieval with Out-Of-Vocabulary Queries: A Case Study on SNOMED CT
- Title(参考訳): 語彙外クエリーを用いた階層的検索 : SNOMED CTの1例
- Authors: Jonathon Dilworth, Hui Yang, Jiaoyan Chen, Yongsheng Gao,
- Abstract要約: 本稿では,OoVクエリを用いたSNOMED CTからの階層的概念検索の問題に焦点をあてる。
評価のために,SNOMED CTの概念に適応したOOVクエリを構築した。
提案手法は,SBERTと2つの語彙マッチング法を含むベースラインよりも優れていることがわかった。
- 参考スコア(独自算出の注目度): 13.99054219807505
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: SNOMED CT is a biomedical ontology with a hierarchical representation of large-scale concepts. Knowledge retrieval in SNOMED CT is critical for its application, but often proves challenging due to language ambiguity, synonyms, polysemies and so on. This problem is exacerbated when the queries are out-of-vocabulary (OOV), i.e., having no equivalent matchings in the ontology. In this work, we focus on the problem of hierarchical concept retrieval from SNOMED CT with OOV queries, and propose an approach based on language model-based ontology embeddings. For evaluation, we construct OOV queries annotated against SNOMED CT concepts, testing the retrieval of the most direct subsumers and their less relevant ancestors. We find that our method outperforms the baselines including SBERT and two lexical matching methods. While evaluated against SNOMED CT, the approach is generalisable and can be extended to other ontologies. We release code, tools, and evaluation datasets at https://github.com/jonathondilworth/HR-OOV.
- Abstract(参考訳): SNOMED CTは大規模概念を階層的に表現した生物医学的オントロジーである。
SNOMED CTの知識検索はその応用上重要であるが、言語あいまいさ、同義語、多義語などにより困難であることがしばしば証明される。
この問題は、クエリがoo-of-vocabulary(OOV)である場合、すなわちオントロジーに等価なマッチングがない場合、さらに悪化する。
本研究では,SNOMED CTからOOVクエリを用いた階層的概念検索の問題に着目し,言語モデルに基づくオントロジー埋め込みに基づくアプローチを提案する。
評価のために,SNOMEDCT概念に注釈付けされたOOVクエリを構築し,最も直接的なサブスクライマーとその関連性の低い祖先の検索を検証した。
提案手法は,SBERTと2つの語彙マッチング法を含むベースラインよりも優れていることがわかった。
SNOMED CTに対して評価されるが、アプローチは一般化可能であり、他のオントロジーにも拡張できる。
コード、ツール、評価データセットはhttps://github.com/jonathondilworth/HR-OOV.comで公開しています。
関連論文リスト
- Ontology-Based Concept Distillation for Radiology Report Retrieval and Labeling [10.504309161945065]
既存のほとんどの手法は、CLIPやCXR-BERTのようなモデルからの高次元テキスト埋め込みを比較することに依存している。
統一医療言語システム(Unified Medical Language System)における臨床基礎概念に基づく放射線学報告テキストの比較のための,新しいオントロジーによる代替案を提案する。
本稿では,RadGraph-XLとSapBERTをベースとした拡張パイプラインを用いて,フリーテキストレポートから標準化された医療機関を抽出する。
論文 参考訳(メタデータ) (2025-08-27T14:20:50Z) - Automated SNOMED CT Concept Annotation in Clinical Text Using Bi-GRU Neural Networks [0.31457219084519]
本研究では,双方向GRUモデルを用いたSNOMEDCT概念認識のためのニューラルネットワークラベリング手法を提案する。
ドメイン適応型SpaCyおよびSciBERTベースのトークン化を用いてテキストを前処理し,テキストを文脈,構文,形態に富んだ重なり合う19個のチャンクに分割する。
Bi-GRUモデルは、IOBタグを指定してコンセプトスパンを特定し、検証セット上で90%のF1スコアで強力なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-08-04T16:08:49Z) - Can Large Language Models Augment a Biomedical Ontology with missing
Concepts and Relations? [1.1060425537315088]
LLMとのセマンティックな相互作用を利用して臨床実践ガイドラインを解析する手法を提案する。
プロンプトを使った最初の実験では、手動で生成された金の標準を与えられた有望な結果が得られました。
論文 参考訳(メタデータ) (2023-11-12T14:20:55Z) - Effective Matching of Patients to Clinical Trials using Entity
Extraction and Neural Re-ranking [8.200196331837576]
臨床試験(CT)は、不十分な患者募集のために失敗することが多い。
本稿では,患者と医療のパラダイムに対処するアプローチを提案することによって,CT検索の課題に取り組む。
論文 参考訳(メタデータ) (2023-07-01T16:42:39Z) - Investigating the Role of Centering Theory in the Context of Neural
Coreference Resolution Systems [71.57556446474486]
中心化理論と現代のコア参照分解システムとの関係について検討する。
高品質なニューラルコア参照リゾルバは、中心となるアイデアを明示的にモデル化することの恩恵を受けない可能性がある。
また, 再発をモデルとしたCTのバージョンを定式化し, バニラCTよりも良質なコア参照情報を取得することを示した。
論文 参考訳(メタデータ) (2022-10-26T12:55:26Z) - Semantic Search for Large Scale Clinical Ontologies [63.71950996116403]
本稿では,大規模臨床語彙検索システムを構築するための深層学習手法を提案する。
本稿では,意味学習データに基づくトレーニングデータを生成するTriplet-BERTモデルを提案する。
このモデルは,5つの実ベンチマークデータセットを用いて評価され,提案手法は自由テキストから概念,概念まで,概念語彙の検索において高い結果が得られることを示す。
論文 参考訳(メタデータ) (2022-01-01T05:15:42Z) - InDuDoNet+: A Model-Driven Interpretable Dual Domain Network for Metal
Artifact Reduction in CT Images [53.4351366246531]
InDuDoNet+と呼ばれる新しい解釈可能な二重ドメインネットワークを構築し、CT画像の微細な埋め込みを行う。
異なる組織間のCT値を分析し,InDuDoNet+の事前観測ネットワークにマージすることで,その一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2021-12-23T15:52:37Z) - Learning to Detect Critical Nodes in Sparse Graphs via Feature Importance Awareness [53.351863569314794]
クリティカルノード問題(CNP)は、削除が残余ネットワークのペア接続性を最大に低下させるネットワークから臨界ノードの集合を見つけることを目的としている。
本研究は,ノード表現のための特徴重要度対応グラフアテンションネットワークを提案する。
ダブルディープQネットワークと組み合わせて、初めてCNPを解くエンドツーエンドのアルゴリズムを作成する。
論文 参考訳(メタデータ) (2021-12-03T14:23:05Z) - Context-Aware Refinement Network Incorporating Structural Connectivity
Prior for Brain Midline Delineation [50.868845400939314]
UNetによって生成された特徴ピラミッド表現を洗練・統合するための文脈対応改良ネットワーク(CAR-Net)を提案する。
正中線における脳の構造的接続性を維持するため、我々は新しい接続性レギュラーロスを導入する。
提案手法は, パラメータを少なくし, 4つの評価指標で3つの最先端手法より優れる。
論文 参考訳(メタデータ) (2020-07-10T14:01:20Z) - Learning Contextualized Document Representations for Healthcare Answer
Retrieval [68.02029435111193]
コンテキスト談話ベクトル(英: Contextual Discourse Vectors、CDV)は、長文からの効率的な回答検索のための分散文書表現である。
本モデルでは,階層型LSTMレイヤとマルチタスクトレーニングを併用したデュアルエンコーダアーキテクチャを用いて,臨床エンティティの位置と文書の談話に沿った側面をエンコードする。
我々の一般化モデルは、医療パスランキングにおいて、最先端のベースラインを著しく上回っていることを示す。
論文 参考訳(メタデータ) (2020-02-03T15:47:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。