論文の概要: End-to-end Biomedical Entity Linking with Span-based Dictionary Matching
- arxiv url: http://arxiv.org/abs/2104.10493v1
- Date: Wed, 21 Apr 2021 12:24:12 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-22 14:28:10.022260
- Title: End-to-end Biomedical Entity Linking with Span-based Dictionary Matching
- Title(参考訳): Span-based Dictionary Matchingによるエンドツーエンドバイオメディカルエンティティリンク
- Authors: Shogo Ujiie, Hayate Iso, Shuntaro Yada, Shoko Wakamiya, Eiji Aramaki
- Abstract要約: 病名認識と正常化は、生物医学的なテキストマイニングの基本的なプロセスです。
本研究では,スパン表現と辞書マッチング機能を組み合わせた新しいエンドツーエンドアプローチを提案する。
我々のモデルは、ニューラルネットワークモデルの性能を維持しながら辞書を参照することで、目に見えない概念を扱う。
- 参考スコア(独自算出の注目度): 5.273138059454523
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Disease name recognition and normalization, which is generally called
biomedical entity linking, is a fundamental process in biomedical text mining.
Recently, neural joint learning of both tasks has been proposed to utilize the
mutual benefits. While this approach achieves high performance, disease
concepts that do not appear in the training dataset cannot be accurately
predicted. This study introduces a novel end-to-end approach that combines span
representations with dictionary-matching features to address this problem. Our
model handles unseen concepts by referring to a dictionary while maintaining
the performance of neural network-based models, in an end-to-end fashion.
Experiments using two major datasets demonstrate that our model achieved
competitive results with strong baselines, especially for unseen concepts
during training.
- Abstract(参考訳): 病名認識と正規化は一般にバイオメディカルエンティティリンクと呼ばれ、バイオメディカルテキストマイニングの基本的なプロセスである。
近年,両課題のニューラル・ジョイント・ラーニングが提案されている。
このアプローチは高いパフォーマンスを達成するが、トレーニングデータセットに現れない疾患の概念を正確に予測することはできない。
本研究では,スパン表現と辞書マッチング機能を組み合わせた新しいエンドツーエンドアプローチを提案する。
本モデルは,ニューラルネットワークモデルの性能をエンドツーエンドに維持しながら辞書を参照することで,目に見えない概念を扱う。
2つの主要なデータセットを用いた実験では、トレーニング中に特に目に見えない概念に対して、強力なベースラインを持つ競争結果が得られた。
関連論文リスト
- Boosting Biomedical Concept Extraction by Rule-Based Data Augmentation [26.72525935008653]
文書レベルのバイオメディカル概念抽出は、ある文書で言及されているバイオメディカル概念を識別するタスクである。
近年,この課題に対する事前学習型言語モデルの導入が進んでいる。
既存のルールベースの概念マッピングシステムであるMetaMapLiteを用いて,PubMed と PMC から擬似アノテーション付きデータを生成する。
論文 参考訳(メタデータ) (2024-07-03T00:00:21Z) - Medical Vision-Language Pre-Training for Brain Abnormalities [96.1408455065347]
本稿では,PubMedなどの公共リソースから,医用画像・テキスト・アライメントデータを自動的に収集する方法を示す。
特に,まず大きな脳画像テキストデータセットを収集することにより,事前学習プロセスの合理化を図るパイプラインを提案する。
また,医療領域におけるサブフィギュアをサブキャプションにマッピングするというユニークな課題についても検討した。
論文 参考訳(メタデータ) (2024-04-27T05:03:42Z) - Bi-Encoders based Species Normalization -- Pairwise Sentence Learning to
Rank [0.0]
本稿では、名前付きエンティティ正規化のための新しい深層学習手法を提案し、問題をランク付けするペアワイズ学習として扱う。
本研究は,種の実体型に関する実験を行い,その手法を最先端技術に対して評価する。
論文 参考訳(メタデータ) (2023-10-22T17:30:16Z) - Biomedical Named Entity Recognition via Dictionary-based Synonym
Generalization [51.89486520806639]
本研究では,入力テキストに含まれる生物医学的概念をスパンベース予測を用いて認識する,新しいSynGenフレームワークを提案する。
提案手法を広範囲のベンチマークで広範囲に評価し,SynGenが従来の辞書ベースモデルよりも顕著なマージンで優れていることを確認した。
論文 参考訳(メタデータ) (2023-05-22T14:36:32Z) - Learning to Exploit Temporal Structure for Biomedical Vision-Language
Processing [53.89917396428747]
視覚言語処理における自己教師あり学習は、画像とテキストのモダリティのセマンティックアライメントを利用する。
トレーニングと微調整の両方で利用できる場合、事前のイメージとレポートを明示的に説明します。
我々のアプローチはBioViL-Tと呼ばれ、テキストモデルと共同で訓練されたCNN-Transformerハイブリッドマルチイメージエンコーダを使用する。
論文 参考訳(メタデータ) (2023-01-11T16:35:33Z) - Combining Contrastive Learning and Knowledge Graph Embeddings to develop
medical word embeddings for the Italian language [0.0]
本論文は,イタリアの医療領域の未発見ニッチへの埋め込みを改良する試みである。
主な目的は、医療用語間の意味的類似性の精度を向上させることである。
イタリア語には医学的な文章や制御された語彙が欠けているため、我々は特定の解決法を開発した。
論文 参考訳(メタデータ) (2022-11-09T17:12:28Z) - Automatic Biomedical Term Clustering by Learning Fine-grained Term
Representations [0.8154691566915505]
最先端の用語埋め込みは、事前訓練された言語モデルを利用して用語をエンコードし、知識グラフからの同義語と関係知識を使用して、対照的な学習を導く。
これらの埋め込みは、バイオメディカルな用語クラスタリングの失敗につながる小さなテキストの違いに敏感ではない。
この問題を軽減するため,動的ハード・ポジティと負のサンプルを提供することにより,プレトレーニング項埋め込みにおけるサンプリング戦略を調整した。
我々は提案手法をCODER++と命名し,新たにリリースされたBIOSというバイオメディカル知識グラフのバイオメディカル概念のクラスタリングに適用した。
論文 参考訳(メタデータ) (2022-04-01T12:30:58Z) - Semantic Search for Large Scale Clinical Ontologies [63.71950996116403]
本稿では,大規模臨床語彙検索システムを構築するための深層学習手法を提案する。
本稿では,意味学習データに基づくトレーニングデータを生成するTriplet-BERTモデルを提案する。
このモデルは,5つの実ベンチマークデータセットを用いて評価され,提案手法は自由テキストから概念,概念まで,概念語彙の検索において高い結果が得られることを示す。
論文 参考訳(メタデータ) (2022-01-01T05:15:42Z) - MIMO: Mutual Integration of Patient Journey and Medical Ontology for
Healthcare Representation Learning [49.57261599776167]
本稿では、医療表現学習と予測分析のための、エンドツーエンドの堅牢なトランスフォーマーベースのソリューション、患者旅行の相互統合、医療オントロジー(MIMO)を提案する。
論文 参考訳(メタデータ) (2021-07-20T07:04:52Z) - Learning to Segment Human Body Parts with Synthetically Trained Deep
Convolutional Networks [58.0240970093372]
本稿では,合成データのみを用いて学習した深部畳み込みニューラルネットワークに基づく人体部分分割のための新しい枠組みを提案する。
提案手法は,人体部品の実際の注釈付きデータを用いてモデルを訓練することなく,最先端の結果が得られる。
論文 参考訳(メタデータ) (2021-02-02T12:26:50Z) - PhenoTagger: A Hybrid Method for Phenotype Concept Recognition using
Human Phenotype Ontology [6.165755812152143]
PhenoTaggerは、辞書と機械学習に基づく手法を組み合わせて、構造化されていないテキストの概念を認識するハイブリッド手法である。
提案手法は2つのHPOコーパスを用いて検証し,PhenoTaggerが従来の手法と比較した。
論文 参考訳(メタデータ) (2020-09-17T18:00:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。