論文の概要: MapperGPT: Large Language Models for Linking and Mapping Entities
- arxiv url: http://arxiv.org/abs/2310.03666v1
- Date: Thu, 5 Oct 2023 16:43:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-06 15:23:07.452973
- Title: MapperGPT: Large Language Models for Linking and Mapping Entities
- Title(参考訳): MapperGPT: エンティティのリンクとマッピングのための大規模言語モデル
- Authors: Nicolas Matentzoglu, J. Harry Caufield, Harshad B. Hegde, Justin T.
Reese, Sierra Moxon, Hyeongsik Kim, Nomi L. Harris, Melissa A Haendel,
Christopher J. Mungall
- Abstract要約: MapperGPTは、大規模言語モデルを用いて、マッピングを後処理のステップとしてレビューし、洗練するアプローチである。
ハイリコール法と組み合わせることで,MapperGPTは精度を大幅に向上できることを示す。
- 参考スコア(独自算出の注目度): 1.5340902251924438
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Aligning terminological resources, including ontologies, controlled
vocabularies, taxonomies, and value sets is a critical part of data integration
in many domains such as healthcare, chemistry, and biomedical research. Entity
mapping is the process of determining correspondences between entities across
these resources, such as gene identifiers, disease concepts, or chemical entity
identifiers. Many tools have been developed to compute such mappings based on
common structural features and lexical information such as labels and synonyms.
Lexical approaches in particular often provide very high recall, but low
precision, due to lexical ambiguity. As a consequence of this, mapping efforts
often resort to a labor intensive manual mapping refinement through a human
curator.
Large Language Models (LLMs), such as the ones employed by ChatGPT, have
generalizable abilities to perform a wide range of tasks, including
question-answering and information extraction. Here we present MapperGPT, an
approach that uses LLMs to review and refine mapping relationships as a
post-processing step, in concert with existing high-recall methods that are
based on lexical and structural heuristics.
We evaluated MapperGPT on a series of alignment tasks from different domains,
including anatomy, developmental biology, and renal diseases. We devised a
collection of tasks that are designed to be particularly challenging for
lexical methods. We show that when used in combination with high-recall
methods, MapperGPT can provide a substantial improvement in accuracy, beating
state-of-the-art (SOTA) methods such as LogMap.
- Abstract(参考訳): オントロジー、制御された語彙、分類学、価値セットなどの用語資源は、医療、化学、生物医学研究など多くの分野におけるデータ統合の重要な部分である。
エンティティマッピングは、遺伝子識別子、疾患の概念、化学エンティティ識別子など、これらのリソースにわたるエンティティ間の対応を決定するプロセスである。
共通構造特徴とラベルや同義語などの語彙情報に基づいてそのようなマッピングを計算するために多くのツールが開発されている。
特に語彙的アプローチは、語彙的曖昧さのために非常に高いリコールを提供するが、精度は低い。
この結果、マッピングの取り組みは、しばしば人間のキュレーターを通して、労働集約的な手動マッピングの洗練に頼りになる。
chatgptが採用しているような大規模言語モデル(llm)は、質問応答や情報抽出など、幅広いタスクを実行することができる。
そこで,本稿では,llmを用いて後処理ステップとしてマッピング関係をレビュー・洗練する手法であるmappergptと,語彙的・構造的ヒューリスティックに基づく既存のハイリコール手法について述べる。
解剖学, 発達生物学, 腎疾患など, さまざまな領域のアライメントタスクにおけるMapperGPTの評価を行った。
語彙的手法に特に難易度の高いタスクの集合を考案した。
ハイリコール法と組み合わせることで,mappergptはlogmapのような最先端(sota)メソッドよりも精度が大幅に向上することを示す。
関連論文リスト
- Web-Scale Visual Entity Recognition: An LLM-Driven Data Approach [56.55633052479446]
Webスケールのビジュアルエンティティ認識は、クリーンで大規模なトレーニングデータがないため、重大な課題を呈している。
本稿では,ラベル検証,メタデータ生成,合理性説明に多モーダル大言語モデル(LLM)を活用することによって,そのようなデータセットをキュレートする新しい手法を提案する。
実験により、この自動キュレートされたデータに基づいてトレーニングされたモデルは、Webスケールの視覚的エンティティ認識タスクで最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2024-10-31T06:55:24Z) - Local Large Language Models for Complex Structured Medical Tasks [0.0]
本稿では,大規模言語モデルの言語推論機能と,複雑なドメイン特化タスクに取り組むための局所学習の利点を組み合わせたアプローチを提案する。
具体的には,病理報告から構造化条件コードを抽出し,そのアプローチを実証する。
論文 参考訳(メタデータ) (2023-08-03T12:36:13Z) - PMC-LLaMA: Towards Building Open-source Language Models for Medicine [62.39105735933138]
大規模言語モデル(LLM)は、自然言語理解において顕著な能力を示した。
LLMは、ドメイン固有の知識が不足しているため、医学的応用のような正確性を必要とする領域で苦労している。
PMC-LLaMAと呼ばれる医療応用に特化した強力なオープンソース言語モデルの構築手順について述べる。
論文 参考訳(メタデータ) (2023-04-27T18:29:05Z) - An Iterative Optimizing Framework for Radiology Report Summarization with ChatGPT [80.33783969507458]
放射線医学報告の「印象」セクションは、放射線医と他の医師とのコミュニケーションにとって重要な基盤である。
近年の研究では、大規模医療用テキストデータを用いた印象自動生成の有望な成果が得られている。
これらのモデルは、しばしば大量の医療用テキストデータを必要とし、一般化性能が劣る。
論文 参考訳(メタデータ) (2023-04-17T17:13:42Z) - Nested Named Entity Recognition from Medical Texts: An Adaptive Shared
Network Architecture with Attentive CRF [53.55504611255664]
ネスト現象によるジレンマを解決するために,ASACと呼ばれる新しい手法を提案する。
提案手法は,適応共有(AS)部と注意条件付きランダムフィールド(ACRF)モジュールの2つの鍵モジュールを含む。
我々のモデルは、異なるカテゴリのエンティティ間の暗黙の区別と関係をキャプチャすることで、より良いエンティティ表現を学ぶことができる。
論文 参考訳(メタデータ) (2022-11-09T09:23:56Z) - Knowledge-Rich Self-Supervised Entity Linking [58.838404666183656]
Knowledge-RIch Self-Supervision(KRISSBERT$)は400万のUMLSエンティティのためのユニバーサルエンティティリンカーである。
提案手法はゼロショット法と少数ショット法を仮定し,利用可能であればエンティティ記述やゴールドレファレンスラベルを簡単に組み込むことができる。
ラベル付き情報を一切使わずに400万のUMLSエンティティのためのユニバーサルエンティティリンカである$tt KRISSBERT$を生成する。
論文 参考訳(メタデータ) (2021-12-15T05:05:12Z) - PharmKE: Knowledge Extraction Platform for Pharmaceutical Texts using
Transfer Learning [0.0]
PharmKEは、医薬品のセマンティック分析を徹底するために、いくつかの段階を通じてディープラーニングを適用するテキスト分析プラットフォームです。
この方法論は、正確なラベル付きトレーニングとテストデータセットの作成に使用され、カスタムエンティティラベリングタスクのモデルトレーニングに使用されます。
得られた結果は、同じデータセットで訓練された微調整BERTおよびBioBERTモデルと比較されます。
論文 参考訳(メタデータ) (2021-02-25T19:36:35Z) - A multi-perspective combined recall and rank framework for Chinese
procedure terminology normalization [11.371582109211815]
本論文では、中国語の手続き用語正規化に焦点を当てる。
用語の表現は様々であり、医学的言及は複数の用語に関連付けられることがある。
上記の課題を解決するため、リコールとランクフレームワークを組み合わせた提案を行います。
論文 参考訳(メタデータ) (2021-01-22T13:37:10Z) - A Lightweight Neural Model for Biomedical Entity Linking [1.8047694351309205]
本論文では,生物医学的実体連携のための軽量ニューラル手法を提案する。
本手法では,アライメント層とアライメント機構を用いて参照とエンティティ名の違いをキャプチャする。
私達のモデルは標準的な評価のベンチマークの前の仕事と競争です。
論文 参考訳(メタデータ) (2020-12-16T10:34:37Z) - Mapping Patterns for Virtual Knowledge Graphs [71.61234136161742]
仮想知識グラフ(VKG)は、レガシーデータソースの統合とアクセスのための最も有望なパラダイムの1つである。
データ管理、データ分析、概念モデリングにおいて研究された、確立された方法論とパターンに基づいて構築する。
検討されたVKGシナリオに基づいて,私たちのカタログを検証し,そのパターンの大部分をカバーすることを示す。
論文 参考訳(メタデータ) (2020-12-03T13:54:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。