論文の概要: WikiUMLS: Aligning UMLS to Wikipedia via Cross-lingual Neural Ranking
- arxiv url: http://arxiv.org/abs/2005.01281v3
- Date: Mon, 2 Nov 2020 06:24:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-07 00:37:01.584987
- Title: WikiUMLS: Aligning UMLS to Wikipedia via Cross-lingual Neural Ranking
- Title(参考訳): WikiUMLS: 言語間ニューラルネットワークによるWikipediaへのUMLSのアラインメント
- Authors: Afshin Rahimi and Timothy Baldwin and Karin Verspoor
- Abstract要約: UMLSの概念をウィキペディアのページと一致させる言語間ニューラルリランクモデルを提案し、72%のリコール@1を達成した。
我々は、700kのUMLS概念のためのランク付きウィキペディアページや、UMLSとウィキペディア間のアライメントモデルのトレーニングと評価のためのデータセットであるWikiUMLSを含むリソースをリリースする。
- 参考スコア(独自算出の注目度): 30.0054637872562
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present our work on aligning the Unified Medical Language System (UMLS) to
Wikipedia, to facilitate manual alignment of the two resources. We propose a
cross-lingual neural reranking model to match a UMLS concept with a Wikipedia
page, which achieves a recall@1 of 72%, a substantial improvement of 20% over
word- and char-level BM25, enabling manual alignment with minimal effort. We
release our resources, including ranked Wikipedia pages for 700k UMLS concepts,
and WikiUMLS, a dataset for training and evaluation of alignment models between
UMLS and Wikipedia. This will provide easier access to Wikipedia for health
professionals, patients, and NLP systems, including in multilingual settings.
- Abstract(参考訳): 本稿では,両リソースのマニュアルアライメントを容易にするために,Unified Medical Language System (UMLS) をウィキペディアにアライメントする作業について述べる。
UMLSの概念をウィキペディアページと一致させる言語間ニューラルリグレードモデルを提案し、72%のリコール@1を達成し、単語とチャリレベルのBM25よりも20%大幅に改善し、最小限の労力で手作業でアライメントを可能にする。
我々は、700kのUMLS概念のためのランク付きウィキペディアページや、UMLSとWikipedia間のアライメントモデルのトレーニングと評価のためのデータセットであるWikiUMLSを含むリソースをリリースする。
これにより、多言語設定を含む医療専門家、患者、NLPシステムのためのWikipediaへのアクセスが容易になる。
関連論文リスト
- An Open Multilingual System for Scoring Readability of Wikipedia [3.992677070507323]
ウィキペディア記事の読みやすさを評価するための多言語モデルを開発した。
ウィキペディアから簡略化されたウィキペディアやオンラインの子供まで、14言語にまたがる新しい多言語データセットを作成します。
我々のモデルはゼロショットシナリオでよく機能し、14言語で80%以上のランキング精度が得られることを示す。
論文 参考訳(メタデータ) (2024-06-03T23:07:18Z) - KnowCoder: Coding Structured Knowledge into LLMs for Universal Information Extraction [59.039355258637315]
コード生成によるユニバーサル情報抽出(UIE)を行うためのLarge Language Model(LLM)であるKnowCoderを提案する。
KnowCoderは、異なるスキーマをPythonクラスに一様に変換するコードスタイルのスキーマ表現メソッドを導入した。
KnowCoderには、2フェーズの学習フレームワークがあり、コード事前トレーニングによるスキーマ理解能力と、命令チューニングによるスキーマ追従能力を向上させる。
論文 参考訳(メタデータ) (2024-03-12T14:56:34Z) - Mitigating Data Imbalance and Representation Degeneration in
Multilingual Machine Translation [103.90963418039473]
Bi-ACLは、MNMTモデルの性能を向上させるために、ターゲット側モノリンガルデータとバイリンガル辞書のみを使用するフレームワークである。
Bi-ACLは、長い尾の言語でも、高リソースの言語でも、より効果的であることを示す。
論文 参考訳(メタデータ) (2023-05-22T07:31:08Z) - XWikiGen: Cross-lingual Summarization for Encyclopedic Text Generation
in Low Resource Languages [11.581072296148031]
ウィキペディアのテキスト生成に関する既存の研究は、英語の参照記事が要約されて英語のウィキペディアページを生成する場合にのみ、英語に焦点を当てている。
本稿では,ウィキペディア形式のテキストを生成するために,多言語で書かれた複数の参照記事からテキストを多文書で要約するタスクであるXWikiGenを提案する。
論文 参考訳(メタデータ) (2023-03-22T04:52:43Z) - A Multilingual Entity Linking System for Wikipedia with a
Machine-in-the-Loop Approach [2.2889152373118975]
ウィキペディアの編集者によるコンテンツの追加とメンテナンスの努力にもかかわらず、多くの言語版ではリンクの配布は少ないままである。
本稿では,リンクを付加するためのコミュニティガイドラインに従うことのできる,ループ内のマシン・イン・ザ・ループ・エンティティ・リンクシステムを提案する。
筆者らは,推薦の確認,拒否,適応が可能な編集者への候補リンクを提案する対話型レコメンデーションインタフェースを開発した。
論文 参考訳(メタデータ) (2021-05-31T16:29:42Z) - Mining Knowledge for Natural Language Inference from Wikipedia
Categories [53.26072815839198]
NLIおよびLEタスクのモデル性能を改善するためのリソースであるWikiNLIを紹介する。
ウィキペディアには、自然に注釈付けされたカテゴリー階層から作られた428,899の句が含まれている。
我々は、BERTやRoBERTaのような強力なベースラインをWikiNLIで事前訓練し、下流タスクでモデルを転送することで改善できることを示します。
論文 参考訳(メタデータ) (2020-10-03T00:45:01Z) - Crosslingual Topic Modeling with WikiPDA [15.198979978589476]
ウィキペディアベースのポリグロット・ディリクレ・アロケーション(WikiPDA)について紹介する。
あらゆる言語で書かれたウィキペディアの記事を、共通の言語に依存しないトピックの集合上の分布として表現することを学ぶ。
28のウィキペディア版における話題バイアスの研究と言語横断的分類の2つのアプリケーションでその実用性を示す。
論文 参考訳(メタデータ) (2020-09-23T15:19:27Z) - Design Challenges in Low-resource Cross-lingual Entity Linking [56.18957576362098]
言語間エンティティリンク (XEL) は、外国語テキスト中のエンティティの言及をウィキペディアのような英語の知識ベースに根拠付ける問題である。
本稿は、英語のウィキペディアの候補タイトルを、特定の外国語の言及に対応付けて識別する重要なステップに焦点を当てる。
本稿では,検索エンジンのクエリログを利用した簡易で効果的なゼロショットXELシステムQuELを提案する。
論文 参考訳(メタデータ) (2020-05-02T04:00:26Z) - Learning Contextualized Document Representations for Healthcare Answer
Retrieval [68.02029435111193]
コンテキスト談話ベクトル(英: Contextual Discourse Vectors、CDV)は、長文からの効率的な回答検索のための分散文書表現である。
本モデルでは,階層型LSTMレイヤとマルチタスクトレーニングを併用したデュアルエンコーダアーキテクチャを用いて,臨床エンティティの位置と文書の談話に沿った側面をエンコードする。
我々の一般化モデルは、医療パスランキングにおいて、最先端のベースラインを著しく上回っていることを示す。
論文 参考訳(メタデータ) (2020-02-03T15:47:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。