論文の概要: Zero-Shot and Few-Shot Classification of Biomedical Articles in Context
of the COVID-19 Pandemic
- arxiv url: http://arxiv.org/abs/2201.03017v1
- Date: Sun, 9 Jan 2022 14:12:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-12 02:49:15.196188
- Title: Zero-Shot and Few-Shot Classification of Biomedical Articles in Context
of the COVID-19 Pandemic
- Title(参考訳): 新型コロナウイルス(covid-19)パンデミックにおけるバイオメディカル記事のゼロショットと少数ショットの分類
- Authors: Simon Lupart, Benoit Favre, Vassilina Nikoulina, Salah Ait-Mokhtar
- Abstract要約: 新型コロナウイルス(COVID-19)パンデミックの文脈では、MeSH記述子は対応するトピックに関する記事に関連して現れている。
本研究では、MeSHで利用可能なリッチな意味情報は、BioBERT表現を改善する可能性があると仮定する。
- 参考スコア(独自算出の注目度): 9.69016170685883
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: MeSH (Medical Subject Headings) is a large thesaurus created by the National
Library of Medicine and used for fine-grained indexing of publications in the
biomedical domain. In the context of the COVID-19 pandemic, MeSH descriptors
have emerged in relation to articles published on the corresponding topic.
Zero-shot classification is an adequate response for timely labeling of the
stream of papers with MeSH categories. In this work, we hypothesise that rich
semantic information available in MeSH has potential to improve BioBERT
representations and make them more suitable for zero-shot/few-shot tasks. We
frame the problem as determining if MeSH term definitions, concatenated with
paper abstracts are valid instances or not, and leverage multi-task learning to
induce the MeSH hierarchy in the representations thanks to a seq2seq task.
Results establish a baseline on the MedLine and LitCovid datasets, and probing
shows that the resulting representations convey the hierarchical relations
present in MeSH.
- Abstract(参考訳): mesh (medical subject headings) は国立医学図書館によって作成され、生物医学領域の出版物の細かなインデックス化に使われる大きなシソーラスである。
新型コロナウイルス(COVID-19)パンデミックの文脈では、MeSH記述子は対応するトピックに関する記事に関連して現れている。
ゼロショット分類は、メッシュカテゴリの論文の流れをタイムリーにラベリングするのに適切な応答である。
本研究では,MeSHで利用可能なリッチな意味情報によってBioBERT表現が向上し,ゼロショット/フェーショットタスクに適合する可能性が示唆された。
本稿では,MeSHの項定義と論文の要約が有効であるか否かを判断し,マルチタスク学習を活用して,Seq2seqタスクによって表現のMeSH階層を誘導する。
結果は、MedLineとLitCovidデータセットのベースラインを確立し、結果の表現がMeSHに存在する階層的関係を伝達していることを示す。
関連論文リスト
- Eye-gaze Guided Multi-modal Alignment for Medical Representation Learning [65.54680361074882]
アイゲイズガイドマルチモーダルアライメント(EGMA)フレームワークは、アイゲイズデータを利用して、医用視覚的特徴とテキスト的特徴のアライメントを改善する。
我々は4つの医療データセット上で画像分類と画像テキスト検索の下流タスクを行う。
論文 参考訳(メタデータ) (2024-03-19T03:59:14Z) - HuBERTopic: Enhancing Semantic Representation of HuBERT through
Self-supervision Utilizing Topic Model [62.995175485416]
本稿では,HuBERTのセマンティック表現を豊かにするための新しいアプローチを提案する。
トピックラベルを教師として使用することにより、HuBERTに補助的なトピック分類タスクを追加する。
実験の結果,本手法は,ほとんどのタスクにおいて,ベースラインと同等あるいは優れた性能を達成できることがわかった。
論文 参考訳(メタデータ) (2023-10-06T02:19:09Z) - PGB: A PubMed Graph Benchmark for Heterogeneous Network Representation
Learning [5.747361083768407]
バイオメディカル文献のための異種グラフ埋め込み評価のための新しいベンチマークであるPubMed Graph Benchmark (PGB)を紹介する。
ベンチマークには、抽象的な著者、引用、MeSH階層、MeSH階層、その他の情報を含む豊富なメタデータが含まれている。
論文 参考訳(メタデータ) (2023-05-04T10:09:08Z) - A Marker-based Neural Network System for Extracting Social Determinants
of Health [12.6970199179668]
健康の社会的決定因子(SDoH)は、患者の医療の質と格差を左右する。
多くのSDoHアイテムは、電子健康記録の構造化形式でコード化されていない。
我々は,臨床ノートから自動的にSDoH情報を抽出する,名前付きエンティティ認識(NER),関係分類(RC),テキスト分類手法を含む多段階パイプラインを探索する。
論文 参考訳(メタデータ) (2022-12-24T18:40:23Z) - Incorporating Emotions into Health Mention Classification Task on Social
Media [70.23889100356091]
情緒的特徴を取り入れた健康言及分類のための枠組みを提案する。
我々は,ソーシャルメディアプラットフォームによる5つのHMC関連データセットに対するアプローチを評価した。
以上の結果から,感情的な知識を取り入れたHMCモデルが有効な選択肢であることが示唆された。
論文 参考訳(メタデータ) (2022-12-09T18:38:41Z) - MeSHup: A Corpus for Full Text Biomedical Document Indexing [19.321887243319924]
我々は、英語で1,342,667のフルテキスト記事を含む大規模注釈付きMeSHインデックスコーパスMeSHupをリリースする。
コーパス上の文書とその関連ラベルの機能を組み合わせたエンドツーエンドモデルをトレーニングし、新しいベースラインを報告します。
論文 参考訳(メタデータ) (2022-04-28T16:04:20Z) - LitMC-BERT: transformer-based multi-label classification of biomedical
literature with an application on COVID-19 literature curation [6.998726118579193]
本研究では,生物医学文献におけるトランスフォーマーを用いた多ラベル分類手法であるLITMC-BERTを提案する。
すべてのラベルに共有トランスフォーマーのバックボーンを使用し、ラベル固有の特徴とラベルペア間の相関をキャプチャする。
マイクロF1とインスタンスベースのF1は、それぞれ現在の最良の結果よりも5%と4%高い。
論文 参考訳(メタデータ) (2022-04-19T04:03:45Z) - KenMeSH: Knowledge-enhanced End-to-end Biomedical Text Labelling [19.321887243319924]
現在、MeSH(Messical Subject Headings)は、PubMedデータベースに記録されたすべてのバイオメディカル記事に手動で割り当てられ、関連する情報の検索を容易にする。
我々は、新しいテキスト機能と動的textbfKnowledge-textbfenhancedマスクアテンションを組み合わせたエンドツーエンドモデルであるKenMeSHを提案する。
論文 参考訳(メタデータ) (2022-03-14T03:09:56Z) - Clinical Named Entity Recognition using Contextualized Token
Representations [49.036805795072645]
本稿では,各単語の意味的意味をより正確に把握するために,文脈型単語埋め込み手法を提案する。
言語モデル(C-ELMo)とC-Flair(C-Flair)の2つの深い文脈型言語モデル(C-ELMo)を事前訓練する。
明示的な実験により、静的単語埋め込みとドメインジェネリック言語モデルの両方と比較して、我々のモデルは劇的に改善されている。
論文 参考訳(メタデータ) (2021-06-23T18:12:58Z) - Semantic Analysis for Automated Evaluation of the Potential Impact of
Research Articles [62.997667081978825]
本稿では,情報理論に基づくテキスト意味のベクトル表現のための新しい手法を提案する。
この情報意味論がLeicester Scientific Corpusに基づいてテキスト分類にどのように使用されるかを示す。
テキストの意味を表現するための情報的アプローチは,研究論文の科学的影響を効果的に予測する方法であることを示す。
論文 参考訳(メタデータ) (2021-04-26T20:37:13Z) - Learning Contextualized Document Representations for Healthcare Answer
Retrieval [68.02029435111193]
コンテキスト談話ベクトル(英: Contextual Discourse Vectors、CDV)は、長文からの効率的な回答検索のための分散文書表現である。
本モデルでは,階層型LSTMレイヤとマルチタスクトレーニングを併用したデュアルエンコーダアーキテクチャを用いて,臨床エンティティの位置と文書の談話に沿った側面をエンコードする。
我々の一般化モデルは、医療パスランキングにおいて、最先端のベースラインを著しく上回っていることを示す。
論文 参考訳(メタデータ) (2020-02-03T15:47:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。