論文の概要: A Self-supervised Approach for Semantic Indexing in the Context of
COVID-19 Pandemic
- arxiv url: http://arxiv.org/abs/2010.03544v1
- Date: Wed, 7 Oct 2020 17:43:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-09 22:36:33.796170
- Title: A Self-supervised Approach for Semantic Indexing in the Context of
COVID-19 Pandemic
- Title(参考訳): 新型コロナウイルスパンデミックにおけるセマンティックインデクシングの自己指導的アプローチ
- Authors: Nima Ebadi, Peyman Najafirad
- Abstract要約: 本稿では,最先端の自己教師型表現学習とトランスフォーマー符号化に基づくセマンティックインデクシング手法を提案する。
本研究は,パンデミック時にセマンティックインデックスモデルに直面する主な課題,すなわち,新たなドメインと分布の劇的な変化に注目した。
- 参考スコア(独自算出の注目度): 1.8782750537161614
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The pandemic has accelerated the pace at which COVID-19 scientific papers are
published. In addition, the process of manually assigning semantic indexes to
these papers by experts is even more time-consuming and overwhelming in the
current health crisis. Therefore, there is an urgent need for automatic
semantic indexing models which can effectively scale-up to newly introduced
concepts and rapidly evolving distributions of the hyperfocused related
literature. In this research, we present a novel semantic indexing approach
based on the state-of-the-art self-supervised representation learning and
transformer encoding exclusively suitable for pandemic crises. We present a
case study on a novel dataset that is based on COVID-19 papers published and
manually indexed in PubMed. Our study shows that our self-supervised model
outperforms the best performing models of BioASQ Task 8a by micro-F1 score of
0.1 and LCA-F score of 0.08 on average. Our model also shows superior
performance on detecting the supplementary concepts which is quite important
when the focus of the literature has drastically shifted towards specific
concepts related to the pandemic. Our study sheds light on the main challenges
confronting semantic indexing models during a pandemic, namely new domains and
drastic changes of their distributions, and as a superior alternative for such
situations, propose a model founded on approaches which have shown auspicious
performance in improving generalization and data efficiency in various NLP
tasks. We also show the joint indexing of major Medical Subject Headings (MeSH)
and supplementary concepts improves the overall performance.
- Abstract(参考訳): 新型コロナウイルス(COVID-19)の科学論文が公表されるペースは加速している。
加えて、専門家がこれらの論文にセマンティックインデックスを手動で割り当てるプロセスは、現在の健康危機においてさらに時間がかかり、圧倒的です。
そのため、新たに導入された概念や、ハイパーフォーカス関連文献の急激な分布を効果的にスケールアップできる自動セマンティックインデックスモデルが必要である。
本研究では,パンデミックの危機にのみ適応したトランスフォーマーエンコーディングと,最先端の自己教師型表現学習に基づくセマンティックインデクシング手法を提案する。
本稿では, PubMed で手動でインデックスされた COVID-19 論文に基づく新しいデータセットのケーススタディを提案する。
本研究は,bioasqタスク8aにおいて,マイクロf1スコアが0.1,lca-fスコアが0.08で,自己教師付きモデルが最高のパフォーマンスモデルを上回ることを示した。
また,本モデルは,パンデミックに関連する特定の概念へと文学の焦点が大幅に移行した際に極めて重要である補足概念の検出において優れた性能を示す。
本研究は,パンデミックにおける意味的索引付けモデル,すなわち新しいドメインや分布の劇的な変化に直面する主な課題に光を当て,その代替として,様々なNLPタスクにおける一般化とデータ効率の向上に顕著なパフォーマンスを示すアプローチに基づくモデルを提案する。
また,MeSH (Major Subject Headings) と補足的概念の併用による総合的パフォーマンスの向上も示す。
関連論文リスト
- Unleashing the Potential of the Diffusion Model in Few-shot Semantic Segmentation [56.87049651707208]
セマンティックはインコンテクストタスクへと発展し、一般化的セグメンテーションモデルを評価する上で重要な要素となった。
我々の最初の焦点は、クエリイメージとサポートイメージの相互作用を容易にする方法を理解することであり、その結果、自己注意フレームワーク内のKV融合法が提案される。
そこで我々はDiffewSというシンプルで効果的なフレームワークを構築し,従来の潜在拡散モデルの生成フレームワークを最大限に保持する。
論文 参考訳(メタデータ) (2024-10-03T10:33:49Z) - Benchmarking Embedding Aggregation Methods in Computational Pathology: A Clinical Data Perspective [32.93871326428446]
人工知能(AI)の最近の進歩は、医療画像と計算病理に革命をもたらしている。
デジタル全スライド画像(WSI)の解析における一定の課題は、何万ものタイルレベルの画像埋め込みをスライドレベルの表現に集約する問題である。
本研究は,9つの臨床的課題を対象とした10種類のスライドレベルのアグリゲーション手法のベンチマーク分析を行った。
論文 参考訳(メタデータ) (2024-07-10T17:00:57Z) - Kernel Density Estimation for Multiclass Quantification [52.419589623702336]
量子化は、クラス有病率の正確な予測値を取得することに関する教師付き機械学習タスクである。
分散マッチング(DM)アプローチは、これまでの文献で提案されている定量化手法の中で、最も重要なファミリーの1つである。
カーネル密度推定(KDE)によりモデル化した多変量密度に基づく新しい表現機構を提案する。
論文 参考訳(メタデータ) (2023-12-31T13:19:27Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Using Large Language Models to Automate Category and Trend Analysis of
Scientific Articles: An Application in Ophthalmology [4.455826633717872]
本稿では,Large Language Models (LLM) のパワーを活用した記事分類の自動手法を提案する。
平均精度は0.86、平均F1は0.85である。
モデルの他の科学分野への拡張性は、様々な分野にわたる研究やトレンド分析の促進にその影響を広げる。
論文 参考訳(メタデータ) (2023-08-31T12:45:53Z) - Drug Discovery under Covariate Shift with Domain-Informed Prior
Distributions over Functions [30.305418761024143]
実世界の薬物発見タスクは、しばしばラベル付きデータの不足とかなりの範囲のデータによって特徴づけられる。
我々は、データ生成プロセスの明示的な事前知識を事前分布にエンコードする原理的な方法を提案する。
我々は,Q-SAVIを組み込んで,事前知識のような化学空間をモデリングプロセスに組み込むことで,相当な精度と校正が可能であることを実証した。
論文 参考訳(メタデータ) (2023-07-14T05:01:10Z) - An Operational Perspective to Fairness Interventions: Where and How to
Intervene [9.833760837977222]
フェアネス介入の評価と文脈化のための包括的枠組みを提案する。
予測パリティに関するケーススタディで、我々のフレームワークを実証する。
グループデータを使わずに予測パリティを実現することは困難である。
論文 参考訳(メタデータ) (2023-02-03T07:04:33Z) - A comprehensive comparative evaluation and analysis of Distributional
Semantic Models [61.41800660636555]
我々は、静的DSMによって生成されたり、BERTによって生成された文脈化されたベクトルを平均化して得られるような、型分布ベクトルの包括的評価を行う。
その結果、予測ベースモデルの優越性は現実よりも明らかであり、ユビキタスではないことが明らかとなった。
我々は認知神経科学からRepresentational similarity Analysis(RSA)の方法論を借りて、分布モデルによって生成された意味空間を検査する。
論文 参考訳(メタデータ) (2021-05-20T15:18:06Z) - Adversarial Sample Enhanced Domain Adaptation: A Case Study on
Predictive Modeling with Electronic Health Records [57.75125067744978]
ドメイン適応を容易にするデータ拡張手法を提案する。
逆生成したサンプルはドメイン適応時に使用される。
その結果,本手法の有効性とタスクの一般性が確認された。
論文 参考訳(メタデータ) (2021-01-13T03:20:20Z) - An efficient representation of chronological events in medical texts [9.118144540451514]
臨床ノートで利用可能な時系列イベントから学習するための体系的手法を提案した。
提案手法は,任意の種類の逐次イベントの非パラメトリック階層表現を生成する。
この手法は、英国で最大の中等医療精神保健 EHR データを用いて開発され、外部で検証された。
論文 参考訳(メタデータ) (2020-10-16T14:54:29Z) - Predicting Clinical Diagnosis from Patients Electronic Health Records
Using BERT-based Neural Networks [62.9447303059342]
医療コミュニティにおけるこの問題の重要性を示す。
本稿では,変換器 (BERT) モデルによる2方向表現の分類順序の変更について述べる。
約400万人のユニークな患者訪問からなる、大規模なロシアのEHRデータセットを使用します。
論文 参考訳(メタデータ) (2020-07-15T09:22:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。