論文の概要: A Comprehensive Dictionary and Term Variation Analysis for COVID-19 and
SARS-CoV-2
- arxiv url: http://arxiv.org/abs/2010.14588v1
- Date: Tue, 27 Oct 2020 19:51:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-02 12:34:30.277259
- Title: A Comprehensive Dictionary and Term Variation Analysis for COVID-19 and
SARS-CoV-2
- Title(参考訳): 新型コロナウイルスとSARS-CoV-2の総合辞書と条件変動解析
- Authors: Robert Leaman and Zhiyong Lu
- Abstract要約: SARS-CoV-2(SARS-CoV-2)やCOVID-19(COVID-19)などを指す科学文献における独自の用語の数は、非常に多い。
この高度の項変動は、これらの重要なエンティティの高いリコール識別を困難にする。
文献ではSARS-CoV-2およびCOVID-19の用語の広範な辞書について紹介する。
- 参考スコア(独自算出の注目度): 6.527251100820119
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The number of unique terms in the scientific literature used to refer to
either SARS-CoV-2 or COVID-19 is remarkably large and has continued to increase
rapidly despite well-established standardized terms. This high degree of term
variation makes high recall identification of these important entities
difficult. In this manuscript we present an extensive dictionary of terms used
in the literature to refer to SARS-CoV-2 and COVID-19. We use a rule-based
approach to iteratively generate new term variants, then locate these variants
in a large text corpus. We compare our dictionary to an extensive collection of
terminological resources, demonstrating that our resource provides a
substantial number of additional terms. We use our dictionary to analyze the
usage of SARS-CoV-2 and COVID-19 terms over time and show that the number of
unique terms continues to grow rapidly. Our dictionary is freely available at
https://github.com/ncbi-nlp/CovidTermVar.
- Abstract(参考訳): sars-cov-2またはcovid-19のいずれでも使われる科学文献の固有用語の数は著しく多く、確立された標準用語にもかかわらず急速に増加を続けている。
この高い項変動は、これらの重要な実体の高いリコール識別を困難にする。
本書では,SARS-CoV-2およびCOVID-19の文献で用いられる用語の広範な辞書について述べる。
規則に基づくアプローチで新しい用語の変種を反復的に生成し、その変種を大きなテキストコーパスに配置する。
我々は辞書を用語資源の広範なコレクションと比較し、我々のリソースがかなりの数の追加用語を提供することを示す。
われわれの辞書を用いてSARS-CoV-2とCOVID-19の用語を経時的に分析し、ユニークな用語の数が急速に増え続けていることを示す。
我々の辞書はhttps://github.com/ncbi-nlp/CovidTermVar.comで無料で入手できる。
関連論文リスト
- Refinement of an Epilepsy Dictionary through Human Annotation of Health-related posts on Instagram [5.410785987233275]
私たちは、バイオメディカル用語で作られた辞書を使って、少なくとも一度はてんかん関連薬に言及したユーザーによって、800万件以上のInstagram投稿をタグ付けしました。
1,771のポストと2,947の項一致のランダムなサンプルを、ヒトのアノテーターによって評価し、偽陽性を同定した。
OpenAIのGPTシリーズモデルは人間のアノテーションと比較された。
論文 参考訳(メタデータ) (2024-05-14T17:27:59Z) - DICTDIS: Dictionary Constrained Disambiguation for Improved NMT [50.888881348723295]
我々は辞書から派生した複数の候補翻訳の曖昧さを解消する語彙制約付きNMTシステムであるDictDisを提案する。
我々は、規制、金融、工学を含む様々な分野において、英語・ヒンディー語・英語・ドイツ語文に関する広範な実験を通じて、DictDisの有用性を実証する。
論文 参考訳(メタデータ) (2022-10-13T13:04:16Z) - Entity Disambiguation with Entity Definitions [50.01142092276296]
ローカルモデルはEntity Disambiguation (ED)で最近驚くべきパフォーマンスを達成した
それまでの研究は、各候補者のテキスト表現として、ウィキペディアのタイトルのみを使うことに限られていた。
本稿では、この制限に対処し、より表現力のあるテキスト表現がそれを緩和できる範囲について検討する。
提案する6つのベンチマークのうち2つに新たな技術の現状を報告し,未知のパターンに対する一般化能力を強く改善する。
論文 参考訳(メタデータ) (2022-10-11T17:46:28Z) - Clustering Semantic Predicates in the Open Research Knowledge Graph [0.0]
オープンリサーチ知識グラフ(ORKG)のリソースに関する述語を推奨するために、2つのAIベースのクラスタリングアルゴリズムをカスタマイズするアプローチについて述べる。
線形実行時の性能を比較的高い精度で再現する実験は,非常に有望な結果を示した。
この研究は、44の研究分野にまたがる学術知識のセマンティフィケーションのための一般的なセマンティフィケーションパターンとして、自動的に緩やかに蓄積する述語群に対する新たな洞察を提供する。
論文 参考訳(メタデータ) (2022-10-05T05:48:39Z) - Comprehensive identification of Long Covid articles with
human-in-the-loop machine learning [5.544845443781941]
新型コロナウイルス(COVID-19)の生存者は、日常生活によく影響を及ぼす多系統的な症状を経験する。
ロング・コビッド(Long Covid)は、SARS-CoV-2感染症の急性後遺症である。
論文 参考訳(メタデータ) (2022-09-16T18:36:37Z) - Better Language Model with Hypernym Class Prediction [101.8517004687825]
クラスベース言語モデル (LM) は、コンテキストの疎結合に$n$-gramのLMで対処するために長年開発されてきた。
本研究では,このアプローチをニューラルLMの文脈で再考する。
論文 参考訳(メタデータ) (2022-03-21T01:16:44Z) - Structured abbreviation expansion in context [12.000998471674649]
我々は,短縮メッセージの正規化および拡張バージョンを回復するために,文脈内でのアドホック略語を逆転させる作業を検討する。
この問題は、アドホックの略語が意図的であり、元の単語とはかなり異なる可能性があるという点において、綴りの修正とは関係があるが、異なるものである。
論文 参考訳(メタデータ) (2021-10-04T01:22:43Z) - What Does This Acronym Mean? Introducing a New Dataset for Acronym
Identification and Disambiguation [74.42107665213909]
頭字語は、文書中の長い文を伝達し、文章の主文の1つとして機能する短い形式の句である。
その重要性から、頭字語と対応する語句(AI)を識別し、それぞれの頭字語(AD)の正しい意味を見つけることは、テキスト理解に不可欠である。
このタスクの最近の進歩にもかかわらず、既存のデータセットにはいくつかの制限があり、さらなる改善を妨げる。
論文 参考訳(メタデータ) (2020-10-28T00:12:36Z) - Speakers Fill Lexical Semantic Gaps with Context [65.08205006886591]
我々は単語の語彙的あいまいさを意味のエントロピーとして運用する。
単語のあいまいさの推定値と,WordNetにおける単語の同義語数との間には,有意な相関関係が認められた。
これは、あいまいさの存在下では、話者が文脈をより情報的にすることで補うことを示唆している。
論文 参考訳(メタデータ) (2020-10-05T17:19:10Z) - CO-Search: COVID-19 Information Retrieval with Semantic Search, Question
Answering, and Abstractive Summarization [53.67205506042232]
CO-Searchは、新型コロナウイルスの文献上の複雑なクエリを処理するように設計された、レトリバーランサーセマンティック検索エンジンである。
ドメイン固有の比較的限られたデータセットを考慮し、文書の段落と引用の2部グラフを生成する。
TREC-COVID情報検索課題のデータに基づいて,本システムの評価を行った。
論文 参考訳(メタデータ) (2020-06-17T01:32:48Z) - COVID-19 Time-series Prediction by Joint Dictionary Learning and Online
NMF [6.915425727408129]
辞書学習とオンライン非負行列分解(オンラインNMF)に基づく新型コロナウイルス感染予測の新しい手法を提案する。
まず、時系列全体から学習を最小化し、さらにオンラインNMFによって時系列に適応させることで、このようなパターンを学習する。
我々の予測結果は、その解釈可能性から、学習した辞書パターンに直接関連付けることができる。
論文 参考訳(メタデータ) (2020-04-20T08:02:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。