論文の概要: Acronym Identification and Disambiguation Shared Tasks for Scientific
Document Understanding
- arxiv url: http://arxiv.org/abs/2012.11760v4
- Date: Wed, 6 Jan 2021 04:34:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-27 04:33:03.467596
- Title: Acronym Identification and Disambiguation Shared Tasks for Scientific
Document Understanding
- Title(参考訳): 学術文書理解のための頭字語識別と曖昧さ共有課題
- Authors: Amir Pouran Ben Veyseh, Franck Dernoncourt, Thien Huu Nguyen, Walter
Chang, Leo Anthony Celi
- Abstract要約: 頭字語は、文章でよく使われる長いフレーズの短い形です。
すべてのテキスト理解ツールは、テキストの頭字語を認識することができるはずです。
本研究の方向性を推し進めるため,学術文献における頭字語識別と頭字語曖昧化の2つのタスクを編成した。
- 参考スコア(独自算出の注目度): 41.63345823743157
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Acronyms are the short forms of longer phrases and they are frequently used
in writing, especially scholarly writing, to save space and facilitate the
communication of information. As such, every text understanding tool should be
capable of recognizing acronyms in text (i.e., acronym identification) and also
finding their correct meaning (i.e., acronym disambiguation). As most of the
prior works on these tasks are restricted to the biomedical domain and use
unsupervised methods or models trained on limited datasets, they fail to
perform well for scientific document understanding. To push forward research in
this direction, we have organized two shared task for acronym identification
and acronym disambiguation in scientific documents, named AI@SDU and AD@SDU,
respectively. The two shared tasks have attracted 52 and 43 participants,
respectively. While the submitted systems make substantial improvements
compared to the existing baselines, there are still far from the human-level
performance. This paper reviews the two shared tasks and the prominent
participating systems for each of them.
- Abstract(参考訳): 頭字語は長い句の短い形式であり、特に学術的な執筆において、空間を節約し情報の伝達を容易にするためにしばしば使われる。
したがって、すべてのテキスト理解ツールは、テキスト中の頭字語(頭字語識別)を認識し、その正しい意味(頭字語不曖昧)を見つけることができるべきである。
これらのタスクに関する以前の研究のほとんどは、バイオメディカル領域に限定され、限られたデータセットで訓練された教師なしの方法やモデルを使用するため、科学的文書理解のためにうまく機能しない。
この方向の研究を進めるために,我々は,AI@SDU と AD@SDU という2つの共通課題を,それぞれ科学的文書に編成した。
2つの共有タスクはそれぞれ52と43の参加者を集めている。
提出されたシステムは、既存のベースラインと比べて大幅に改善されているが、人間レベルのパフォーマンスには程遠い。
本稿では,2つのタスクの共有と,各タスクの参加システムについてレビューする。
関連論文リスト
- Automated Extraction of Acronym-Expansion Pairs from Scientific Papers [0.0]
このプロジェクトは、デジタルテキストにおける略語や頭字語の普及によって引き起こされる課題に対処する。
本稿では,文書前処理,正規表現,および大規模言語モデルを組み合わせて,省略を識別し,対応する拡張にマッピングする手法を提案する。
論文 参考訳(メタデータ) (2024-12-02T04:05:49Z) - Bridging Research and Readers: A Multi-Modal Automated Academic Papers
Interpretation System [47.13932723910289]
本稿では,3段階のプロセス段階を有するオープンソースマルチモーダル自動学術論文解釈システム(MMAPIS)を紹介する。
ドキュメントからプレーンテキストや表や図を別々に抽出するために、ハイブリッドなモダリティ前処理とアライメントモジュールを使用している。
すると、この情報は彼らが属するセクション名に基づいて調整され、同じセクション名を持つデータが同じセクションの下に分類される。
抽出されたセクション名を用いて、記事を短いテキストセグメントに分割し、LSMを通してセクション内とセクション間の特定の要約を容易にする。
論文 参考訳(メタデータ) (2024-01-17T11:50:53Z) - Pre-training Multi-task Contrastive Learning Models for Scientific
Literature Understanding [52.723297744257536]
事前学習言語モデル(LM)は、科学文献理解タスクにおいて有効であることを示す。
文献理解タスク間の共通知識共有を容易にするために,マルチタスクのコントラスト学習フレームワークであるSciMultを提案する。
論文 参考訳(メタデータ) (2023-05-23T16:47:22Z) - LDKP: A Dataset for Identifying Keyphrases from Long Scientific
Documents [48.84086818702328]
テキスト文書からキーフレーズ(KP)を識別することは、自然言語処理と情報検索の基本的な課題である。
このタスクのベンチマークデータセットの大部分は、ドキュメントのタイトルと抽象情報のみを含む科学領域からのものだ。
人間が書いた要約はほとんどの文書では利用できないし、文書はほとんど常に長く、KPの比率はタイトルと抽象の限られた文脈を超えて直接見つかる。
論文 参考訳(メタデータ) (2022-03-29T08:44:57Z) - Leveraging Domain Agnostic and Specific Knowledge for Acronym
Disambiguation [5.766754189548904]
アクロニムの曖昧さは、テキストの中で曖昧なアクロニムの正しい意味を見つけることを目的としている。
本稿では,hdBERTを用いた階層型デュアルパスBERT法を提案する。
62,441文を含むSciADデータセットを用いて,hdBERTの有効性を検討した。
論文 参考訳(メタデータ) (2021-07-01T09:10:00Z) - BERT-based Acronym Disambiguation with Multiple Training Strategies [8.82012912690778]
Acronym disambiguation (AD) タスクは、与えられた文中の曖昧な頭字語を正しく拡張することを目的としている。
BERTと動的負のサンプル選択を含むいくつかのトレーニング戦略を組み込んだバイナリ分類モデルを提案する。
SciAD実験は,提案手法の有効性を示し,SDU@AAAI-21共有課題2:Acronym Disambiguationのスコアが1位となった。
論文 参考訳(メタデータ) (2021-02-25T05:40:21Z) - MadDog: A Web-based System for Acronym Identification and Disambiguation [44.33455510438843]
略語と略語は、長いフレーズの短い形式であり、さまざまなタイプの執筆に広く使用されています。
その有用性にもかかわらず、特に頭字語がテキストに定義されていない場合は、テキストを理解するための課題も提供します。
様々なドメインの頭字語を処理できる初のウェブベースの頭字語識別および曖昧化システムを提供します。
論文 参考訳(メタデータ) (2021-01-25T04:49:25Z) - Primer AI's Systems for Acronym Identification and Disambiguation [0.0]
頭字語識別と曖昧化のための新しい手法を提案する。
提案手法に比べて性能が大幅に向上した。
両システムは、SDU@AAAI-21共有タスクリーダーボード上で競合的に動作します。
論文 参考訳(メタデータ) (2020-12-14T23:59:05Z) - What Does This Acronym Mean? Introducing a New Dataset for Acronym
Identification and Disambiguation [74.42107665213909]
頭字語は、文書中の長い文を伝達し、文章の主文の1つとして機能する短い形式の句である。
その重要性から、頭字語と対応する語句(AI)を識別し、それぞれの頭字語(AD)の正しい意味を見つけることは、テキスト理解に不可欠である。
このタスクの最近の進歩にもかかわらず、既存のデータセットにはいくつかの制限があり、さらなる改善を妨げる。
論文 参考訳(メタデータ) (2020-10-28T00:12:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。