論文の概要: MadDog: A Web-based System for Acronym Identification and Disambiguation
- arxiv url: http://arxiv.org/abs/2101.09893v1
- Date: Mon, 25 Jan 2021 04:49:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-16 07:33:37.394046
- Title: MadDog: A Web-based System for Acronym Identification and Disambiguation
- Title(参考訳): MadDog: 頭字語識別と曖昧化のためのWebベースシステム
- Authors: Amir Pouran Ben Veyseh, Franck Dernoncourt, Walter Chang, Thien Huu
Nguyen
- Abstract要約: 略語と略語は、長いフレーズの短い形式であり、さまざまなタイプの執筆に広く使用されています。
その有用性にもかかわらず、特に頭字語がテキストに定義されていない場合は、テキストを理解するための課題も提供します。
様々なドメインの頭字語を処理できる初のウェブベースの頭字語識別および曖昧化システムを提供します。
- 参考スコア(独自算出の注目度): 44.33455510438843
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Acronyms and abbreviations are the short-form of longer phrases and they are
ubiquitously employed in various types of writing. Despite their usefulness to
save space in writing and reader's time in reading, they also provide
challenges for understanding the text especially if the acronym is not defined
in the text or if it is used far from its definition in long texts. To
alleviate this issue, there are considerable efforts both from the research
community and software developers to build systems for identifying acronyms and
finding their correct meanings in the text. However, none of the existing works
provide a unified solution capable of processing acronyms in various domains
and to be publicly available. Thus, we provide the first web-based acronym
identification and disambiguation system which can process acronyms from
various domains including scientific, biomedical, and general domains. The
web-based system is publicly available at http://iq.cs.uoregon.edu:5000 and a
demo video is available at https://youtu.be/IkSh7LqI42M. The system source code
is also available at https://github.com/amirveyseh/MadDog.
- Abstract(参考訳): 略語と略語は、長いフレーズの短い形式であり、さまざまなタイプの執筆に広く使用されています。
文章中のスペースと読み時間の節約が有用であるにもかかわらず、特に頭字語がテキストで定義されていない場合や長いテキストでの定義から遠く離れている場合など、テキストを理解する上での課題もある。
この問題を軽減するため、研究コミュニティとソフトウェア開発者の両方から、頭字語を識別するシステムを構築し、テキスト中の正しい意味を見つけるための努力がなされている。
しかし、既存の作品のいずれも、さまざまなドメインで頭字語を処理し、公開可能な統一ソリューションを提供していない。
そこで我々は, 科学, 生物医学, 一般分野など, 様々な分野の頭字語を処理できる, 初めてのWebベースの頭字語識別・曖昧化システムを提供する。
Webベースのシステムはhttp://iq.cs.uoregon.edu:5000で公開されており、デモビデオはhttps://youtu.be/IkSh7LqI42Mで公開されている。
システムソースコードはhttps://github.com/amirveyseh/MadDogでも入手できる。
関連論文リスト
- On Translating Technical Terminology: A Translation Workflow for
Machine-Translated Acronyms [3.053989095162017]
技術的な用語、特に頭字語を翻訳する、重要なステップが見逃されていることが分かりました。
Google Translateのような最先端の機械翻訳システムは、頭字語を扱う際に誤用されることがある。
SL-TL (FR-EN) 翻訳ワークフローに追加のステップを提案し、まず、公共消費のための新しい頭字語コーパスを提供し、次に検索ベースのしきい値付けアルゴリズムを実験する。
論文 参考訳(メタデータ) (2024-09-26T15:18:34Z) - MACRONYM: A Large-Scale Dataset for Multilingual and Multi-Domain
Acronym Extraction [66.60031336330547]
様々なNLPアプリケーションには、頭字語とその拡張形式が必要である。
既存のAE研究の限界の1つは、それらが英語と特定のドメインに限定されていることである。
複数の言語やドメインにアノテートされたデータセットが欠落することは、この分野の研究を妨げる大きな問題となっている。
論文 参考訳(メタデータ) (2022-02-19T23:08:38Z) - SimCLAD: A Simple Framework for Contrastive Learning of Acronym
Disambiguation [26.896811663334162]
そこで我々は,頭字語意味をよりよく理解するために,頭字語不明瞭化のコントラスト学習法(SimCLAD)を提案する。
英語の科学領域の頭字語的曖昧さに関する結果は、提案手法が他の競争的最先端(SOTA)手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2021-11-29T02:39:59Z) - CDistNet: Perceiving Multi-Domain Character Distance for Robust Text
Recognition [87.3894423816705]
本稿では,MDCDP (Multi-Domain Character Distance Perception) と呼ばれる新しいモジュールを提案する。
MDCDPは位置埋め込みを使用して、クロスアテンションメカニズムに従って視覚的特徴と意味的特徴の両方を問合せする。
我々は、複数のMDCDPを積み重ねたCDistNetを開発し、徐々に正確な距離モデリングをガイドする。
論文 参考訳(メタデータ) (2021-11-22T06:27:29Z) - Acronym Identification and Disambiguation Shared Tasks for Scientific
Document Understanding [41.63345823743157]
頭字語は、文章でよく使われる長いフレーズの短い形です。
すべてのテキスト理解ツールは、テキストの頭字語を認識することができるはずです。
本研究の方向性を推し進めるため,学術文献における頭字語識別と頭字語曖昧化の2つのタスクを編成した。
論文 参考訳(メタデータ) (2020-12-22T00:29:15Z) - Primer AI's Systems for Acronym Identification and Disambiguation [0.0]
頭字語識別と曖昧化のための新しい手法を提案する。
提案手法に比べて性能が大幅に向上した。
両システムは、SDU@AAAI-21共有タスクリーダーボード上で競合的に動作します。
論文 参考訳(メタデータ) (2020-12-14T23:59:05Z) - What Does This Acronym Mean? Introducing a New Dataset for Acronym
Identification and Disambiguation [74.42107665213909]
頭字語は、文書中の長い文を伝達し、文章の主文の1つとして機能する短い形式の句である。
その重要性から、頭字語と対応する語句(AI)を識別し、それぞれの頭字語(AD)の正しい意味を見つけることは、テキスト理解に不可欠である。
このタスクの最近の進歩にもかかわらず、既存のデータセットにはいくつかの制限があり、さらなる改善を妨げる。
論文 参考訳(メタデータ) (2020-10-28T00:12:36Z) - Techniques for Vocabulary Expansion in Hybrid Speech Recognition Systems [54.49880724137688]
語彙外単語(OOV)の問題は、音声認識システムにおいて典型的である。
OOVをカバーするための一般的なアプローチの1つは、単語ではなくサブワード単位を使用することである。
本稿では,グラフ構築法と探索法の両方のレベルで,この解の既存手法について検討する。
論文 参考訳(メタデータ) (2020-03-19T21:24:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。