論文の概要: Overview of ADoBo 2021: Automatic Detection of Unassimilated Borrowings
in the Spanish Press
- arxiv url: http://arxiv.org/abs/2110.15682v1
- Date: Fri, 29 Oct 2021 11:07:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-01 19:50:13.513066
- Title: Overview of ADoBo 2021: Automatic Detection of Unassimilated Borrowings
in the Spanish Press
- Title(参考訳): ADoBo 2021の概要:スペイン・プレスにおける非同化ボーリングの自動検出
- Authors: Elena \'Alvarez Mellado, Luis Espinosa Anke, Julio Gonzalo Arroyo,
Constantine Lignos, Jordi Porta Zamorano
- Abstract要約: 本稿では、IberLef 2021の文脈で提案された、ADoBo 2021共有タスクの主な成果を要約する。
本課題では,スペイン語ニュースワイヤテキスト中の語彙借用(主に英語からの引用)を検出するために参加者を招待した。
参加者に、トレーニング、開発、テスト分割に分割した語彙借入の注釈付きコーパスを提供した。
- 参考スコア(独自算出の注目度): 8.950918531231158
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: This paper summarizes the main findings of the ADoBo 2021 shared task,
proposed in the context of IberLef 2021. In this task, we invited participants
to detect lexical borrowings (coming mostly from English) in Spanish newswire
texts. This task was framed as a sequence classification problem using BIO
encoding. We provided participants with an annotated corpus of lexical
borrowings which we split into training, development and test splits. We
received submissions from 4 teams with 9 different system runs overall. The
results, which range from F1 scores of 37 to 85, suggest that this is a
challenging task, especially when out-of-domain or OOV words are considered,
and that traditional methods informed with lexicographic information would
benefit from taking advantage of current NLP trends.
- Abstract(参考訳): 本稿では、IberLef 2021の文脈で提案されたADoBo 2021共有タスクの主な成果を要約する。
本研究では,スペイン語ニュースワイヤテキスト中の語彙借用(主に英語からの引用)を検出するために参加者を招待した。
このタスクは、BIOエンコーディングを用いたシーケンス分類問題としてフレーム化された。
参加者に注釈付き語彙借用コーパスを提供し,トレーニング,開発,テスト分割に分割した。
9つの異なるシステムを実行する4チームから応募を受けました。
F1スコア37点から85点までの範囲で、特にドメイン外の単語やOOV語が考慮された場合、これは難しい課題であり、レキシコグラフィー情報に基づく従来の手法は、現在のNLPトレンドを生かして恩恵を受けるだろう。
関連論文リスト
- BLP-2023 Task 2: Sentiment Analysis [7.725694295666573]
本稿では,第1回BLP2023ワークショップの一環として編成されたBLP知覚共有タスクの概要を紹介する。
このタスクは、ソーシャルメディアのテキストの特定の部分における感情の検出として定義される。
本稿では,データセット開発と評価設定を含むタスク設定の詳細な説明を行う。
論文 参考訳(メタデータ) (2023-10-24T21:00:41Z) - ICDAR 2023 Competition on Structured Text Extraction from Visually-Rich
Document Images [198.35937007558078]
大会は2022年12月30日に開かれ、2023年3月24日に閉幕した。
トラック1には35人の参加者と91人の有効な応募があり、トラック2には15人の参加者と26人の応募がある。
提案手法の性能によると, 複雑なシナリオやゼロショットシナリオにおいて, 期待される情報抽出性能にはまだ大きなギャップがあると考えられる。
論文 参考訳(メタデータ) (2023-06-05T22:20:52Z) - RuArg-2022: Argument Mining Evaluation [69.87149207721035]
本稿は、ロシア語テキストを扱う議論分析システムの最初のコンペティションの主催者の報告である。
新型コロナウイルスの感染拡大に伴う3つの話題について、9,550文(ソーシャルメディア投稿記事)のコーパスを用意した。
両タスクで第一位を獲得したシステムは、BERTアーキテクチャのNLI(Natural Language Inference)変種を使用した。
論文 参考訳(メタデータ) (2022-06-18T17:13:37Z) - ITTC @ TREC 2021 Clinical Trials Track [54.141379782822206]
本課題は、患者の入院ノートの要約を構成するトピックに有効な臨床試験を適合させる問題に焦点を当てる。
NLP手法を用いて試行とトピックの表現方法を探索し、共通の検索モデルを用いて各トピックに関連するトライアルのランク付けリストを生成する。
提案されたすべての実行の結果は、すべてのトピックの中央値よりもはるかに上回っていますが、改善の余地はたくさんあります。
論文 参考訳(メタデータ) (2022-02-16T04:56:47Z) - DSC-IITISM at FinCausal 2021: Combining POS tagging with Attention-based
Contextual Representations for Identifying Causal Relationships in Financial
Documents [0.0]
因果検出は、情報検索、イベント予測、質問応答、財務分析、市場調査に応用されている。
本研究では,変換器を用いて財務文書の因果関係を同定し,抽出する手法について検討する。
最適手法は, ブラインドテストにおけるF1スコア0.9551, Exact Matchスコア0.8777を達成する。
論文 参考訳(メタデータ) (2021-10-31T13:09:19Z) - CAiRE in DialDoc21: Data Augmentation for Information-Seeking Dialogue
System [55.43871578056878]
DialDoc21コンペティションでは,サブタスク1で74.95 F1スコア,60.74 Exact Matchスコア,サブタスク2で37.72 SacreBLEUスコアを達成した。
論文 参考訳(メタデータ) (2021-06-07T11:40:55Z) - Constraint 2021: Machine Learning Models for COVID-19 Fake News
Detection Shared Task [0.7614628596146599]
私たちは、COVID-19関連のソーシャルメディア投稿を偽物または本物として分類するという課題に対処します。
本システムでは,従来の機械学習アルゴリズムといくつかの言語的特徴を併用することで,この問題に対処する。
テストデータの重み付き平均F1スコアが95.19%となる線形SVMをベースとした最良の性能システムを見出した。
論文 参考訳(メタデータ) (2021-01-11T05:57:32Z) - Exploring Text-transformers in AAAI 2021 Shared Task: COVID-19 Fake News
Detection in English [30.61407811064534]
本稿では,AAAI 2021の共用タスクである「Fake News Detection」を英語で記述する。
BERT、Roberta、Ernieなど、様々な学習済み言語モデルのアンサンブル法を提案しました。
また、正しく分類されていないサンプルの広範な分析も行います。
論文 参考訳(メタデータ) (2021-01-07T04:01:13Z) - WNUT-2020 Task 2: Identification of Informative COVID-19 English Tweets [21.41654078561586]
10Kツイートのコーパスを構築し、このタスクの開発と評価フェーズを整理する方法について述べる。
55チームの最終システム評価結果から得られた結果の概要を概説する。
論文 参考訳(メタデータ) (2020-10-16T08:28:05Z) - SemEval-2020 Task 10: Emphasis Selection for Written Text in Visual
Media [50.29389719723529]
本稿では,SemEval-2020 Task 10, Emphasis Selection for Written Text in Visual Media の主な成果とその結果を比較した。
この共有タスクの目的は、強調選択のための自動メソッドを設計することである。
タスクに送信されたシステムの解析は、BERTとRoBERTaが、トレーニング済みモデルの最も一般的な選択であることを示している。
論文 参考訳(メタデータ) (2020-08-07T17:24:53Z) - Domain-Specific Language Model Pretraining for Biomedical Natural
Language Processing [73.37262264915739]
バイオメディシンなどのラベルなしテキストの少ないドメインでは、スクラッチから言語モデルを事前学習することで、かなりの利益が得られることを示す。
実験の結果, ドメイン固有のプレトレーニングは, 幅広い生物医学的NLPタスクの基盤となることが明らかとなった。
論文 参考訳(メタデータ) (2020-07-31T00:04:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。