論文の概要: IITD at the WANLP 2022 Shared Task: Multilingual Multi-Granularity
Network for Propaganda Detection
- arxiv url: http://arxiv.org/abs/2210.17190v1
- Date: Mon, 31 Oct 2022 10:14:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-01 15:20:45.839771
- Title: IITD at the WANLP 2022 Shared Task: Multilingual Multi-Granularity
Network for Propaganda Detection
- Title(参考訳): IITD at the WANLP 2022 Shared Task: Multilingual Multi-Granularity Network for Propaganda Detection
- Authors: Shubham Mittal and Preslav Nakov
- Abstract要約: 本稿では,アラビア語におけるプロパガンダ検出における共有タスクの2つのサブタスクについて述べる。
Subtask 1は、与えられたツイートで使用されるプロパガンダテクニックを見つけるための多ラベル分類問題である。
Subtask 2は、ツイートに存在する各テクニックのインスタンス毎のテキストスパンを特定するように要求する。
- 参考スコア(独自算出の注目度): 25.536546272915427
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present our system for the two subtasks of the shared task on propaganda
detection in Arabic, part of WANLP'2022. Subtask 1 is a multi-label
classification problem to find the propaganda techniques used in a given tweet.
Our system for this task uses XLM-R to predict probabilities for the target
tweet to use each of the techniques. In addition to finding the techniques,
Subtask 2 further asks to identify the textual span for each instance of each
technique that is present in the tweet; the task can be modeled as a sequence
tagging problem. We use a multi-granularity network with mBERT encoder for
Subtask 2. Overall, our system ranks second for both subtasks (out of 14 and 3
participants, respectively). Our empirical analysis show that it does not help
to use a much larger English corpus annotated with propaganda techniques,
regardless of whether used in English or after translation to Arabic.
- Abstract(参考訳): WANLP'2022の一部として、アラビア語のプロパガンダ検出における共有タスクの2つのサブタスクについて提案する。
subtask 1は、あるツイートで使用されるプロパガンダ技術を見つけるためのマルチラベル分類問題である。
このタスクのシステムは、XLM-Rを用いてターゲットツイートの確率を予測し、それぞれのテクニックを使用する。
テクニックの発見に加えて、subtask 2では、ツイートに含まれる各テクニックのインスタンス毎のテキストスパンの識別も要求している。
Subtask 2 では mBERT エンコーダを用いた多重粒度ネットワークを用いる。
全体として、我々のシステムは両方のサブタスク(それぞれ14名と3名)で第2位にランクされている。
経験的分析の結果, 英語やアラビア語への翻訳後に使用されるかに関わらず, プロパガンダ技術でアノテートされたより大きな英語コーパスを使用するのに役に立たないことがわかった。
関連論文リスト
- SemEval-2024 Task 8: Multidomain, Multimodel and Multilingual Machine-Generated Text Detection [68.858931667807]
Subtask Aは、テキストが人間によって書かれたか、機械によって生成されたかを決定するバイナリ分類タスクである。
サブタスクBは、テキストの正確なソースを検出し、それが人間によって書かれたか、特定のLCMによって生成されたかを認識する。
Subtask Cは、著者が人間から機械へ遷移するテキスト内の変化点を特定することを目的としている。
論文 参考訳(メタデータ) (2024-04-22T13:56:07Z) - CUNI Submission to MRL 2023 Shared Task on Multi-lingual Multi-task
Information Retrieval [5.97515243922116]
本稿では,多言語多タスク情報検索におけるMRL2023共有タスクのためのチャールズ大学システムを提案する。
共有タスクの目的は、いくつかの未表現言語で名前付きエンティティ認識と質問応答のためのシステムを開発することである。
両方のサブタスクに対する私たちのソリューションは、翻訳テストのアプローチに依存しています。
論文 参考訳(メタデータ) (2023-10-25T10:22:49Z) - DAMO-NLP at SemEval-2023 Task 2: A Unified Retrieval-augmented System
for Multilingual Named Entity Recognition [94.90258603217008]
MultiCoNER RNum2共有タスクは、細粒度でノイズの多いシナリオにおいて、多言語の名前付きエンティティ認識(NER)に取り組むことを目的としている。
MultiCoNER RNum1の以前のトップシステムは、ナレッジベースまたはガゼッタを組み込んでいる。
細粒度多言語NERのための統一検索拡張システム(U-RaNER)を提案する。
論文 参考訳(メタデータ) (2023-05-05T16:59:26Z) - Findings of the WMT 2022 Shared Task on Translation Suggestion [63.457874930232926]
We report the results of the first edition of the WMT shared task on Translation Suggestion。
このタスクは、機械翻訳(MT)によって生成された文書全体に対して、特定の単語やフレーズの代替手段を提供することを目的としている。
2つのサブタスク、すなわち単純翻訳提案と暗示付き翻訳提案で構成されている。
論文 参考訳(メタデータ) (2022-11-30T03:48:36Z) - Overview of the WANLP 2022 Shared Task on Propaganda Detection in Arabic [32.27059493109764]
WANLP 2022ワークショップの一環として、アラビア語のツイートでプロパガンダテクニックを検出するタスクを実行しました。
Subtask1は、マルチラベル分類問題であるツイートで使用されるプロパガンダテクニックのセットを特定するよう要求する。
Subtask2は、各プロパガンダテクニックが現れるテキストの正確なスパンと共に、ツイートで使用されるプロパガンダテクニックを検出するように要求する。
論文 参考訳(メタデータ) (2022-11-18T07:04:31Z) - Bridging Cross-Lingual Gaps During Leveraging the Multilingual
Sequence-to-Sequence Pretraining for Text Generation [80.16548523140025]
プレトレインとファインチューンの間のギャップを埋めるために、コードスイッチングの復元タスクを追加して、バニラプレトレイン-ファインチューンパイプラインを拡張します。
提案手法は,言語間文表現距離を狭くし,簡単な計算コストで低周波語翻訳を改善する。
論文 参考訳(メタデータ) (2022-04-16T16:08:38Z) - LTIatCMU at SemEval-2020 Task 11: Incorporating Multi-Level Features for
Multi-Granular Propaganda Span Identification [70.1903083747775]
本稿では,新聞記事におけるプロパガンダ・スパン識別の課題について述べる。
本稿では,BERT-BiLSTMに基づくプロパガンダ分類モデルを提案する。
論文 参考訳(メタデータ) (2020-08-11T16:14:47Z) - CoSDA-ML: Multi-Lingual Code-Switching Data Augmentation for Zero-Shot
Cross-Lingual NLP [68.2650714613869]
我々は,mBERTを微調整するための多言語コードスイッチングデータを生成するためのデータ拡張フレームワークを提案する。
既存の研究と比較すると,本手法は訓練にバイリンガル文を頼らず,複数の対象言語に対して1つの学習プロセスしか必要としない。
論文 参考訳(メタデータ) (2020-06-11T13:15:59Z) - BPGC at SemEval-2020 Task 11: Propaganda Detection in News Articles with
Multi-Granularity Knowledge Sharing and Linguistic Features based Ensemble
Learning [2.8913142991383114]
SemEval 2020 Task-11はニュースプロパガンダ検出のための自動システムの設計を目的としている。
Task-11 は2つのサブタスク、すなわち Span Identification と Technique Classification から構成される。
論文 参考訳(メタデータ) (2020-05-31T19:35:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。