論文の概要: CUHK at SemEval-2020 Task 4: CommonSense Explanation, Reasoning and
Prediction with Multi-task Learning
- arxiv url: http://arxiv.org/abs/2006.09161v2
- Date: Tue, 28 Jul 2020 00:34:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-22 02:06:08.870836
- Title: CUHK at SemEval-2020 Task 4: CommonSense Explanation, Reasoning and
Prediction with Multi-task Learning
- Title(参考訳): CUHK at SemEval-2020 Task 4: CommonSense Explanation, Reasoning and Prediction with Multi-task Learning
- Authors: Hongru Wang and Xiangru Tang and Sunny Lai and Kwong Sak Leung and Jia
Zhu and Gabriel Pui Cheong Fung and Kam-Fai Wong
- Abstract要約: 本稿では,SemEval 2020: Commonsense Validation and Explanation (ComVE)のタスク4に提案したシステムについて述べる。
タスクは、与えられた文が意味があるかどうかを直接検証し、それを説明するためにモデルを必要とする。
マルチタスク設定によるBERTarchitectureに基づいて,ERP(Explain, Reason and Predict)システムを提案する。
- 参考スコア(独自算出の注目度): 22.534520584497503
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper describes our system submitted to task 4 of SemEval 2020:
Commonsense Validation and Explanation (ComVE) which consists of three
sub-tasks. The task is to directly validate the given sentence whether or not
it makes sense and require the model to explain it. Based on BERTarchitecture
with a multi-task setting, we propose an effective and interpretable "Explain,
Reason and Predict" (ERP) system to solve the three sub-tasks about
commonsense: (a) Validation, (b)Reasoning, and (c) Explanation. Inspired by
cognitive studies of common sense, our system first generates a reason or
understanding of the sentences and then chooses which one statement makes
sense, which is achieved by multi-task learning. During the post-evaluation,
our system has reached 92.9% accuracy in subtask A (rank 11), 89.7% accuracy in
subtask B (rank 9), andBLEU score of 12.9 in subtask C (rank 8)
- Abstract(参考訳): 本稿では,3つのサブタスクからなるSemEval 2020: Commonsense Validation and Explanation (ComVE)のタスク4に提案するシステムについて述べる。
タスクは、与えられた文が意味があるかどうかを直接検証し、それを説明するためにモデルを必要とする。
マルチタスク設定によるBERTarchitectureに基づいて,コモンセンスに関する3つのサブタスクを解決するための,有効かつ解釈可能な"説明・推論・予測(ERP)システムを提案する。
(a)検証。
(b)合理化、及び
c) 説明。
共通感覚の認知研究に着想を得て,本システムはまず文の理由や理解を生成し,その文のどの文が意味を持つかを選択し,マルチタスク学習によって達成する。
評価後、我々のシステムはサブタスクA(ランク11)で92.9%、サブタスクB(ランク9)で89.7%、サブタスクC(ランク8)で12.9に達している。
関連論文リスト
- SemEval-2024 Task 8: Multidomain, Multimodel and Multilingual Machine-Generated Text Detection [68.858931667807]
Subtask Aは、テキストが人間によって書かれたか、機械によって生成されたかを決定するバイナリ分類タスクである。
サブタスクBは、テキストの正確なソースを検出し、それが人間によって書かれたか、特定のLCMによって生成されたかを認識する。
Subtask Cは、著者が人間から機械へ遷移するテキスト内の変化点を特定することを目的としている。
論文 参考訳(メタデータ) (2024-04-22T13:56:07Z) - Findings of the WMT 2022 Shared Task on Translation Suggestion [63.457874930232926]
We report the results of the first edition of the WMT shared task on Translation Suggestion。
このタスクは、機械翻訳(MT)によって生成された文書全体に対して、特定の単語やフレーズの代替手段を提供することを目的としている。
2つのサブタスク、すなわち単純翻訳提案と暗示付き翻訳提案で構成されている。
論文 参考訳(メタデータ) (2022-11-30T03:48:36Z) - Combining Modular Skills in Multitask Learning [149.8001096811708]
モジュラー設計は、ニューラルネットワークが様々な知識の面をアンタングルして再結合し、新しいタスクにより系統的に一般化することを奨励する。
この研究では、各タスクは(潜在的に小さな)インベントリから潜在的な離散スキルのサブセットと関連付けられていると仮定する。
ネットワークのモジュラー設計により、強化学習におけるサンプル効率が著しく向上し、教師あり学習における数ショットの一般化が図られる。
論文 参考訳(メタデータ) (2022-02-28T16:07:19Z) - SemEval-2021 Task 4: Reading Comprehension of Abstract Meaning [47.49596196559958]
本稿では,SemEval-2021共有タスクについて紹介する。4: Reading of Abstract Meaning (ReCAM)。
パスとそれに対応する質問が与えられた場合、参加者システムは、抽象概念の5つの候補から正しい回答を選択することが期待される。
Subtask 1は、物理的な世界で直接認識できない概念を、システムがいかにうまくモデル化できるかを評価することを目的としている。
Subtask 2は、ハイパーニム階層にある非特異な概念を解釈するモデルの能力に焦点を当てている。
Subtask 3は、2種類の抽象性に対するモデルの一般化可能性に関する洞察を提供することを目的としている。
論文 参考訳(メタデータ) (2021-05-31T11:04:17Z) - QiaoNing at SemEval-2020 Task 4: Commonsense Validation and Explanation
system based on ensemble of language model [2.728575246952532]
本稿では,SemEval-2020 Task 4コンペティションに提出された言語モデルシステムについて述べる。
我々は、事前訓練された言語モデル(BERT、XLNet、RoBERTa、ALBERT)を用いて転送学習を行い、このタスクでそれらを微調整した。
アンサンブルされたモデルはこの問題をよりよく解決し、モデルの精度はサブタスクAで95.9%に達した。
論文 参考訳(メタデータ) (2020-09-06T05:12:50Z) - CS-NET at SemEval-2020 Task 4: Siamese BERT for ComVE [2.0491741153610334]
本論文では,共通認識を裏付ける文と,そうでない文とを区別するシステムについて述べる。
我々はトランスフォーマーの並列インスタンスを使用し、それによってパフォーマンスが向上します。
その結果, サブタスクAでは94.8%, サブタスクBでは89%の精度が得られた。
論文 参考訳(メタデータ) (2020-07-21T14:08:02Z) - LMVE at SemEval-2020 Task 4: Commonsense Validation and Explanation
using Pretraining Language Model [5.428461405329692]
本稿では,SemEval-2020 Task 4のサブタスクa,bへの提出について述べる。
サブタスク a では、ALBERT ベースのモデルを用いて2つの文候補から共通感覚文を抽出する。
サブタスクbでは、ヒント文機構によって強化された多重選択モデルを用いて、文が常識に反する理由を与えられた選択肢から選択する。
論文 参考訳(メタデータ) (2020-07-06T05:51:10Z) - IIE-NLP-NUT at SemEval-2020 Task 4: Guiding PLM with Prompt Template
Reconstruction Strategy for ComVE [13.334749848189826]
サブタスクを複数選択の質問応答形式に形式化し、プロンプトテンプレートで入力を構築する。
実験結果から,本手法はベースラインシステムと比較して高い性能を示した。
最初の2つのサブタスクの2つの公式テストセットにおいて、96.4の精度と94.3の精度で第3位を確保した。
論文 参考訳(メタデータ) (2020-07-02T06:59:53Z) - SemEval-2020 Task 4: Commonsense Validation and Explanation [24.389998904122244]
SemEval-2020 Task 4, Commonsense Validation and Explanation (ComVE)には3つのサブタスクが含まれている。
我々は,人間にとって理にかなう自然言語文と,そうでないものとを区別できるかどうかを評価することを目的とする。
Subtask A と Subtask B では、上位のシステムのパフォーマンスは人間に近い。
論文 参考訳(メタデータ) (2020-07-01T04:41:05Z) - A Simple Language Model for Task-Oriented Dialogue [61.84084939472287]
SimpleTODはタスク指向対話に対する単純なアプローチであり、すべてのサブタスクのリキャストで訓練された単一因果言語モデルを単一シーケンス予測問題として利用する。
これによりSimpleTODは、事前訓練されたオープンドメイン、GPT-2のような因果言語モデルからのトランスファー学習を完全に活用できる。
論文 参考訳(メタデータ) (2020-05-02T11:09:27Z) - Kungfupanda at SemEval-2020 Task 12: BERT-Based Multi-Task Learning for
Offensive Language Detection [55.445023584632175]
我々は,マルチタスク学習とBERTモデルを組み合わせた攻撃的言語検出システムを構築した。
我々のモデルは、英語のサブタスクAで91.51%のF1スコアを獲得し、これは第1位に匹敵する。
論文 参考訳(メタデータ) (2020-04-28T11:27:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。