論文の概要: IDIAPers @ Causal News Corpus 2022: Extracting Cause-Effect-Signal
Triplets via Pre-trained Autoregressive Language Model
- arxiv url: http://arxiv.org/abs/2209.03891v1
- Date: Thu, 8 Sep 2022 15:54:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-09 12:31:33.520230
- Title: IDIAPers @ Causal News Corpus 2022: Extracting Cause-Effect-Signal
Triplets via Pre-trained Autoregressive Language Model
- Title(参考訳): idiapers @ causal news corpus 2022: pre-trained autoregressive language modelによる因果効果信号三重項の抽出
- Authors: Martin Fajcik, Muskaan Singh, Juan Zuluaga-Gomez, Esa\'u
Villatoro-Tello, Sergio Burdisso, Petr Motlicek, Pavel Smrz
- Abstract要約: 本稿では,CASE-2022 における Subtask 2 に対するタスクの共有提案,Casual News Corpus を用いたイベント因果同定について述べる。
この課題は、ニュースメディアから文中のすべての因果効果信号スパンを自動的に検出することに焦点を当てた。
我々は、事前訓練された自己回帰言語モデルであるT5を用いて、文中の因果効果信号スパンを検出する。
- 参考スコア(独自算出の注目度): 3.4423596432619754
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In this paper, we describe our shared task submissions for Subtask 2 in
CASE-2022, Event Causality Identification with Casual News Corpus. The
challenge focused on the automatic detection of all cause-effect-signal spans
present in the sentence from news-media. We detect cause-effect-signal spans in
a sentence using T5 -- a pre-trained autoregressive language model. We
iteratively identify all cause-effect-signal span triplets, always conditioning
the prediction of the next triplet on the previously predicted ones. To predict
the triplet itself, we consider different causal relationships such as
cause$\rightarrow$effect$\rightarrow$signal. Each triplet component is
generated via a language model conditioned on the sentence, the previous parts
of the current triplet, and previously predicted triplets. Despite training on
an extremely small dataset of 160 samples, our approach achieved competitive
performance, being placed second in the competition. Furthermore, we show that
assuming either cause$\rightarrow$effect or effect$\rightarrow$cause order
achieves similar results. Our code and model predictions will be released
online.
- Abstract(参考訳): 本稿では,CASE-2022, Event Causality Identification with Casual News CorpusにおけるSubtask 2に対するタスクの共有について述べる。
この課題は、ニュースメディアから文中のすべての因果効果信号スパンを自動的に検出することに焦点を当てた。
事前学習された自己回帰言語モデルであるt5を用いて文中の因果効果信号スパンを検出する。
我々は、常に予測された次の三重項の予測を条件に、すべての因果効果信号スパン三重項を反復的に識別する。
三重項自体を予測するために、原因$\rightarrow$effect$\rightarrow$signalのような異なる因果関係を考える。
各トリプレット成分は、文、現在のトリプレットの前部、および以前に予測されたトリプレットに基づいて、言語モデルを介して生成される。
非常に小さな160サンプルのデータセットをトレーニングしたにもかかわらず、我々のアプローチは競争性能を達成し、競争では2位となった。
さらに、$\rightarrow$ effect または effect$\rightarrow$ cause order のいずれかを仮定すると、同様の結果が得られることを示す。
私たちのコードとモデル予測はオンラインでリリースされます。
関連論文リスト
- Forging the Forger: An Attempt to Improve Authorship Verification via Data Augmentation [52.72682366640554]
著者検証(英語: Authorship Verification, AV)とは、ある特定の著者によって書かれたか、別の人物によって書かれたのかを推測するテキスト分類タスクである。
多くのAVシステムは敵の攻撃に弱いことが示されており、悪意のある著者は、その書体スタイルを隠蔽するか、あるいは他の著者の書体を模倣することによって、積極的に分類者を騙そうとしている。
論文 参考訳(メタデータ) (2024-03-17T16:36:26Z) - CTC-based Non-autoregressive Speech Translation [51.37920141751813]
非自己回帰音声翻訳における接続性時間分類の可能性について検討する。
我々は、CTCによって誘導される2つのエンコーダからなるモデルを構築し、ソースおよびターゲットテキストを予測する。
MuST-Cベンチマークの実験では、我々のNASTモデルは平均BLEUスコアが29.5であり、スピードアップは5.67$times$である。
論文 参考訳(メタデータ) (2023-05-27T03:54:09Z) - Collective Robustness Certificates: Exploiting Interdependence in Graph
Neural Networks [71.78900818931847]
ノード分類、画像分割、名前付き一致認識といったタスクでは、複数の予測を同時に出力する分類器があります。
既存の対向ロバスト性証明は、それぞれの予測を独立に考慮し、従ってそのようなタスクに対して過度に悲観的である。
本稿では,摂動下で安定に保たれることが保証される予測数を計算した最初の集合ロバスト性証明を提案する。
論文 参考訳(メタデータ) (2023-02-06T14:46:51Z) - A Generative Approach for Script Event Prediction via Contrastive
Fine-tuning [35.87615178251874]
Scriptイベント予測は、コンテキストが与えられた後続のイベントを予測することを目的としている。
近年の研究では,事前学習言語モデルと外部知識の導入により,事象相関推論の改善が試みられている。
本稿では,事前学習した言語モデルをイベント中心の事前学習目的で微調整する,新しい生成手法を提案する。
論文 参考訳(メタデータ) (2022-12-07T07:32:47Z) - WR-ONE2SET: Towards Well-Calibrated Keyphrase Generation [57.11538133231843]
キーワード生成は、入力文書を要約する短いフレーズを自動的に生成することを目的としている。
最近登場したONE2SETパラダイムは、キーフレーズをセットとして生成し、競争性能を達成した。
本稿では, ONE2SET を拡張した WR-ONE2SET を提案する。
論文 参考訳(メタデータ) (2022-11-13T09:56:24Z) - 1Cademy @ Causal News Corpus 2022: Enhance Causal Span Detection via
Beam-Search-based Position Selector [31.170220710119327]
症例2022における共有タスク3citetan-etal-2022-eventのサブタスク2について, 原因効果信号スパン検出のアプローチを提案する。
本稿では,タスクを読み取り理解(RC)問題としてモデル化し,トークンレベルRCベースのスパン予測パラダイムをベースラインとして適用する。
論文 参考訳(メタデータ) (2022-10-31T09:09:59Z) - Naturalistic Causal Probing for Morpho-Syntax [76.83735391276547]
スペインにおける実世界のデータに対する入力レベルの介入に対する自然主義的戦略を提案する。
提案手法を用いて,共同設立者から文章中の形態・症状の特徴を抽出する。
本研究では,事前学習したモデルから抽出した文脈化表現に対する性別と数字の因果効果を解析するために,本手法を適用した。
論文 参考訳(メタデータ) (2022-05-14T11:47:58Z) - Regularizing End-to-End Speech Translation with Triangular Decomposition
Agreement [27.87144563354033]
本稿では,三重項データにおける二経路分解の整合性を改善するためのモデルトレーニングのための新しい正規化手法を提案する。
MuST-Cベンチマーク実験により,提案手法は最先端のE2E-STベースラインを著しく上回ることを示した。
論文 参考訳(メタデータ) (2021-12-21T05:24:01Z) - Double Perturbation: On the Robustness of Robustness and Counterfactual
Bias Evaluation [109.06060143938052]
テストデータセットを超えたモデル弱点を明らかにするための"ダブル摂動"フレームワークを提案する。
この枠組みを,モデルの頑健さと英語における反事実バイアスの分析に使用される2つの摂動に基づくアプローチに応用する。
論文 参考訳(メタデータ) (2021-04-12T06:57:36Z) - A shallow neural model for relation prediction [2.2559617939136505]
本稿では,エンティティからの欠落関係を正確に推測する浅層神経モデル(shallom)を提案する。
本実験は、SHALLOMがFB15K-237およびWN18RRデータセットにおける最先端のアプローチを上回っていることを示しています。
論文 参考訳(メタデータ) (2021-01-22T13:10:11Z) - Joint Entity and Relation Extraction with Set Prediction Networks [24.01964730210045]
我々は,結合実体と関係抽出を直接セット予測問題として扱う。
一定の順序で三重項を一つずつ生成する自己回帰アプローチとは異なり、提案したネットワークは1ショットで三重項の最終セットを直接出力する。
2つのベンチマークデータセットによる実験により,提案モデルが現在の最先端手法よりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2020-11-03T13:04:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。