論文の概要: Cross-Genre Argument Mining: Can Language Models Automatically Fill in
Missing Discourse Markers?
- arxiv url: http://arxiv.org/abs/2306.04314v1
- Date: Wed, 7 Jun 2023 10:19:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-08 15:10:31.824224
- Title: Cross-Genre Argument Mining: Can Language Models Automatically Fill in
Missing Discourse Markers?
- Title(参考訳): クロスジェネラルな議論マイニング: 言語モデルが談話マーカーに自動的に満たせるか?
- Authors: Gil Rocha, Henrique Lopes Cardoso, Jonas Belouadi, Steffen Eger
- Abstract要約: 本稿では,すべての関係が明示的に示されるような談話マーカーで与えられたテキストを自動的に拡張することを提案する。
我々の分析では、このタスクで人気のある言語モデルが失敗することが明らかになっている。
異なるコーパスで評価したArgument Miningダウンストリームタスクに対するアプローチの効果を実演する。
- 参考スコア(独自算出の注目度): 17.610382230820395
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Available corpora for Argument Mining differ along several axes, and one of
the key differences is the presence (or absence) of discourse markers to signal
argumentative content. Exploring effective ways to use discourse markers has
received wide attention in various discourse parsing tasks, from which it is
well-known that discourse markers are strong indicators of discourse relations.
To improve the robustness of Argument Mining systems across different genres,
we propose to automatically augment a given text with discourse markers such
that all relations are explicitly signaled. Our analysis unveils that popular
language models taken out-of-the-box fail on this task; however, when
fine-tuned on a new heterogeneous dataset that we construct (including
synthetic and real examples), they perform considerably better. We demonstrate
the impact of our approach on an Argument Mining downstream task, evaluated on
different corpora, showing that language models can be trained to automatically
fill in discourse markers across different corpora, improving the performance
of a downstream model in some, but not all, cases. Our proposed approach can
further be employed as an assistive tool for better discourse understanding.
- Abstract(参考訳): アーギュメントマイニングのための利用可能なコーパスは、いくつかの軸に沿って異なり、重要な違いの1つは、議論的内容を伝えるための談話マーカーの存在(または欠如)である。
談話マーカーを効果的に活用する方法の探索は、さまざまな談話解析タスクにおいて広く注目されており、談話マーカーが談話関係の強い指標であることが知られている。
異なるジャンルにわたるアーグメントマイニングシステムのロバスト性を改善するため,すべての関係が明示的に示されるような談話マーカーを用いたテキストの自動拡張を提案する。
我々の分析では、このタスクで一般的な言語モデルは失敗するが、構築する新たな異種データセット(合成例や実例を含む)を微調整すると、かなり性能が向上する。
提案手法が,異なるコーパス上で評価されたArgument Miningダウンストリームタスクに与える影響を実証し,異なるコーパスをまたいだ談話マーカーを自動的に入力し,ダウンストリームモデルの性能を向上させることができることを示した。
提案手法はさらに,談話理解のための補助ツールとして活用することができる。
関連論文リスト
- SpeechComposer: Unifying Multiple Speech Tasks with Prompt Composition [67.08798754009153]
言語モデルは通常、タスク依存のプロンプトトークンを使用して、様々な音声タスクを単一のモデルに統合する。
本稿では,一組のプロンプトトークンを構成することで共通の音声タスクを統一できる,デコーダのみの音声言語モデルであるSpeechComposerを提案する。
論文 参考訳(メタデータ) (2024-01-31T18:06:29Z) - Improved Contextual Recognition In Automatic Speech Recognition Systems
By Semantic Lattice Rescoring [4.819085609772069]
本稿では,意味的格子処理によるASRシステム内における文脈認識の高度化のための新しい手法を提案する。
提案手法は,隠れマルコフモデルとガウス混合モデル(HMM-GMM)とディープニューラルネットワーク(DNN)モデルを用いて,精度を向上する。
本稿では,実験分析によるLibriSpeechデータセット上でのフレームワークの有効性を示す。
論文 参考訳(メタデータ) (2023-10-14T23:16:05Z) - Distributed Marker Representation for Ambiguous Discourse Markers and
Entangled Relations [50.31129784616845]
我々は、無制限の談話マーカーデータと潜在談話感覚を利用して分散マーカ表現(DMR)を学習する。
提案手法は,対話マーカー間の複雑なあいまいさや絡み合いや,手動で定義した談話関係を理解する上でも有用である。
論文 参考訳(メタデータ) (2023-06-19T00:49:51Z) - Pre-training Multi-party Dialogue Models with Latent Discourse Inference [85.9683181507206]
我々は、多人数対話の会話構造、すなわち、各発話が応答する相手を理解するモデルを事前訓練する。
ラベル付きデータを完全に活用するために,談話構造を潜在変数として扱い,それらを共同で推論し,談話認識モデルを事前学習することを提案する。
論文 参考訳(メタデータ) (2023-05-24T14:06:27Z) - Topics in the Haystack: Extracting and Evaluating Topics beyond
Coherence [0.0]
本稿では,文と文書のテーマを深く理解する手法を提案する。
これにより、一般的な単語やネオロジズムを含む潜在トピックを検出することができる。
本稿では, 侵入者の単語の人間識別と相関係数を示し, 単語侵入作業において, ほぼ人間レベルの結果を得る。
論文 参考訳(メタデータ) (2023-03-30T12:24:25Z) - On The Ingredients of an Effective Zero-shot Semantic Parser [95.01623036661468]
我々は、標準発話とプログラムの訓練例を文法から言い換えて、ゼロショット学習を分析する。
改良された文法,より強力なパラフレーズ,効率的な学習手法を用いて,これらのギャップを埋めることを提案する。
我々のモデルはラベル付きデータゼロの2つの意味解析ベンチマーク(Scholar, Geo)で高い性能を達成する。
論文 参考訳(メタデータ) (2021-10-15T21:41:16Z) - Learning to Select Context in a Hierarchical and Global Perspective for
Open-domain Dialogue Generation [15.01710843286394]
階層的自己保持機構と遠隔監視を備えた新しいモデルを提案し、関連する単語と発話を短距離および長距離で検出する。
私たちのモデルは、流速、コヒーレンス、および情報性の観点から他のベースラインを大幅に上回ります。
論文 参考訳(メタデータ) (2021-02-18T11:56:42Z) - Infusing Finetuning with Semantic Dependencies [62.37697048781823]
シンタックスとは異なり、セマンティクスは今日の事前訓練モデルによって表面化されないことを示す。
次に、畳み込みグラフエンコーダを使用して、タスク固有の微調整にセマンティック解析を明示的に組み込む。
論文 参考訳(メタデータ) (2020-12-10T01:27:24Z) - GRADE: Automatic Graph-Enhanced Coherence Metric for Evaluating
Open-Domain Dialogue Systems [133.13117064357425]
自動対話評価のためのグラフ強調表現のための新しい評価指標GRADEを提案する。
具体的には、対話コヒーレンスを評価するために、粗粒度発話レベルの文脈化表現と細粒度トピックレベルのグラフ表現の両方を組み込んでいる。
実験の結果,GRADEは多様な対話モデルの測定において,他の最先端の指標よりも優れていた。
論文 参考訳(メタデータ) (2020-10-08T14:07:32Z) - DiscSense: Automated Semantic Analysis of Discourse Markers [9.272765183222967]
分類データセットにアノテートされた談話マーカーと意味的関係との関係について検討する。
既存の意味的注釈付きデータセットに対する自動修正手法を用いることで、英語における談話マーカーのボトムアップ的特徴付けを提供する。
論文 参考訳(メタデータ) (2020-06-02T13:39:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。