論文の概要: The Discussion Tracker Corpus of Collaborative Argumentation
- arxiv url: http://arxiv.org/abs/2005.11344v1
- Date: Fri, 22 May 2020 18:27:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 09:17:20.918288
- Title: The Discussion Tracker Corpus of Collaborative Argumentation
- Title(参考訳): 協調的議論の議論追跡コーパス
- Authors: Christopher Olshefski, Luca Lugini, Ravneet Singh, Diane Litman,
Amanda Godley
- Abstract要約: ディベート・トラッカー・コーパスはアメリカ高校の英語の授業で収集された。
コーパスは、985分間の音声から書き起こされた英文学に関する29の多党の議論で構成されている。
- 参考スコア(独自算出の注目度): 2.800857580710507
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Although Natural Language Processing (NLP) research on argument mining has
advanced considerably in recent years, most studies draw on corpora of
asynchronous and written texts, often produced by individuals. Few published
corpora of synchronous, multi-party argumentation are available. The Discussion
Tracker corpus, collected in American high school English classes, is an
annotated dataset of transcripts of spoken, multi-party argumentation. The
corpus consists of 29 multi-party discussions of English literature transcribed
from 985 minutes of audio. The transcripts were annotated for three dimensions
of collaborative argumentation: argument moves (claims, evidence, and
explanations), specificity (low, medium, high) and collaboration (e.g.,
extensions of and disagreements about others' ideas). In addition to providing
descriptive statistics on the corpus, we provide performance benchmarks and
associated code for predicting each dimension separately, illustrate the use of
the multiple annotations in the corpus to improve performance via multi-task
learning, and finally discuss other ways the corpus might be used to further
NLP research.
- Abstract(参考訳): 自然言語処理(NLP)による議論マイニングの研究は近年大きく進歩しているが、ほとんどの研究は、個人がしばしば生成する非同期テキストと書面テキストのコーパスに頼っている。
同期的でマルチパーティの議論の公刊コーパスはほとんどない。
議論追跡コーパス(英: discussion tracker corpus)は、アメリカの高校英語の授業で収集された、話し言葉、多人数の議論の書き起こしの注釈付きデータセットである。
コーパスは、985分間の音声から書き起こされた英文学に関する29の多党の議論からなる。
書き起こしは、議論の移動(主張、証拠、説明)、特異性(低い、中、高い)、協力(例えば、他人の考えに対する拡張と不一致)という3次元のコラボレーティブな議論にアノテートされた。
コーパスに関する記述的統計の提供に加えて,各ディメンションを別々に予測するための性能ベンチマークと関連コードを提供し,マルチタスク学習によるパフォーマンス向上のためのコーパス内の複数のアノテーションの利用を例示するとともに,NLP研究をさらに進めるための他の方法について議論する。
関連論文リスト
- Quantifying the redundancy between prosody and text [67.07817268372743]
我々は大きな言語モデルを用いて、韻律と単語自体の間にどれだけの情報が冗長であるかを推定する。
単語が持つ情報と韻律情報の間には,複数の韻律的特徴にまたがる高い冗長性が存在する。
それでも、韻律的特徴はテキストから完全には予測できないことが観察され、韻律は単語の上下に情報を運ぶことが示唆された。
論文 参考訳(メタデータ) (2023-11-28T21:15:24Z) - FRACAS: A FRench Annotated Corpus of Attribution relations in newS [0.0]
引用抽出と情報源帰属のために,フランス語で1676年のニュースワイヤテキストを手作業で注釈付けしたコーパスを提示する。
まず,データ選択時のコーパスの構成と選択について述べる。
次に、手動ラベリングに取り組んでいる8つのアノテータ間のアノテータ間合意について詳述する。
論文 参考訳(メタデータ) (2023-09-19T13:19:54Z) - A Corpus for Sentence-level Subjectivity Detection on English News Articles [49.49218203204942]
我々はこのガイドラインを用いて、議論を呼んだ話題に関する英ニュース記事から抽出した638の目的語と411の主観的な文からなるNewsSD-ENGを収集する。
我々のコーパスは、語彙や機械翻訳といった言語固有のツールに頼ることなく、英語で主観的検出を行う方法を舗装している。
論文 参考訳(メタデータ) (2023-05-29T11:54:50Z) - PropSegmEnt: A Large-Scale Corpus for Proposition-Level Segmentation and
Entailment Recognition [63.51569687229681]
文中の各命題の文的含意関係を個別に認識する必要性について論じる。
提案するPropSegmEntは45K以上の提案のコーパスであり, 専門家によるアノテートを行う。
我々のデータセット構造は、(1)文書内の文章を命題の集合に分割し、(2)異なるが、トポジカルに整合した文書に対して、各命題の含意関係を分類するタスクに類似している。
論文 参考訳(メタデータ) (2022-12-21T04:03:33Z) - Models and Datasets for Cross-Lingual Summarisation [78.56238251185214]
対象言語における多文要約に関連付けられたソース言語において,長い文書を含む言語間要約コーパスを提案する。
コーパスは、チェコ語、英語、フランス語、ドイツ語の4つの言語について、12の言語対と指示をカバーしている。
言語対応のウィキペディアのタイトルから、主節と記事の本体を組み合わせることで、ウィキペディアから言語横断的な文書要約インスタンスを導出する。
論文 参考訳(メタデータ) (2022-02-19T11:55:40Z) - A Novel Corpus of Discourse Structure in Humans and Computers [55.74664144248097]
約27,000節からなる445の人文・コンピュータ生成文書からなる新しいコーパスを提示する。
コーパスは、フォーマルな言論と非公式な言論の両方をカバーし、微調整のGPT-2を用いて生成された文書を含んでいる。
論文 参考訳(メタデータ) (2021-11-10T20:56:08Z) - MIND - Mainstream and Independent News Documents Corpus [0.7347989843033033]
本稿では,オンライン主流メディアや代替メディアソースから収集したさまざまな種類の記事からなるポルトガル語コーパスであるMINDを特徴付ける。
コーパスの記事は、事実、意見、娯楽、風刺、陰謀論の5つのコレクションにまとめられている。
論文 参考訳(メタデータ) (2021-08-13T14:00:12Z) - Generating Informative Conclusions for Argumentative Texts [32.3103908466811]
論証文の目的は、ある結論を支持することである。
明確な結論は、議論文のよい候補要約である。
これは、結論が情報であり、特定の概念をテキストから強調する場合に特に当てはまる。
論文 参考訳(メタデータ) (2021-06-02T10:35:59Z) - Multi-View Sequence-to-Sequence Models with Conversational Structure for
Abstractive Dialogue Summarization [72.54873655114844]
テキスト要約は、NLPにおいて最も困難で興味深い問題の1つである。
本研究では、まず、異なる視点から構造化されていない日々のチャットの会話構造を抽出し、会話を表現するマルチビューシーケンス・ツー・シーケンスモデルを提案する。
大規模対話要約コーパスの実験により,本手法は,自動評価と人的判断の両面から,従来の最先端モデルよりも有意に優れた性能を示した。
論文 参考訳(メタデータ) (2020-10-04T20:12:44Z) - Fine-Grained Analysis of Cross-Linguistic Syntactic Divergences [18.19093600136057]
並列コーパスから任意の言語対の発散パターンを抽出するフレームワークを提案する。
我々のフレームワークは、言語間の相違の詳細な図を提供し、以前のアプローチを一般化し、完全に自動化することを示します。
論文 参考訳(メタデータ) (2020-05-07T13:05:03Z) - Know thy corpus! Robust methods for digital curation of Web corpora [0.0]
本稿では,Webコーパスのデジタルキュレーションのための新しいフレームワークを提案する。
これはそれらの構成や語彙などのパラメータを頑健に推定する。
論文 参考訳(メタデータ) (2020-03-13T17:21:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。