論文の概要: DebateSum: A large-scale argument mining and summarization dataset
- arxiv url: http://arxiv.org/abs/2011.07251v1
- Date: Sat, 14 Nov 2020 10:06:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-25 13:27:46.787885
- Title: DebateSum: A large-scale argument mining and summarization dataset
- Title(参考訳): DebateSum: 大規模引数マイニングと要約データセット
- Authors: Allen Roush and Arvind Balaji
- Abstract要約: DebateSumは187,386個の独特な証拠と、対応する議論と抽出的な要約で構成されている。
DebateSum上でいくつかの変換器要約モデルを用いて要約性能のベンチマークを行う。
本稿では,全国言語討論会のメンバーによって広く活用されているデータセットの検索エンジンについて述べる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Prior work in Argument Mining frequently alludes to its potential
applications in automatic debating systems. Despite this focus, almost no
datasets or models exist which apply natural language processing techniques to
problems found within competitive formal debate. To remedy this, we present the
DebateSum dataset. DebateSum consists of 187,386 unique pieces of evidence with
corresponding argument and extractive summaries. DebateSum was made using data
compiled by competitors within the National Speech and Debate Association over
a 7-year period. We train several transformer summarization models to benchmark
summarization performance on DebateSum. We also introduce a set of fasttext
word-vectors trained on DebateSum called debate2vec. Finally, we present a
search engine for this dataset which is utilized extensively by members of the
National Speech and Debate Association today. The DebateSum search engine is
available to the public here: http://www.debate.cards
- Abstract(参考訳): 議論マイニングにおける先行研究は、自動議論システムにおける潜在的な応用をしばしば暗示している。
この焦点にもかかわらず、競合の形式的議論で見つかった問題に自然言語処理技術を適用するデータセットやモデルはほとんど存在しない。
これを改善するために、DebateSumデータセットを提示する。
DebateSumは187,386個のユニークな証拠と、対応する議論と抽出的な要約からなる。
DebateSumは7年間にわたって、National Speech and Debate Association内の競合企業によって収集されたデータを使って作成された。
DebateSum上でいくつかの変換器要約モデルを用いて要約性能のベンチマークを行う。
また、 debatesum でトレーニングされた fasttext word-vectors のセットである debate2vec も紹介する。
最後に,今日,全国講演討論会のメンバーによって広く活用されているこのデータセットの検索エンジンを提案する。
debatesum検索エンジンは、ここで公開されている。 http://www.debate.cards
関連論文リスト
- Can LLMs Beat Humans in Debating? A Dynamic Multi-agent Framework for Competitive Debate [22.813887723656023]
Agent for Debate (Agent4Debate)は、大規模言語モデル(LLM)に基づく動的マルチエージェントフレームワークである。
評価には、Debatrix自動スコアシステムと、確立されたDebatrix-EloとHuman-Eloのランキングに基づく専門家の人間レビュアーが使用されている。
実験の結果、最先端のAgent4Debateは人間の能力に匹敵する能力を示した。
論文 参考訳(メタデータ) (2024-08-08T14:02:45Z) - OpenDebateEvidence: A Massive-Scale Argument Mining and Summarization Dataset [10.385189302526246]
OpenDebateEvidenceは、American Debate Competitiveコミュニティから派生した、議論のマイニングと要約のための包括的なデータセットである。
このデータセットには、350万以上のドキュメントと豊富なメタデータが含まれており、議論を巻き起こした最も広範な証拠の1つである。
論文 参考訳(メタデータ) (2024-06-20T18:22:59Z) - Debatrix: Multi-dimensional Debate Judge with Iterative Chronological Analysis Based on LLM [51.43102092480804]
Debatrixは、Large Language Models (LLMs)に基づく自動ディスカッションジャッジである。
実世界の議論シナリオに合わせるため、私たちはPanelBenchベンチマークを導入し、システムの性能と実際の議論結果を比較した。
以上の結果から,LSMを直接使用して議論評価を行ない,顕著な改善が見られた。
論文 参考訳(メタデータ) (2024-03-12T18:19:47Z) - Argue with Me Tersely: Towards Sentence-Level Counter-Argument
Generation [62.069374456021016]
本稿では,文レベル逆問題生成のためのArgTerselyベンチマークを提案する。
また,Arg-LlaMAによる高品質な逆問題生成手法を提案する。
論文 参考訳(メタデータ) (2023-12-21T06:51:34Z) - DebateKG: Automatic Policy Debate Case Creation with Semantic Knowledge
Graphs [0.0]
本稿では,Argumentative Semantic Knowledge Graphs上で,制約付き最短経路トラバーサルを用いて効果的な議論ケースを構築することができることを示す。
53180の新しい例を導入することで、DebateSumを大幅に改善しました。
政策論争の事例を生成する文脈において、どの知識グラフが優れているかを評価するためのユニークな方法を作成する。
論文 参考訳(メタデータ) (2023-07-09T04:19:19Z) - IAM: A Comprehensive and Large-Scale Dataset for Integrated Argument
Mining Tasks [59.457948080207174]
本稿では,一連の議論マイニングタスクに適用可能なIAMという,包括的で大規模なデータセットを提案する。
データセットの70k近い文は、引数特性に基づいて完全に注釈付けされている。
議論準備プロセスに関連する2つの新しい統合された議論マイニングタスクを提案する。(1) 姿勢分類付きクレーム抽出(CESC)と(2) クレーム・エビデンス・ペア抽出(CEPE)である。
論文 参考訳(メタデータ) (2022-03-23T08:07:32Z) - DEBACER: a method for slicing moderated debates [55.705662163385966]
同じ主題を持つブロックに議論を分割することは理解に不可欠である。
議論を適度に分割する新しいアルゴリズムDEBACERを提案する。
論文 参考訳(メタデータ) (2021-12-10T10:39:07Z) - ConvoSumm: Conversation Summarization Benchmark and Improved Abstractive
Summarization with Argument Mining [61.82562838486632]
我々は、さまざまなオンライン会話形式のニュースコメント、ディスカッションフォーラム、コミュニティ質問応答フォーラム、電子メールスレッドに関する4つの新しいデータセットをクラウドソースする。
我々は、データセットの最先端モデルをベンチマークし、データに関連する特徴を分析します。
論文 参考訳(メタデータ) (2021-06-01T22:17:13Z) - High Quality Real-Time Structured Debate Generation [0.0]
ハイレベルな構造と文法を図りながら議論を起こすための議論木と経路を定義した。
各議論に関連付けられたメタデータを持つ木構造論争の大規模なコーパスを活用する。
以上の結果から,人間に近い品質で複雑なトピックをリアルタイムに議論する能力を示す。
論文 参考訳(メタデータ) (2020-12-01T01:39:38Z) - Aspect-Controlled Neural Argument Generation [65.91772010586605]
我々は、与えられたトピック、スタンス、アスペクトの文レベル引数を生成するために、きめ細かいレベルで制御できる引数生成のための言語モデルを訓練する。
評価の結果,我々の生成モデルは高品質なアスペクト特異的な議論を生成できることがわかった。
これらの議論は、データ拡張による姿勢検出モデルの性能向上と、逆問題の生成に使用できる。
論文 参考訳(メタデータ) (2020-04-30T20:17:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。