論文の概要: Generating Informative Conclusions for Argumentative Texts
- arxiv url: http://arxiv.org/abs/2106.01064v1
- Date: Wed, 2 Jun 2021 10:35:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-04 03:50:38.837753
- Title: Generating Informative Conclusions for Argumentative Texts
- Title(参考訳): 議論的テキストに対する情報的結論の生成
- Authors: Shahbaz Syed, Khalid Al-Khatib, Milad Alshomary, Henning Wachsmuth,
and Martin Potthast
- Abstract要約: 論証文の目的は、ある結論を支持することである。
明確な結論は、議論文のよい候補要約である。
これは、結論が情報であり、特定の概念をテキストから強調する場合に特に当てはまる。
- 参考スコア(独自算出の注目度): 32.3103908466811
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The purpose of an argumentative text is to support a certain conclusion. Yet,
they are often omitted, expecting readers to infer them rather. While
appropriate when reading an individual text, this rhetorical device limits
accessibility when browsing many texts (e.g., on a search engine or on social
media). In these scenarios, an explicit conclusion makes for a good candidate
summary of an argumentative text. This is especially true if the conclusion is
informative, emphasizing specific concepts from the text. With this paper we
introduce the task of generating informative conclusions: First,
Webis-ConcluGen-21 is compiled, a large-scale corpus of 136,996 samples of
argumentative texts and their conclusions. Second, two paradigms for conclusion
generation are investigated; one extractive, the other abstractive in nature.
The latter exploits argumentative knowledge that augment the data via control
codes and finetuning the BART model on several subsets of the corpus. Third,
insights are provided into the suitability of our corpus for the task, the
differences between the two generation paradigms, the trade-off between
informativeness and conciseness, and the impact of encoding argumentative
knowledge. The corpus, code, and the trained models are publicly available.
- Abstract(参考訳): 議論的なテキストの目的は、ある結論を支持することである。
しかし、しばしば省略され、読者がそれを推測することを期待する。
個々のテキストを読むのに適しているが、この修辞的装置は多くのテキスト(例えば検索エンジンやソーシャルメディア)を閲覧する場合のアクセシビリティを制限する。
これらのシナリオでは、明示的な結論は議論的なテキストのよい要約となる。
これは、結論が情報であり、特定の概念をテキストから強調する場合に特に当てはまる。
本稿では,まず webis-conclugen-21 をコンパイルし,136,996 個の議論テキストの大規模コーパスを作成し,その結論を述べる。
第2に、結論生成のための2つのパラダイム、すなわち1つの抽出、もう1つの抽象的な性質について検討する。
後者は、制御コードを通じてデータを増大させ、コーパスのいくつかのサブセットでBARTモデルを微調整する議論的な知識を利用する。
第3に、タスクに対するコーパスの適合性、二つの世代のパラダイムの違い、情報性と簡潔さのトレードオフ、議論的知識のエンコーディングの影響について、洞察を提供する。
コーパス、コード、トレーニングされたモデルが公開されている。
関連論文リスト
- A School Student Essay Corpus for Analyzing Interactions of Argumentative Structure and Quality [12.187586364960758]
我々は,2つの年齢集団の学生のエッセイ1,320件のドイツ語コーパスを提示する。
各エッセイは、複数のレベルの粒度の議論的構造と品質のために手動で注釈付けされている。
議論マイニングとエッセイスコアリングのためのベースラインアプローチを提案し,両タスク間の相互作用を分析する。
論文 参考訳(メタデータ) (2024-04-03T07:31:53Z) - Natural Language Decompositions of Implicit Content Enable Better Text
Representations [56.85319224208865]
本稿では,暗黙的に伝達されたコンテンツを明示的に考慮したテキスト分析手法を提案する。
我々は大きな言語モデルを用いて、観察されたテキストと推論的に関係する命題の集合を生成する。
本研究は,NLPにおいて,文字のみではなく,観察された言語の背景にある意味をモデル化することが重要であることを示唆する。
論文 参考訳(メタデータ) (2023-05-23T23:45:20Z) - Synthetically generated text for supervised text analysis [5.71097144710995]
テキスト生成の概念的概要、研究者が合成テキストを生成するための異なるテクニックをいつ選択すべきかに関するガイダンス、倫理に関する議論、および合成テキストの品質向上のための簡単なテクニックを提供する。
本稿では,ウクライナにおける戦闘を記述した合成ツイートの生成,イベント検出システムの訓練のための特定の政治事象を記述した合成ニュース記事,文レベルポピュリズム分類器の訓練のためのポピュリスト宣言文の多言語コーパスの3つの応用例を用いて,合成テキストの有用性を示す。
論文 参考訳(メタデータ) (2023-03-28T14:55:13Z) - PropSegmEnt: A Large-Scale Corpus for Proposition-Level Segmentation and
Entailment Recognition [63.51569687229681]
文中の各命題の文的含意関係を個別に認識する必要性について論じる。
提案するPropSegmEntは45K以上の提案のコーパスであり, 専門家によるアノテートを行う。
我々のデータセット構造は、(1)文書内の文章を命題の集合に分割し、(2)異なるが、トポジカルに整合した文書に対して、各命題の含意関係を分類するタスクに類似している。
論文 参考訳(メタデータ) (2022-12-21T04:03:33Z) - MURMUR: Modular Multi-Step Reasoning for Semi-Structured Data-to-Text
Generation [102.20036684996248]
多段階推論を用いた半構造化データからテキストを生成するための,ニューロシンボリックなモジュラーアプローチであるMURMURを提案する。
WebNLG や LogicNLG のような2つのデータ・テキスト生成タスクについて実験を行った。
論文 参考訳(メタデータ) (2022-12-16T17:36:23Z) - TRIE++: Towards End-to-End Information Extraction from Visually Rich
Documents [51.744527199305445]
本稿では,視覚的にリッチな文書からエンド・ツー・エンドの情報抽出フレームワークを提案する。
テキスト読み出しと情報抽出は、よく設計されたマルチモーダルコンテキストブロックを介して互いに強化することができる。
フレームワークはエンドツーエンドのトレーニング可能な方法でトレーニングでき、グローバルな最適化が達成できる。
論文 参考訳(メタデータ) (2022-07-14T08:52:07Z) - Explaining Latent Representations with a Corpus of Examples [72.50996504722293]
本稿では,サンプルベースの説明を自由に選択されたサンプル集合を参照して提供するユーザ中心の手法であるSimplExを提案する。
SimplExは、ポストホックな説明で潜伏空間に対するユーザの理解を改善するためにコーパスを使用する。
SimplExは,モデル表現を説明するコーパス内の関連パターンを強調表示することで,ユーザを力づけることを示す。
論文 参考訳(メタデータ) (2021-10-28T17:59:06Z) - Semi-Supervised Cleansing of Web Argument Corpora [20.65183968971417]
議論ポータルと類似のWebプラットフォームは、計算議論研究における主要なテキストソースの1つである。
本稿では,そのような無関係なテキストを半教師付きで検出する精度指向のアプローチを提案する。
既存のargs.meコーパスで400kの論証文を抽出し,手作業による評価により約87kの無関係文を0.97の精度で検出した。
論文 参考訳(メタデータ) (2020-11-03T15:45:42Z) - The Discussion Tracker Corpus of Collaborative Argumentation [2.800857580710507]
ディベート・トラッカー・コーパスはアメリカ高校の英語の授業で収集された。
コーパスは、985分間の音声から書き起こされた英文学に関する29の多党の議論で構成されている。
論文 参考訳(メタデータ) (2020-05-22T18:27:28Z) - Commonsense Evidence Generation and Injection in Reading Comprehension [57.31927095547153]
本稿では,CEGI と命名された理解を読み取るためのコモンセンス・エビデンス・ジェネレーション・インジェクション・フレームワークを提案する。
この枠組みは、2種類の補助的コモンセンス証拠を包括的読解に注入し、機械に合理的思考能力を持たせる。
CosmosQAデータセットの実験では、提案されたCEGIモデルが現在の最先端アプローチよりも優れていることが示された。
論文 参考訳(メタデータ) (2020-05-11T16:31:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。