論文の概要: Summarization Programs: Interpretable Abstractive Summarization with
Neural Modular Trees
- arxiv url: http://arxiv.org/abs/2209.10492v1
- Date: Wed, 21 Sep 2022 16:50:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-22 15:16:08.673067
- Title: Summarization Programs: Interpretable Abstractive Summarization with
Neural Modular Trees
- Title(参考訳): 要約プログラム:ニューラルモジュラー木を用いた解釈可能な抽象要約
- Authors: Swarnadeep Saha, Shiyue Zhang, Peter Hase, Mohit Bansal
- Abstract要約: 現在の抽象的要約モデルは明確な解釈可能性の欠如に悩まされるか、あるいは不完全理性を与える。
本稿では,バイナリツリーの(順序付き)リストからなる解釈可能なモジュラーフレームワークであるSummarization Program (SP)を提案する。
要約プログラムは、要約文毎に1つのルートノードを含み、各要約文と文書文を個別のツリーで接続する。
- 参考スコア(独自算出の注目度): 89.60269205320431
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Current abstractive summarization models either suffer from a lack of clear
interpretability or provide incomplete rationales by only highlighting parts of
the source document. To this end, we propose the Summarization Program (SP), an
interpretable modular framework consisting of an (ordered) list of binary
trees, each encoding the step-by-step generative process of an abstractive
summary sentence from the source document. A Summarization Program contains one
root node per summary sentence, and a distinct tree connects each summary
sentence (root node) to the document sentences (leaf nodes) from which it is
derived, with the connecting nodes containing intermediate generated sentences.
Edges represent different modular operations involved in summarization such as
sentence fusion, compression, and paraphrasing. We first propose an efficient
best-first search method over neural modules, SP-Search that identifies SPs for
human summaries by directly optimizing for ROUGE scores. Next, using these
programs as automatic supervision, we propose seq2seq models that generate
Summarization Programs, which are then executed to obtain final summaries. We
demonstrate that SP-Search effectively represents the generative process behind
human summaries using modules that are typically faithful to their intended
behavior. We also conduct a simulation study to show that Summarization
Programs improve the interpretability of summarization models by allowing
humans to better simulate model reasoning. Summarization Programs constitute a
promising step toward interpretable and modular abstractive summarization, a
complex task previously addressed primarily through blackbox end-to-end neural
systems. Our code is available at
https://github.com/swarnaHub/SummarizationPrograms
- Abstract(参考訳): 現在の抽象的な要約モデルは、明確な解釈可能性の欠如に悩まされるか、あるいはソース文書の一部をハイライトするだけで不完全理性を提供する。
この目的のために,二分木の(順序付けされた)リストからなる解釈可能なモジュラーフレームワークであるsummarization program (sp)を提案する。
要約プログラムは、要約文毎に1つのルートノードを含み、分離木は、各要約文(ルートノード)と、その派生した文書文(リーフノード)とを、中間生成文を含む連結ノードとを接続する。
エッジは、文の融合、圧縮、パラフレーズ化などの要約に関わる異なるモジュラー操作を表す。
そこで我々はまず, ROUGEのスコアを直接最適化することで, 人間の要約のSPを識別するSP-Searchを提案する。
次に,これらのプログラムを自動監視として,要約プログラムを生成するSeq2seqモデルを提案する。
本研究では,SP-Searchが意図した行動に忠実なモジュールを用いて,人間の要約の背後にある生成過程を効果的に表現していることを示す。
また,要約プログラムがモデル推論をより良くシミュレートすることで,要約モデルの解釈可能性を向上させることを示すシミュレーション研究を行った。
要約プログラムは、ブラックボックスのエンド・ツー・エンド・ニューラル・システムによって主に対処された複雑なタスクである、解釈可能でモジュラーな抽象的な要約に向けた有望なステップである。
私たちのコードはhttps://github.com/swarnaHub/SummarizationProgramsで利用可能です。
関連論文リスト
- GLIMMER: Incorporating Graph and Lexical Features in Unsupervised Multi-Document Summarization [13.61818620609812]
我々はGLIMMERと呼ばれる軽量で効果的な非教師付きアプローチを提案し、グラフとLexIcalの特徴をベースとした教師なしマルチ文書要約手法を提案する。
まず、ソース文書から文グラフを構築し、それからテキストから低レベルの特徴をマイニングすることで意味クラスタを自動的に識別する。
また,Multi-News,Multi-XScience,DUC-2004で行った実験により,既存の教師なしアプローチよりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-08-19T16:01:48Z) - Hierarchical Indexing for Retrieval-Augmented Opinion Summarization [60.5923941324953]
本稿では,抽出アプローチの帰属性と拡張性と,大規模言語モデル(LLM)の一貫性と拡散性を組み合わせた,教師なし抽象的意見要約手法を提案する。
我々の方法であるHIROは、意味的に整理された離散的な階層を通して文を経路にマッピングするインデックス構造を学習する。
推測時にインデックスを投入し、入力レビューから人気意見を含む文群を識別し、検索する。
論文 参考訳(メタデータ) (2024-03-01T10:38:07Z) - Source Identification in Abstractive Summarization [0.8883733362171033]
生成された要約文に必須情報を含む入力文を$textitsource文として定義し、ソース文を解析して抽象的な要約がどのように作られるかを研究する。
我々は,複数の手法を比較し,タスクの強いベースラインを確立するために,自動ソース文検出を定式化する。
実験結果から, パープレキシティに基づく手法は, 比較的抽象的条件下では良好に動作し, 類似性に基づく手法は比較的抽出的条件下では頑健であることがわかった。
論文 参考訳(メタデータ) (2024-02-07T09:09:09Z) - AugSumm: towards generalizable speech summarization using synthetic
labels from large language model [61.73741195292997]
抽象音声要約(SSUM)は、音声から人間に似た要約を生成することを目的としている。
従来のSSUMモデルは、主に、人間による注釈付き決定論的要約(英語版)を用いて訓練され、評価されている。
AugSummは,人間のアノテータが拡張要約を生成するためのプロキシとして,大規模言語モデル(LLM)を利用する手法である。
論文 参考訳(メタデータ) (2024-01-10T18:39:46Z) - An Extractive-and-Abstractive Framework for Source Code Summarization [28.553366270065656]
コード要約は、自然言語の形式で与えられたコードスニペットの要約/記事を自動的に生成することを目的としている。
そこで本研究では,人文的な要約を生成できる新しい抽出・抽象的枠組みを提案する。
論文 参考訳(メタデータ) (2022-06-15T02:14:24Z) - Reinforcing Semantic-Symmetry for Document Summarization [15.113768658584979]
文書要約は、長い文書を詳細な情報と正確な意味記述を備えた短いバージョンに凝縮する。
本稿では,文書要約のための新しいtextbfreinforcing stextbfemantic-textbfsymmetric Learning textbfmodelを提案する。
CNN/Daily MailとBigPatentの2つの大胆なベンチマークデータセットに対して、一連の実験が行われた。
論文 参考訳(メタデータ) (2021-12-14T17:41:37Z) - Representing Partial Programs with Blended Abstract Semantics [62.20775388513027]
プログラム合成エンジンにおける部分的なプログラム表現手法について紹介する。
モジュラーニューラルネットワークとして実装された近似実行モデルを学ぶ。
これらのハイブリッドニューロシンボリック表現は、実行誘導型シンセサイザーがより強力な言語構成を使うことができることを示す。
論文 参考訳(メタデータ) (2020-12-23T20:40:18Z) - SummPip: Unsupervised Multi-Document Summarization with Sentence Graph
Compression [61.97200991151141]
SummPipはマルチドキュメント要約のための教師なしの手法である。
元の文書を文グラフに変換し、言語表現と深層表現の両方を考慮に入れます。
次に、スペクトルクラスタリングを適用して複数の文のクラスタを取得し、最後に各クラスタを圧縮して最終的な要約を生成する。
論文 参考訳(メタデータ) (2020-07-17T13:01:15Z) - Knowledge Graph-Augmented Abstractive Summarization with Semantic-Driven
Cloze Reward [42.925345819778656]
本稿では,グラフ拡張と意味駆動型RewarDによる抽象要約のための新しいフレームワークであるASGARDを紹介する。
本稿では,2つのエンコーダ(シーケンシャル文書エンコーダ)とグラフ構造化エンコーダ(グラフ構造化エンコーダ)の利用を提案する。
その結果、我々のモデルは、New York TimesとCNN/Daily Mailのデータセットからの入力として、知識グラフのない変種よりもはるかに高いROUGEスコアを生成することがわかった。
論文 参考訳(メタデータ) (2020-05-03T18:23:06Z) - Extractive Summarization as Text Matching [123.09816729675838]
本稿では,ニューラル抽出要約システムの構築方法に関するパラダイムシフトを作成する。
抽出した要約タスクを意味テキストマッチング問題として定式化する。
我々はCNN/DailyMailの最先端抽出結果を新しいレベル(ROUGE-1の44.41)に推し進めた。
論文 参考訳(メタデータ) (2020-04-19T08:27:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。