論文の概要: Multi-document Summarization using Semantic Role Labeling and Semantic
Graph for Indonesian News Article
- arxiv url: http://arxiv.org/abs/2103.03736v1
- Date: Fri, 5 Mar 2021 15:09:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-08 21:48:34.765018
- Title: Multi-document Summarization using Semantic Role Labeling and Semantic
Graph for Indonesian News Article
- Title(参考訳): インドネシアニュース記事のセマンティックロールラベルとセマンティックグラフを用いた多文書要約
- Authors: Yuly Haruka Berliana Gunawan and Masayu Leylia Khodra
- Abstract要約: インドネシアのニュース記事にsemantic role labeling (srl) と semantic graph を用いた複数文書要約システムを提案する。
既存の要約器を改善するために, 主語, 述語, 目的語, 副詞(SVOA)抽出を用いて, 述語引数構造(PAS)抽出を行った。
また,遺伝的アルゴリズムを用いない要約器の性能が向上し,重要なpasを決定木で識別する遺伝的アルゴリズムを置き換えた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: In this paper, we proposed a multi-document summarization system using
semantic role labeling (SRL) and semantic graph for Indonesian news articles.
In order to improve existing summarizer, our system modified summarizer that
employed subject, predicate, object, and adverbial (SVOA) extraction for
predicate argument structure (PAS) extraction. SVOA extraction is replaced with
SRL model for Indonesian. We also replace the genetic algorithm to identify
important PAS with the decision tree classifier since the summarizer without
genetic algorithm gave better performance. The decision tree model is employed
to identify important PAS. The decision tree model with 10 features achieved
better performance than decision tree with 4 sentence features. Experiments and
evaluations are conducted to generate 100 words summary and 200 words summary.
The evaluation shows the proposed model get 0.313 average ROUGE-2 recall in 100
words summary and 0.394 average ROUGE-2 recall in 200 words summary.
- Abstract(参考訳): 本稿では,インドネシアのニュース記事に対する意味ロールラベリング(srl)と意味グラフを用いた複数文書要約システムを提案する。
既存の要約器を改善するために, 主語, 述語, 目的語, 副詞(SVOA)抽出を用いて, 述語引数構造(PAS)抽出を行った。
SVOA抽出はインドネシアのSRLモデルに置き換えられた。
また,遺伝的アルゴリズムを伴わない要約器の性能が向上するため,決定木分類器に重要なpasを同定する遺伝的アルゴリズムを置き換えた。
決定木モデルは重要なPASを特定するのに用いられる。
10 つの特徴を持つ決定木モデルは 4 つの文特徴を持つ決定木よりも優れた性能を得た。
実験と評価を行い,100単語要約と200単語要約を生成する。
提案モデルでは,100語で平均ROUGE-2リコールが0.313,200語で平均ROUGE-2リコールが0.394となった。
関連論文リスト
- Towards Enhancing Coherence in Extractive Summarization: Dataset and Experiments with LLMs [70.15262704746378]
我々は,5つの公開データセットと自然言語ユーザフィードバックのためのコヒーレントな要約からなる,体系的に作成された人間アノテーションデータセットを提案する。
Falcon-40BとLlama-2-13Bによる予備的な実験では、コヒーレントなサマリーを生成するという点で大幅な性能向上(10%ルージュ-L)が見られた。
論文 参考訳(メタデータ) (2024-07-05T20:25:04Z) - RAPTOR: Recursive Abstractive Processing for Tree-Organized Retrieval [26.527911244587134]
本稿では,テキストの集合体への埋め込み,クラスタリング,要約という新たなアプローチを導入し,下から異なるレベルの要約レベルを持つ木を構築する。
我々のRAPTORモデルは、推測時にこの木から取得し、異なるレベルの抽象化で長いドキュメントにまたがる情報を統合します。
論文 参考訳(メタデータ) (2024-01-31T18:30:21Z) - One model to rule them all: ranking Slovene summarizers [0.0]
与えられたテキストに対して最適な要約モデルを推奨するシステムを提案する。
提案システムは、入力内容を解析する完全に接続されたニューラルネットワークを用いる。
提案したSloMetaSumモデルの性能を自動評価し,その一部を手動で評価する。
論文 参考訳(メタデータ) (2023-06-20T13:12:58Z) - Enhancing Coherence of Extractive Summarization with Multitask Learning [40.349019691412465]
本研究では,コヒーレンス向上を伴う抽出要約のためのマルチタスク学習アーキテクチャを提案する。
アーキテクチャは、抽出要約器とコヒーレント判別器モジュールとを含む。
実験の結果,提案手法は抽出した要約文の連続文の割合を大幅に改善することがわかった。
論文 参考訳(メタデータ) (2023-05-22T09:20:58Z) - Enriching Relation Extraction with OpenIE [70.52564277675056]
関係抽出(RE)は情報抽出(IE)のサブ分野である
本稿では,オープン情報抽出(OpenIE)の最近の取り組みがREの課題の改善にどのように役立つかを検討する。
本稿では,2つの注釈付きコーパスであるKnowledgeNetとFewRelを用いた実験により,拡張モデルの精度向上を実証した。
論文 参考訳(メタデータ) (2022-12-19T11:26:23Z) - Text Summarization with Oracle Expectation [88.39032981994535]
抽出要約は、文書の中で最も重要な文を識別し、連結することによって要約を生成する。
ほとんどの要約データセットは、文書文が要約に値するかどうかを示す金のラベルを持っていない。
本稿では,ソフトな予測に基づく文ラベルを生成する,シンプルで効果的なラベル付けアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-09-26T14:10:08Z) - Summarization Programs: Interpretable Abstractive Summarization with
Neural Modular Trees [89.60269205320431]
現在の抽象的要約モデルは明確な解釈可能性の欠如に悩まされるか、あるいは不完全理性を与える。
本稿では,バイナリツリーの(順序付き)リストからなる解釈可能なモジュラーフレームワークであるSummarization Program (SP)を提案する。
要約プログラムは、要約文毎に1つのルートノードを含み、各要約文と文書文を個別のツリーで接続する。
論文 参考訳(メタデータ) (2022-09-21T16:50:22Z) - Liputan6: A Large-scale Indonesian Dataset for Text Summarization [43.375797352517765]
オンラインニュースポータルであるLiputan6.comから記事を抽出し、215,827のドキュメント-要約ペアを取得する。
事前学習した言語モデルを用いて,データセット上のベンチマーク抽出および抽象的要約手法を開発する。
論文 参考訳(メタデータ) (2020-11-02T02:01:12Z) - Multi-Fact Correction in Abstractive Text Summarization [98.27031108197944]
Span-Factは、質問応答モデルから学んだ知識を活用して、スパン選択によるシステム生成サマリーの補正を行う2つの事実補正モデルのスイートである。
我々のモデルは、ソースコードのセマンティック一貫性を確保するために、反復的または自動回帰的にエンティティを置き換えるために、シングルまたはマルチマスキング戦略を採用している。
実験の結果,自動測定と人的評価の両面において,要約品質を犠牲にすることなく,システム生成要約の事実整合性を大幅に向上させることができた。
論文 参考訳(メタデータ) (2020-10-06T02:51:02Z) - Discrete Optimization for Unsupervised Sentence Summarization with
Word-Level Extraction [31.648764677078837]
自動要約は、その最も重要な情報を保存しながら、文章の短いバージョンを生成する。
我々はこれら2つの側面を言語モデリングと意味的類似度メトリクスからなる教師なし目的関数でモデル化する。
提案手法は,ROUGEスコアによる教師なし文要約のための新しい最先端技術を実現する。
論文 参考訳(メタデータ) (2020-05-04T19:01:55Z) - A Hierarchical Network for Abstractive Meeting Summarization with
Cross-Domain Pretraining [52.11221075687124]
本稿では,会議シナリオに適応する抽象的要約ネットワークを提案する。
提案手法は,長時間の会議記録に対応する階層構造と,話者間の差異を表現する役割ベクトルを設計する。
我々のモデルは、自動測定と人的評価の両方において、過去のアプローチよりも優れています。
論文 参考訳(メタデータ) (2020-04-04T21:00:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。