論文の概要: Artemis: A Novel Annotation Methodology for Indicative Single Document
Summarization
- arxiv url: http://arxiv.org/abs/2005.02146v2
- Date: Thu, 14 May 2020 02:43:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-06 13:58:16.825932
- Title: Artemis: A Novel Annotation Methodology for Indicative Single Document
Summarization
- Title(参考訳): artemis: 単一の文書要約を示すための新しいアノテーション方法論
- Authors: Rahul Jha, Keping Bi, Yang Li, Mahdi Pakdaman, Asli Celikyilmaz, Ivan
Zhiboedov, Kieran McDonald
- Abstract要約: アルテミス(Artemis)は、複数のドメインから文書の指示的な要約を生成する新しい階層的アノテーションプロセスである。
なぜなら、裁判官は文の1つに重要な判断を下す際に、文書中のすべての文を見る必要がないからである。
我々は532の注釈付き文書のサンプルセットについて分析と実験結果を示す。
- 参考スコア(独自算出の注目度): 27.55699431297619
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We describe Artemis (Annotation methodology for Rich, Tractable, Extractive,
Multi-domain, Indicative Summarization), a novel hierarchical annotation
process that produces indicative summaries for documents from multiple domains.
Current summarization evaluation datasets are single-domain and focused on a
few domains for which naturally occurring summaries can be easily found, such
as news and scientific articles. These are not sufficient for training and
evaluation of summarization models for use in document management and
information retrieval systems, which need to deal with documents from multiple
domains. Compared to other annotation methods such as Relative Utility and
Pyramid, Artemis is more tractable because judges don't need to look at all the
sentences in a document when making an importance judgment for one of the
sentences, while providing similarly rich sentence importance annotations. We
describe the annotation process in detail and compare it with other similar
evaluation systems. We also present analysis and experimental results over a
sample set of 532 annotated documents.
- Abstract(参考訳): artemis (annotation methodology for rich, tractable, extractive, multi-domain, indicative summarization) は、複数のドメインからの文書の表現的要約を生成する、新しい階層的アノテーションプロセスである。
現在の要約評価データセットは単一ドメインであり、ニュースや科学記事など、自然に発生する要約を簡単に発見できるいくつかのドメインに焦点を当てている。
これらは、複数のドメインの文書を扱う必要のある文書管理や情報検索システムで使用される要約モデルの訓練や評価には不十分である。
相対的実用性やピラミッドのような他のアノテーション手法と比較して、アルテミスは、判事が文章の1つに重要な判断を下す際に文書中のすべての文を見る必要がなく、同様にリッチな文の重要アノテーションを提供するため、より魅力的である。
アノテーションプロセスについて詳述し、他の類似の評価システムと比較する。
また、532の注釈付き文書のサンプルセットに対して解析および実験結果を示す。
関連論文リスト
- Unified Multi-Modal Interleaved Document Representation for Information Retrieval [57.65409208879344]
我々は、異なるモダリティでインターリーブされた文書を均等に埋め込み、より包括的でニュアンスのある文書表現を生成する。
具体的には、テキスト、画像、テーブルの処理と統合を統一されたフォーマットと表現に統合する、近年のビジョン言語モデルの能力を活用して、これを実現する。
論文 参考訳(メタデータ) (2024-10-03T17:49:09Z) - Contextual Document Embeddings [77.22328616983417]
本稿では,コンテキスト化された文書埋め込みのための2つの補完手法を提案する。
第一に、文書近傍を明示的にバッチ内コンテキスト損失に組み込む別のコントラスト学習目標である。
第二に、隣接する文書情報をエンコードされた表現に明示的にエンコードする新しいコンテキストアーキテクチャ。
論文 参考訳(メタデータ) (2024-10-03T14:33:34Z) - Mining both Commonality and Specificity from Multiple Documents for
Multi-Document Summarization [1.4629756274247374]
多文書要約タスクでは、設計した要約者が、原文書の重要な情報をカバーする短いテキストを生成する必要がある。
本稿では,文書の階層的クラスタリングに基づくマルチドキュメント要約手法を提案する。
論文 参考訳(メタデータ) (2023-03-05T14:25:05Z) - Open Domain Multi-document Summarization: A Comprehensive Study of Model
Brittleness under Retrieval [42.73076855699184]
マルチドキュメント要約(MDS)は、一連のトピック関連の文書が入力として提供されると仮定する。
タスクを形式化し、既存のデータセット、レトリバー、要約器を使ってブートストラップすることで、より困難な設定について研究する。
論文 参考訳(メタデータ) (2022-12-20T18:41:38Z) - ACM -- Attribute Conditioning for Abstractive Multi Document
Summarization [0.0]
本稿では,属性条件付きモジュールを組み込んだモデルを提案する。
このアプローチは、ベースラインのマルチドキュメント要約アプローチよりもROUGEスコアが大きく向上することを示している。
論文 参考訳(メタデータ) (2022-05-09T00:00:14Z) - Document-Level Relation Extraction with Sentences Importance Estimation
and Focusing [52.069206266557266]
文書レベルの関係抽出(DocRE)は、複数の文の文書から2つのエンティティ間の関係を決定することを目的としている。
我々はDocREのための文重要度スコアと文集中損失を設計するSIEF(Sentence Estimation and Focusing)フレームワークを提案する。
2つのドメインの実験結果から、SIEFは全体的なパフォーマンスを改善するだけでなく、DocREモデルをより堅牢にします。
論文 参考訳(メタデータ) (2022-04-27T03:20:07Z) - Unified Pretraining Framework for Document Understanding [52.224359498792836]
文書理解のための統合事前学習フレームワークであるUDocを紹介する。
UDocは、ほとんどのドキュメント理解タスクをサポートするように設計されており、Transformerを拡張してマルチモーダル埋め込みを入力とする。
UDocの重要な特徴は、3つの自己管理的損失を利用して汎用的な表現を学ぶことである。
論文 参考訳(メタデータ) (2022-04-22T21:47:04Z) - GERE: Generative Evidence Retrieval for Fact Verification [57.78768817972026]
本稿では,ジェネレーション方式で証拠を検索する最初のシステムであるGEREを提案する。
FEVERデータセットの実験結果は、GEREが最先端のベースラインよりも大幅に改善されていることを示している。
論文 参考訳(メタデータ) (2022-04-12T03:49:35Z) - Modeling Endorsement for Multi-Document Abstractive Summarization [10.166639983949887]
単一文書の要約と多文書の要約の重大な違いは、文書の中で健全なコンテンツがどのように現れるかである。
本稿では,複数文書要約における文書間補完効果とその活用をモデル化する。
提案手法は各文書から合成を生成し,他の文書から有意な内容を識別する支援者として機能する。
論文 参考訳(メタデータ) (2021-10-15T03:55:42Z) - RetrievalSum: A Retrieval Enhanced Framework for Abstractive
Summarization [25.434558112121778]
本稿では,高密度Retriever と Summarizer を組み合わせた新しい検索強化抽象要約フレームワークを提案する。
提案手法は,複数のドメインにまたがる広範囲な要約データセットと,BERTとBARTの2つのバックボーンモデルで検証する。
その結果, ROUGE-1 スコアの1.384.66 倍の精度向上が得られた。
論文 参考訳(メタデータ) (2021-09-16T12:52:48Z) - WikiAsp: A Dataset for Multi-domain Aspect-based Summarization [69.13865812754058]
マルチドメインアスペクトベースの要約のための大規模データセットであるWikiAspを提案する。
具体的には、アスペクトアノテーションのプロキシとして、各記事のセクションタイトルとバウンダリを使用して、20の異なるドメインからウィキペディア記事を使用してデータセットを構築します。
その結果,既存の要約モデルがこの設定で直面する重要な課題,例えば引用されたソースの適切な代名詞処理,時間に敏感なイベントの一貫した説明などが浮き彫りになった。
論文 参考訳(メタデータ) (2020-11-16T10:02:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。