論文の概要: Towards Personalized and Human-in-the-Loop Document Summarization
- arxiv url: http://arxiv.org/abs/2108.09443v1
- Date: Sat, 21 Aug 2021 05:34:46 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-24 15:51:07.215085
- Title: Towards Personalized and Human-in-the-Loop Document Summarization
- Title(参考訳): パーソナライズ・イン・ザ・ループ文書要約に向けて
- Authors: Samira Ghodratnama
- Abstract要約: この論文は、新しい要約技術を用いて情報の過負荷を軽減するための3つの主要な課題に焦点を当てている。
i) 文書要約における機能工学、(ii) 従来の静的および非フレキシブルな要約、(iii) 従来の総合的な要約アプローチ、(iv) 参照要約の必要性をカバーしている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The ubiquitous availability of computing devices and the widespread use of
the internet have generated a large amount of data continuously. Therefore, the
amount of available information on any given topic is far beyond humans'
processing capacity to properly process, causing what is known as information
overload. To efficiently cope with large amounts of information and generate
content with significant value to users, we require identifying, merging and
summarising information. Data summaries can help gather related information and
collect it into a shorter format that enables answering complicated questions,
gaining new insight and discovering conceptual boundaries.
This thesis focuses on three main challenges to alleviate information
overload using novel summarisation techniques. It further intends to facilitate
the analysis of documents to support personalised information extraction. This
thesis separates the research issues into four areas, covering (i) feature
engineering in document summarisation, (ii) traditional static and inflexible
summaries, (iii) traditional generic summarisation approaches, and (iv) the
need for reference summaries. We propose novel approaches to tackle these
challenges, by: i)enabling automatic intelligent feature engineering, ii)
enabling flexible and interactive summarisation, iii) utilising intelligent and
personalised summarisation approaches. The experimental results prove the
efficiency of the proposed approaches compared to other state-of-the-art
models. We further propose solutions to the information overload problem in
different domains through summarisation, covering network traffic data, health
data and business process data.
- Abstract(参考訳): コンピュータデバイスのユビキタス化とインターネットの普及により、大量のデータが継続的に生成されている。
したがって、与えられたトピックに関する利用可能な情報の量は、人間の処理能力をはるかに超え、情報過負荷と呼ばれるものを引き起こす。
大量の情報を効率的に処理し,ユーザにとって重要な価値を持つコンテンツを生成するためには,情報の識別,統合,要約が必要である。
データ要約は、関連する情報を収集し、より短いフォーマットに収集し、複雑な質問に答え、新しい洞察を得、概念境界を発見するのに役立つ。
本論文は,新しい要約手法を用いて情報過負荷を軽減するための3つの課題に焦点を当てている。
さらに、個人化された情報抽出を支援するために文書の分析を容易にする。
この論文は、(i)文書要約における機能工学、(ii)従来の静的および非フレキシブルな要約、(iii)伝統的な総合的な要約アプローチ、(iv)参照要約の必要性の4つの領域に研究問題を分けている。
i)自動インテリジェント機能工学の獲得,ii)柔軟でインタラクティブな要約の実現,iii)知的でパーソナライズされた要約アプローチを活用した新しいアプローチを提案する。
実験の結果,提案手法は他の最先端モデルと比較して有効性が証明された。
さらに,ネットワークトラフィックデータ,ヘルスデータ,ビジネスプロセスデータの要約を通じて,異なるドメインにおける情報過負荷問題に対する解決策を提案する。
関連論文リスト
- Graph Neural Network and NER-Based Text Summarization [1.5850926890180461]
本稿では,グラフニューラルネットワーク(GNN)と名前付きエンティティ認識(NER)システムを活用した,テキスト要約のための革新的なアプローチを紹介する。
本手法は,要約の効率を高めるとともに,凝縮した内容の高次関連性を確保することを目的としている。
論文 参考訳(メタデータ) (2024-02-05T03:00:44Z) - Embrace Divergence for Richer Insights: A Multi-document Summarization
Benchmark and a Case Study on Summarizing Diverse Information from News
Articles [142.7366365876213]
同一イベントを含む複数のニュース記事において遭遇する多様な情報を要約する新しい課題を提案する。
この作業を容易にするために、多様な情報を特定するためのデータ収集スキーマの概要と、DiverseSummというデータセットをキュレートした。
データセットには245のニュース記事が含まれており、各ストーリーは10のニュース記事からなり、人間公認の参照と組み合わせられる。
論文 参考訳(メタデータ) (2023-09-17T20:28:17Z) - Iterative Zero-Shot LLM Prompting for Knowledge Graph Construction [104.29108668347727]
本稿では,最新の生成型大規模言語モデルの可能性を活用する,革新的な知識グラフ生成手法を提案する。
このアプローチは、新しい反復的なゼロショットと外部知識に依存しない戦略を含むパイプラインで伝達される。
我々は、我々の提案がスケーラブルで多目的な知識グラフ構築に適したソリューションであり、異なる新しい文脈に適用できると主張している。
論文 参考訳(メタデータ) (2023-07-03T16:01:45Z) - A Topic-aware Summarization Framework with Different Modal Side
Information [40.11141446039445]
本稿では,様々な側面情報を柔軟に組み込んだ一般的な要約フレームワークを提案する。
まず,文書と各種の側情報から潜在トピックを共同で発見する,統合されたトピックエンコーダを提案する。
その結果,我々のモデルは,3つの公開単一モーダルまたはマルチモーダルベンチマークの要約データセットに対して,強いベースラインをはるかに超えていることがわかった。
論文 参考訳(メタデータ) (2023-05-19T08:09:45Z) - KATSum: Knowledge-aware Abstractive Text Summarization [7.210851256475742]
本稿では、知識グラフがもたらす利点を活用して、標準的なSeq2Seqモデルを強化する、知識対応抽象テキスト要約と呼ばれる新しいモデルを提案する。
それに加えて、Knowledge Graph三つ子をソーステキストから抽出し、キーワードに関係情報を提供し、一貫性と事実的にエラーのない要約を生成する。
その結果,提案フレームワークは知識グラフからの情報を効果的に活用し,要約における事実的誤りを著しく低減できることがわかった。
論文 参考訳(メタデータ) (2022-12-06T23:43:50Z) - Making Science Simple: Corpora for the Lay Summarisation of Scientific
Literature [21.440724685950443]
PLOS(大規模)とeLife(medium-scale)の2つの新しい階層化データセットを提案する。
私たちは、データセット間の可読性と抽象性の異なるレベルを強調しながら、レイサマリーの徹底的な特徴付けを提供します。
論文 参考訳(メタデータ) (2022-10-18T15:28:30Z) - Generalization with Lossy Affordances: Leveraging Broad Offline Data for
Learning Visuomotor Tasks [65.23947618404046]
本研究では,広範囲なデータを用いたオフライン強化学習を通じて,時間的拡張タスクの目標条件付きポリシを取得するフレームワークを提案する。
新たなタスク目標に直面した場合、フレームワークは余裕モデルを使用して、元のタスクをより簡単な問題に分解するサブゴールとして、損失のある表現のシーケンスを計画する。
我々は,従来の作業からロボット体験の大規模データセットを事前学習し,手動の報酬工学を使わずに視覚入力から,新しいタスクを効率的に微調整できることを実証した。
論文 参考訳(メタデータ) (2022-10-12T21:46:38Z) - Automatic Text Summarization Methods: A Comprehensive Review [1.6114012813668934]
本研究は,要約手法,使用する手法,標準データセット,評価指標,今後の研究範囲などのテキスト要約概念を詳細に分析する。
論文 参考訳(メタデータ) (2022-03-03T10:45:00Z) - Algorithmic Fairness Datasets: the Story so Far [68.45921483094705]
データ駆動アルゴリズムは、人々の幸福に直接影響し、批判的な決定をサポートするために、さまざまな領域で研究されている。
研究者のコミュニティは、既存のアルゴリズムの株式を調査し、新しいアルゴリズムを提案し、歴史的に不利な人口に対する自動意思決定のリスクと機会の理解を深めてきた。
公正な機械学習の進歩はデータに基づいており、適切に文書化された場合にのみ適切に使用できる。
残念なことに、アルゴリズムフェアネスコミュニティは、特定のリソース(オパシティ)に関する情報の不足と利用可能な情報の分散(スパーシティ)によって引き起こされる、集合的なデータドキュメント負債に悩まされている。
論文 参考訳(メタデータ) (2022-02-03T17:25:46Z) - Abstractive Query Focused Summarization with Query-Free Resources [60.468323530248945]
本稿では,汎用的な要約リソースのみを利用して抽象的なqfsシステムを構築する問題を考える。
本稿では,要約とクエリのための新しい統一表現からなるMasked ROUGE回帰フレームワークであるMargeを提案する。
最小限の監視から学習したにもかかわらず,遠隔管理環境において最先端の結果が得られた。
論文 参考訳(メタデータ) (2020-12-29T14:39:35Z) - ENT-DESC: Entity Description Generation by Exploring Knowledge Graph [53.03778194567752]
実際には、出力記述が最も重要な知識のみをカバーするため、入力知識は十分以上である可能性がある。
我々は、KG-to-textにおけるこのような実践的なシナリオの研究を容易にするために、大規模で挑戦的なデータセットを導入する。
本稿では,元のグラフ情報をより包括的に表現できるマルチグラフ構造を提案する。
論文 参考訳(メタデータ) (2020-04-30T14:16:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。