論文の概要: Unsupervised Extractive Summarization by Human Memory Simulation
- arxiv url: http://arxiv.org/abs/2104.08392v1
- Date: Fri, 16 Apr 2021 22:49:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-20 14:16:55.515667
- Title: Unsupervised Extractive Summarization by Human Memory Simulation
- Title(参考訳): ヒト記憶シミュレーションによる教師なし抽出要約
- Authors: Ronald Cardenas and Matthias Galle and Shay B. Cohen
- Abstract要約: コンテンツユニットの認知表現と、これらが人間の記憶に保持または忘れられている方法を利用する幅広いコンテンツ表現を紹介します。
人間の記憶のこれらの表現の性質は、科学論文のコンテンツ単位の関連性を捉えるために利用することができる。
- 参考スコア(独自算出の注目度): 30.053445079089983
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Summarization systems face the core challenge of identifying and selecting
important information. In this paper, we tackle the problem of content
selection in unsupervised extractive summarization of long, structured
documents. We introduce a wide range of heuristics that leverage cognitive
representations of content units and how these are retained or forgotten in
human memory. We find that properties of these representations of human memory
can be exploited to capture relevance of content units in scientific articles.
Experiments show that our proposed heuristics are effective at leveraging
cognitive structures and the organization of the document (i.e.\ sections of an
article), and automatic and human evaluations provide strong evidence that
these heuristics extract more summary-worthy content units.
- Abstract(参考訳): 要約システムは重要な情報を識別し選択するという中核的な課題に直面している。
本稿では,長い構造化文書の教師なし抽出要約において,コンテンツ選択の問題に取り組む。
我々は,コンテンツ単位の認知的表現と,それらがどのように人間の記憶に保持されるか忘れられるかを活用する,幅広いヒューリスティックスを導入する。
人間の記憶のこれらの表現の性質は、科学論文のコンテンツ単位の関連性を捉えるために利用することができる。
実験により,提案するヒューリスティックスは,認知構造や文書の整理に有効であること,自動評価と人間評価により,より要約価値の高いコンテンツ単位を抽出できるという強い証拠が得られた。
関連論文リスト
- Extracting Training Data from Document-Based VQA Models [67.1470112451617]
VLM(Vision-Language Models)は、文書ベースの視覚質問回答において顕著な進歩を遂げている(つまり、画像として提供される入力文書の内容に関する問い合わせに応答する)。
これらのモデルでは、関連する視覚情報が削除された場合でも、トレーニングサンプルに対する応答を記憶し、それらをリグルジタイズすることができる。
これには、トレーニングセットで繰り返し繰り返されるパーソナライズ可能な情報が含まれており、これらのモデルが機密情報を漏らし、したがってプライバシーリスクを引き起こす可能性があることを示している。
論文 参考訳(メタデータ) (2024-07-11T17:44:41Z) - In-Memory Learning: A Declarative Learning Framework for Large Language
Models [56.62616975119192]
本研究では,人間ラベルデータに頼らずにエージェントが環境に整合できる新しい学習フレームワークを提案する。
このプロセス全体がメモリコンポーネント内で変換され、自然言語で実装される。
フレームワークの有効性を実証し、この問題に対する洞察を提供する。
論文 参考訳(メタデータ) (2024-03-05T08:25:11Z) - The Creative Frontier of Generative AI: Managing the Novelty-Usefulness
Tradeoff [0.4873362301533825]
生成人工知能(AI)システムにおける新規性と有用性の最適バランスについて検討する。
どちらの側面も過度に強調すると、幻覚や暗記のような限界に繋がる。
論文 参考訳(メタデータ) (2023-06-06T11:44:57Z) - Remembering What Is Important: A Factorised Multi-Head Retrieval and
Auxiliary Memory Stabilisation Scheme for Human Motion Prediction [41.34294145237618]
本稿では、歴史的知識のモデリングを改善するために、革新的な補助メモリ駆動のディープニューラルネットワークフレームワークを提案する。
我々は、観察されたポーズシーケンスから、主観的、タスク固有、その他の補助情報を切り離し、これらの分解された特徴を利用してメモリを問い合わせる。
2つの新たな損失関数を導入し、メモリ内容の安定性を確保しつつ補助記憶内の多様性を促進する。
論文 参考訳(メタデータ) (2023-05-19T02:44:58Z) - MORTY: Structured Summarization for Targeted Information Extraction from
Scholarly Articles [0.0]
学術論文からテキストの構造化要約を生成する情報抽出手法MORTYを提案する。
我々のアプローチは、構造化要約と呼ばれるセグメント化されたテキストスニペットとして、記事の全文とプロパティと値のペアを凝縮する。
また,学術知識グラフから検索した構造化サマリーと,それに対応する公開可能な科学論文を組み合わせた,規模の高い学術データセットも提示する。
論文 参考訳(メタデータ) (2022-12-11T06:49:29Z) - Layout-Aware Information Extraction for Document-Grounded Dialogue:
Dataset, Method and Demonstration [75.47708732473586]
視覚的にリッチな文書から構造的知識と意味的知識の両方を抽出するためのレイアウト対応文書レベル情報抽出データセット(LIE)を提案する。
LIEには製品および公式文書の4,061ページから3つの抽出タスクの62kアノテーションが含まれている。
実験の結果、レイアウトはVRDベースの抽出に不可欠であることが示され、システムデモでは、抽出された知識が、ユーザが関心を持っている答えを見つけるのに役立つことも確認されている。
論文 参考訳(メタデータ) (2022-07-14T07:59:45Z) - Information-Theoretic Odometry Learning [83.36195426897768]
生体計測推定を目的とした学習動機付け手法のための統合情報理論フレームワークを提案する。
提案フレームワークは情報理論言語の性能評価と理解のためのエレガントなツールを提供する。
論文 参考訳(メタデータ) (2022-03-11T02:37:35Z) - Summarizing Text on Any Aspects: A Knowledge-Informed Weakly-Supervised
Approach [89.56158561087209]
文書に関連する任意の側面を要約する。
監視データがないため、我々は新しい弱い監督構築法とアスペクト・モデリング・スキームを開発した。
実験により,本手法は実文書と合成文書の両方を要約することで,性能の向上を図っている。
論文 参考訳(メタデータ) (2020-10-14T03:20:46Z) - Natural language technology and query expansion: issues,
state-of-the-art and perspectives [0.0]
クエリのあいまいさや誤解釈を引き起こす言語特性と、追加の要因は、ユーザの情報ニーズを正確に表現する能力に影響を与える。
汎用言語に基づく問合せ拡張フレームワークの解剖学を概説し,モジュールに基づく分解を提案する。
それぞれのモジュールについて、文献における最先端のソリューションをレビューし、使用するテクニックの光の下で分類する。
論文 参考訳(メタデータ) (2020-04-23T11:39:07Z) - Salience Estimation with Multi-Attention Learning for Abstractive Text
Summarization [86.45110800123216]
テキスト要約のタスクでは、単語、フレーズ、文のサリエンス推定が重要な要素である。
本稿では,サラレンス推定のための2つの新しい注目学習要素を含むマルチアテンション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-04-07T02:38:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。