論文の概要: Generating Summaries with Controllable Readability Levels
- arxiv url: http://arxiv.org/abs/2310.10623v1
- Date: Mon, 16 Oct 2023 17:46:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-17 12:40:19.683664
- Title: Generating Summaries with Controllable Readability Levels
- Title(参考訳): 可読性制御可能なアセンブリの生成
- Authors: Leonardo F. R. Ribeiro, Mohit Bansal, Markus Dreyer
- Abstract要約: テキストの複雑さ、主題、読者の背景知識など、可読性レベルに影響を与える要因がいくつかある。
現在のテキスト生成アプローチでは制御が洗練されておらず、結果として読者の習熟度にカスタマイズされないテキストが作られる。
可読性を制御するための3つのテキスト生成手法を開発した。命令ベースの可読性制御,要求される可読性と観測される可読性の間のギャップを最小限に抑える強化学習,および,ルックアヘッドを用いて今後の復号化ステップの可読性を評価する復号手法である。
- 参考スコア(独自算出の注目度): 67.34087272813821
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Readability refers to how easily a reader can understand a written text.
Several factors affect the readability level, such as the complexity of the
text, its subject matter, and the reader's background knowledge. Generating
summaries based on different readability levels is critical for enabling
knowledge consumption by diverse audiences. However, current text generation
approaches lack refined control, resulting in texts that are not customized to
readers' proficiency levels. In this work, we bridge this gap and study
techniques to generate summaries at specified readability levels. Unlike
previous methods that focus on a specific readability level (e.g., lay
summarization), we generate summaries with fine-grained control over their
readability. We develop three text generation techniques for controlling
readability: (1) instruction-based readability control, (2) reinforcement
learning to minimize the gap between requested and observed readability and (3)
a decoding approach that uses lookahead to estimate the readability of upcoming
decoding steps. We show that our generation methods significantly improve
readability control on news summarization (CNN/DM dataset), as measured by
various readability metrics and human judgement, establishing strong baselines
for controllable readability in summarization.
- Abstract(参考訳): 可読性(Readability)とは、読み手が文章をいかに容易に理解できるかをいう。
テキストの複雑さ、主題、読者の背景知識など、可読性レベルに影響を与える要因がいくつかある。
異なる可読性レベルに基づいて要約を生成することは、多様なオーディエンスによる知識消費を可能にするために重要である。
しかし、現在のテキスト生成アプローチでは制御が洗練されておらず、結果として読者の習熟度にカスタマイズされないテキストが作られる。
本研究では,このギャップを埋めて,特定の可読度レベルで要約を生成する手法を研究する。
特定の可読性レベル(例: lay summarization)にフォーカスした以前の方法とは異なり、可読性に対するきめ細かい制御を伴う要約を生成する。
本研究では,(1)命令ベースの可読性制御,(2)要求される可読性と観測される可読性の間のギャップを最小化するための強化学習,(3)読みやすさを推定するルックアヘッドを用いた復号手法を提案する。
本稿では,ニュース要約(CNN/DMデータセット)の可読性制御を,様々な可読性指標と人的判断によって明らかに改善し,要約における可読性に対する強い基準線を確立した。
関連論文リスト
- Partial Diacritization: A Context-Contrastive Inference Approach [0.6587258071269679]
ダイアクリプティゼーションは、読みやすさを改善し、アラビア語のテキストの意味を曖昧にする上で重要な役割を担っている。
partial Diacritzation (PD) は、必要に応じて理解を助けるためにマークされる文字のサブセットの選択である。
本稿では,既存のアラビア語発音システムとシームレスに統合するPDの新しいアプローチである,文脈コントラスト部分発音法(CCPD)を紹介する。
論文 参考訳(メタデータ) (2024-01-17T02:04:59Z) - Is it Possible to Modify Text to a Target Readability Level? An Initial
Investigation Using Zero-Shot Large Language Models [3.273958158967657]
読みやすさを制御した新しいテキスト修正タスクを提案する。
このタスクでは、各入力テキストに対して、様々なターゲット可読レベルで8つのバージョンを生成する必要がある。
ソーステキストとターゲットテキストのセマンティクスや語彙的類似性が低下し,可読性が大きく変化した。
論文 参考訳(メタデータ) (2023-09-22T00:47:18Z) - Investigating the Impact of Vocabulary Difficulty and Code Naturalness
on Program Comprehension [3.35803394416914]
本研究の目的は,言語習得の観点から可読性と可読性を評価することである。
我々は,それらの相関関係を理解するために統計的解析を行い,可読性および可読性予測法の性能向上にコード自然性および語彙難易度を用いることができるか分析する。
論文 参考訳(メタデータ) (2023-08-25T15:15:00Z) - TextFormer: A Query-based End-to-End Text Spotter with Mixed Supervision [72.79006668848186]
Transformerアーキテクチャを用いた問合せベースのエンドツーエンドテキストスポッターであるTextFormerを提案する。
TextFormerは、画像エンコーダとテキストデコーダの上に構築され、マルチタスクモデリングのための共同セマンティック理解を学ぶ。
分類、セグメンテーション、認識のブランチの相互訓練と最適化を可能にし、より深い特徴共有をもたらす。
論文 参考訳(メタデータ) (2023-06-06T03:37:41Z) - Informative Text Generation from Knowledge Triples [56.939571343797304]
本稿では,トレーニング中に学習した有用な知識を記憶するために,メモリネットワークを利用した新しいメモリ拡張ジェネレータを提案する。
我々は、新しい設定のためのWebNLGからデータセットを導き、我々のモデルの有効性を調べるための広範な実験を行う。
論文 参考訳(メタデータ) (2022-09-26T14:35:57Z) - Readability Research: An Interdisciplinary Approach [62.03595526230364]
我々は,可読性研究の包括的枠組みである可読性研究のための強固な基盤を提供することを目指している。
可読性(Readability)とは、ページから読み手への情報フローに影響を与える視覚情報設計の側面を指す。
これらのアスペクトはオンデマンドで修正可能で、読み手がテキストから処理し、意味を導き出すのが簡単になる。
論文 参考訳(メタデータ) (2021-07-20T16:52:17Z) - Predicting Text Readability from Scrolling Interactions [6.530293714772306]
本稿では,テキストの可読性とスクロール動作の関係について検討する。
データセットを公開し、テキストレベルに応じて読者がテキストと対話する方法に統計的に有意な違いがあることを示します。
論文 参考訳(メタデータ) (2021-05-13T15:27:00Z) - Hierarchical Bi-Directional Self-Attention Networks for Paper Review
Rating Recommendation [81.55533657694016]
本稿では,階層型双方向自己注意ネットワークフレームワーク(HabNet)を提案する。
具体的には、文エンコーダ(レベル1)、レビュー内エンコーダ(レベル2)、レビュー間エンコーダ(レベル3)の3つのレベルで、論文レビューの階層構造を利用する。
我々は、最終的な受理決定を行う上で有用な予測者を特定することができ、また、数値的なレビュー評価とレビュアーが伝えるテキストの感情の不整合を発見するのに役立てることができる。
論文 参考訳(メタデータ) (2020-11-02T08:07:50Z) - Salience Estimation with Multi-Attention Learning for Abstractive Text
Summarization [86.45110800123216]
テキスト要約のタスクでは、単語、フレーズ、文のサリエンス推定が重要な要素である。
本稿では,サラレンス推定のための2つの新しい注目学習要素を含むマルチアテンション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-04-07T02:38:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。