論文の概要: Is it Possible to Modify Text to a Target Readability Level? An Initial Investigation Using Zero-Shot Large Language Models
- arxiv url: http://arxiv.org/abs/2309.12551v2
- Date: Mon, 27 May 2024 18:05:31 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-30 04:26:52.955673
- Title: Is it Possible to Modify Text to a Target Readability Level? An Initial Investigation Using Zero-Shot Large Language Models
- Title(参考訳): テキストを目標可読性レベルに修正することは可能か? ゼロショット大言語モデルによる初期検討
- Authors: Asma Farajidizaji, Vatsal Raina, Mark Gales,
- Abstract要約: 読みやすさを制御した新しいテキスト修正タスクを提案する。
このタスクでは、各入力テキストに対して、様々なターゲット可読レベルで8つのバージョンを生成する必要がある。
ソーステキストとターゲットテキストのセマンティクスや語彙的類似性が低下し,可読性が大きく変化した。
- 参考スコア(独自算出の注目度): 2.913033886371052
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Text simplification is a common task where the text is adapted to make it easier to understand. Similarly, text elaboration can make a passage more sophisticated, offering a method to control the complexity of reading comprehension tests. However, text simplification and elaboration tasks are limited to only relatively alter the readability of texts. It is useful to directly modify the readability of any text to an absolute target readability level to cater to a diverse audience. Ideally, the readability of readability-controlled generated text should be independent of the source text. Therefore, we propose a novel readability-controlled text modification task. The task requires the generation of 8 versions at various target readability levels for each input text. We introduce novel readability-controlled text modification metrics. The baselines for this task use ChatGPT and Llama-2, with an extension approach introducing a two-step process (generating paraphrases by passing through the language model twice). The zero-shot approaches are able to push the readability of the paraphrases in the desired direction but the final readability remains correlated with the original text's readability. We also find greater drops in semantic and lexical similarity between the source and target texts with greater shifts in the readability.
- Abstract(参考訳): テキストの単純化は、テキストが理解しやすいように適応される一般的なタスクである。
同様に、テキストのエラボレーションは、理解テストを読む複雑さを制御する方法を提供することで、パスをより洗練されたものにすることができる。
しかし、テキストの読みやすさを相対的に変化させるには、テキストの単純化と編集作業が限られている。
あらゆるテキストの可読性を絶対目標の可読性レベルに修正して、多様なオーディエンスに適応させることが有用である。
理想的には、可読性制御された生成テキストの可読性は、ソーステキストとは独立していなければならない。
そこで本研究では,新しい可読性制御型テキスト修正タスクを提案する。
このタスクでは、各入力テキストに対して、様々なターゲット可読レベルで8つのバージョンを生成する必要がある。
本稿では,新しい可読性制御型テキスト修正指標を提案する。
このタスクのベースラインはChatGPTとLlama-2を使用しており、拡張アプローチでは2ステッププロセス(言語モデルを2回通すことでパラフレーズを生成する)が導入されている。
ゼロショットアプローチは、パラフレーズの可読性を所望の方向に押し上げることができるが、最終的な可読性は元のテキストの可読性と相関する。
また、ソーステキストとターゲットテキストのセマンティクスや語彙的類似性が大きく低下し、可読性が大きく変化した。
関連論文リスト
- Generating Summaries with Controllable Readability Levels [67.34087272813821]
テキストの複雑さ、主題、読者の背景知識など、可読性レベルに影響を与える要因がいくつかある。
現在のテキスト生成アプローチでは制御が洗練されておらず、結果として読者の習熟度にカスタマイズされないテキストが作られる。
可読性を制御するための3つのテキスト生成手法を開発した。命令ベースの可読性制御,要求される可読性と観測される可読性の間のギャップを最小限に抑える強化学習,および,ルックアヘッドを用いて今後の復号化ステップの可読性を評価する復号手法である。
論文 参考訳(メタデータ) (2023-10-16T17:46:26Z) - TextFormer: A Query-based End-to-End Text Spotter with Mixed Supervision [61.186488081379]
Transformerアーキテクチャを用いた問合せベースのエンドツーエンドテキストスポッターであるTextFormerを提案する。
TextFormerは、画像エンコーダとテキストデコーダの上に構築され、マルチタスクモデリングのための共同セマンティック理解を学ぶ。
分類、セグメンテーション、認識のブランチの相互訓練と最適化を可能にし、より深い特徴共有をもたらす。
論文 参考訳(メタデータ) (2023-06-06T03:37:41Z) - Prompt-based Learning for Text Readability Assessment [0.4757470449749875]
可読性評価のための事前学習されたSeq2seqモデルの新規適応を提案する。
与えられた2つのテキストからより難しいテキストを区別するために、Seq2seqモデルを適用できることを実証する。
論文 参考訳(メタデータ) (2023-02-25T18:39:59Z) - Text Revision by On-the-Fly Representation Optimization [76.11035270753757]
現在の最先端手法は、これらのタスクをシーケンスからシーケンスまでの学習問題として定式化している。
並列データを必要としないテキストリビジョンのための反復的なインプレース編集手法を提案する。
テキストの単純化に関する最先端の教師付き手法よりも、競争力があり、パフォーマンスも向上する。
論文 参考訳(メタデータ) (2022-04-15T07:38:08Z) - CORE-Text: Improving Scene Text Detection with Contrastive Relational
Reasoning [65.57338873921168]
自然界におけるテキストインスタンスのローカライズは、コンピュータビジョンにおける根本的な課題であると考えられている。
本研究では,サブテキスト問題を定量的に解析し,シンプルで効果的な設計であるContrastive Relation(CORE)モジュールを提案する。
我々は、COREモジュールをMask R-CNNの2段階テキスト検出器に統合し、テキスト検出器CORE-Textを考案する。
論文 参考訳(メタデータ) (2021-12-14T16:22:25Z) - Readability Research: An Interdisciplinary Approach [62.03595526230364]
我々は,可読性研究の包括的枠組みである可読性研究のための強固な基盤を提供することを目指している。
可読性(Readability)とは、ページから読み手への情報フローに影響を与える視覚情報設計の側面を指す。
これらのアスペクトはオンデマンドで修正可能で、読み手がテキストから処理し、意味を導き出すのが簡単になる。
論文 参考訳(メタデータ) (2021-07-20T16:52:17Z) - Predicting Text Readability from Scrolling Interactions [6.530293714772306]
本稿では,テキストの可読性とスクロール動作の関係について検討する。
データセットを公開し、テキストレベルに応じて読者がテキストと対話する方法に統計的に有意な違いがあることを示します。
論文 参考訳(メタデータ) (2021-05-13T15:27:00Z) - Text Perceptron: Towards End-to-End Arbitrary-Shaped Text Spotting [49.768327669098674]
テキストパーセプトロン(Text Perceptron)という,エンドツーエンドのトレーニング可能なテキストスポッティング手法を提案する。
まず、テキスト読解順序と境界情報を学ぶ効率的なセグメンテーションベースのテキスト検出器を用いる。
次に、検出された特徴領域を正規形態に変換するために、新しい形状変換モジュール(STM)を設計する。
論文 参考訳(メタデータ) (2020-02-17T08:07:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。