論文の概要: Is it Possible to Modify Text to a Target Readability Level? An Initial
Investigation Using Zero-Shot Large Language Models
- arxiv url: http://arxiv.org/abs/2309.12551v1
- Date: Fri, 22 Sep 2023 00:47:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-25 16:21:13.426748
- Title: Is it Possible to Modify Text to a Target Readability Level? An Initial
Investigation Using Zero-Shot Large Language Models
- Title(参考訳): テキストをターゲット可読性レベルに修正することは可能か?
ゼロショット大言語モデルを用いた初期検討
- Authors: Asma Farajidizaji, Vatsal Raina, Mark Gales
- Abstract要約: 読みやすさを制御した新しいテキスト修正タスクを提案する。
このタスクでは、各入力テキストに対して、様々なターゲット可読レベルで8つのバージョンを生成する必要がある。
ソーステキストとターゲットテキストのセマンティクスや語彙的類似性が低下し,可読性が大きく変化した。
- 参考スコア(独自算出の注目度): 3.273958158967657
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Text simplification is a common task where the text is adapted to make it
easier to understand. Similarly, text elaboration can make a passage more
sophisticated, offering a method to control the complexity of reading
comprehension tests. However, text simplification and elaboration tasks are
limited to only relatively alter the readability of texts. It is useful to
directly modify the readability of any text to an absolute target readability
level to cater to a diverse audience. Ideally, the readability of
readability-controlled generated text should be independent of the source text.
Therefore, we propose a novel readability-controlled text modification task.
The task requires the generation of 8 versions at various target readability
levels for each input text. We introduce novel readability-controlled text
modification metrics. The baselines for this task use ChatGPT and Llama-2, with
an extension approach introducing a two-step process (generating paraphrases by
passing through the language model twice). The zero-shot approaches are able to
push the readability of the paraphrases in the desired direction but the final
readability remains correlated with the original text's readability. We also
find greater drops in semantic and lexical similarity between the source and
target texts with greater shifts in the readability.
- Abstract(参考訳): テキストの単純化は、テキストが理解しやすいように適応される一般的なタスクです。
同様に、テキストの精巧化は、文章をより洗練されたものにし、理解テストの読みの複雑さを制御する方法を提供する。
しかし、テキストの簡易化と詳細化のタスクは、テキストの可読性を変更するだけに限られている。
あらゆるテキストの可読性を直接ターゲットの可読性レベルに修正して、多様なオーディエンスに適応させることが有用である。
理想的には、可読性制御された生成テキストの可読性は、ソーステキストとは独立すべきである。
そこで本研究では,新しい可読性制御型テキスト修正タスクを提案する。
このタスクでは、入力テキストごとに、様々なターゲット可読レベルで8つのバージョンを生成する必要がある。
本稿では,新しい可読性制御型テキスト修正指標を提案する。
このタスクのベースラインはchatgptとllama-2を使用し、2段階のプロセス(言語モデルを2回通過することでパラフレーズを生成する)を導入する拡張アプローチを採用している。
ゼロショットアプローチはパラフレーズの可読性を所望の方向に押し上げることができるが、最終的な可読性は元のテキストの可読性と相関する。
また、ソーステキストとターゲットテキストのセマンティクスや語彙的類似性が大きく低下し、可読性が大きく変化した。
関連論文リスト
- Generating Summaries with Controllable Readability Levels [67.34087272813821]
テキストの複雑さ、主題、読者の背景知識など、可読性レベルに影響を与える要因がいくつかある。
現在のテキスト生成アプローチでは制御が洗練されておらず、結果として読者の習熟度にカスタマイズされないテキストが作られる。
可読性を制御するための3つのテキスト生成手法を開発した。命令ベースの可読性制御,要求される可読性と観測される可読性の間のギャップを最小限に抑える強化学習,および,ルックアヘッドを用いて今後の復号化ステップの可読性を評価する復号手法である。
論文 参考訳(メタデータ) (2023-10-16T17:46:26Z) - TextFormer: A Query-based End-to-End Text Spotter with Mixed Supervision [61.186488081379]
Transformerアーキテクチャを用いた問合せベースのエンドツーエンドテキストスポッターであるTextFormerを提案する。
TextFormerは、画像エンコーダとテキストデコーダの上に構築され、マルチタスクモデリングのための共同セマンティック理解を学ぶ。
分類、セグメンテーション、認識のブランチの相互訓練と最適化を可能にし、より深い特徴共有をもたらす。
論文 参考訳(メタデータ) (2023-06-06T03:37:41Z) - Prompt-based Learning for Text Readability Assessment [0.4757470449749875]
可読性評価のための事前学習されたSeq2seqモデルの新規適応を提案する。
与えられた2つのテキストからより難しいテキストを区別するために、Seq2seqモデルを適用できることを実証する。
論文 参考訳(メタデータ) (2023-02-25T18:39:59Z) - Text Revision by On-the-Fly Representation Optimization [76.11035270753757]
現在の最先端手法は、これらのタスクをシーケンスからシーケンスまでの学習問題として定式化している。
並列データを必要としないテキストリビジョンのための反復的なインプレース編集手法を提案する。
テキストの単純化に関する最先端の教師付き手法よりも、競争力があり、パフォーマンスも向上する。
論文 参考訳(メタデータ) (2022-04-15T07:38:08Z) - CORE-Text: Improving Scene Text Detection with Contrastive Relational
Reasoning [65.57338873921168]
自然界におけるテキストインスタンスのローカライズは、コンピュータビジョンにおける根本的な課題であると考えられている。
本研究では,サブテキスト問題を定量的に解析し,シンプルで効果的な設計であるContrastive Relation(CORE)モジュールを提案する。
我々は、COREモジュールをMask R-CNNの2段階テキスト検出器に統合し、テキスト検出器CORE-Textを考案する。
論文 参考訳(メタデータ) (2021-12-14T16:22:25Z) - Readability Research: An Interdisciplinary Approach [62.03595526230364]
我々は,可読性研究の包括的枠組みである可読性研究のための強固な基盤を提供することを目指している。
可読性(Readability)とは、ページから読み手への情報フローに影響を与える視覚情報設計の側面を指す。
これらのアスペクトはオンデマンドで修正可能で、読み手がテキストから処理し、意味を導き出すのが簡単になる。
論文 参考訳(メタデータ) (2021-07-20T16:52:17Z) - Predicting Text Readability from Scrolling Interactions [6.530293714772306]
本稿では,テキストの可読性とスクロール動作の関係について検討する。
データセットを公開し、テキストレベルに応じて読者がテキストと対話する方法に統計的に有意な違いがあることを示します。
論文 参考訳(メタデータ) (2021-05-13T15:27:00Z) - Text Perceptron: Towards End-to-End Arbitrary-Shaped Text Spotting [49.768327669098674]
テキストパーセプトロン(Text Perceptron)という,エンドツーエンドのトレーニング可能なテキストスポッティング手法を提案する。
まず、テキスト読解順序と境界情報を学ぶ効率的なセグメンテーションベースのテキスト検出器を用いる。
次に、検出された特徴領域を正規形態に変換するために、新しい形状変換モジュール(STM)を設計する。
論文 参考訳(メタデータ) (2020-02-17T08:07:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。