論文の概要: Iterative Prompt Refinement for Dyslexia-Friendly Text Summarization Using GPT-4o
- arxiv url: http://arxiv.org/abs/2602.22524v1
- Date: Thu, 26 Feb 2026 01:46:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-27 18:41:22.472122
- Title: Iterative Prompt Refinement for Dyslexia-Friendly Text Summarization Using GPT-4o
- Title(参考訳): GPT-4oを用いたDyslexia-Friendly Text Summarizationの反復的プロンプト再構成
- Authors: Samay Bhojwani, Swarnima Kain, Lisong Xu,
- Abstract要約: 本稿では, GPT-4o上に構築した反復的プロンプトベース精錬パイプラインを用いて, ディプレクシアフレンドリーなテキスト要約に関する実証的研究を行った。
Flesch Reading Ease >= 90。
その結果,要約の大多数は4回の試行で可読性しきい値に到達し,多くは最初の試行で成功していることがわかった。
- 参考スコア(独自算出の注目度): 1.4401311275746886
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dyslexia affects approximately 10% of the global population and presents persistent challenges in reading fluency and text comprehension. While existing assistive technologies address visual presentation, linguistic complexity remains a substantial barrier to equitable access. This paper presents an empirical study on dyslexia-friendly text summarization using an iterative prompt-based refinement pipeline built on GPT-4o. We evaluate the pipeline on approximately 2,000 news article samples, applying a readability target of Flesch Reading Ease >= 90. Results show that the majority of summaries meet the readability threshold within four attempts, with many succeeding on the first try. A composite score combining readability and semantic fidelity shows stable performance across the dataset, ranging from 0.13 to 0.73 with a typical value near 0.55. These findings establish an empirical baseline for accessibility-driven NLP summarization and motivate further human-centered evaluation with dyslexic readers.
- Abstract(参考訳): 失読症は世界の人口の約10%に影響を与え、流布や文章の理解において永続的な課題を呈している。
既存の補助技術は視覚的な表現に対処するが、言語的な複雑さは相応のアクセスにとって重要な障壁である。
本稿では, GPT-4o上に構築した反復的プロンプトベース精錬パイプラインを用いて, ディプレクシアフレンドリーなテキスト要約に関する実証的研究を行った。
Flesch Reading Ease >= 90。
その結果,要約の大多数は4回の試行で可読性しきい値に到達し,多くは最初の試行で成功していることがわかった。
可読性とセマンティックフィリティを組み合わせた合成スコアは、0.13から0.73までのデータセット全体の安定したパフォーマンスを示し、典型的な値は0.55に近い。
これらの知見は,アクセシビリティ駆動型NLP要約のための実証的ベースラインを確立し,ディプレクシック読者によるさらなる人間中心評価を動機づけるものである。
関連論文リスト
- Diversity Boosts AI-Generated Text Detection [51.56484100374058]
DivEyeは、予備的な機能を使って、予測不可能がテキスト間でどのように変動するかをキャプチャする、新しいフレームワークである。
提案手法は、既存のゼロショット検出器を最大33.2%向上させ、微調整ベースラインとの競合性能を達成する。
論文 参考訳(メタデータ) (2025-09-23T10:21:22Z) - SEval-Ex: A Statement-Level Framework for Explainable Summarization Evaluation [2.0027415925559966]
現在のアプローチでは、パフォーマンスと解釈可能性のトレードオフに直面しています。
要約評価をアトミックステートメントに分解することで,このギャップを埋めるフレームワークであるSEval-Exを提案する。
SummEvalベンチマークの実験により、SEval-Exは、人間の一貫性判定との整合性に0.580の相関で最先端のパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2025-05-04T20:16:08Z) - Group-Adaptive Threshold Optimization for Robust AI-Generated Text Detection [58.419940585826744]
本稿では,確率的AIテキスト検出のためのグループ固有しきい値最適化アルゴリズムであるFairOPTを紹介する。
属性(例えば、テキストの長さと書き込みスタイル)に基づいてデータをサブグループに分割し、FairOPTを実装して、各グループに対する決定しきい値の学習を行い、不一致を低減しました。
我々のフレームワークは、後処理によるAI生成コンテンツ検出において、より堅牢な分類の道を開く。
論文 参考訳(メタデータ) (2025-02-06T21:58:48Z) - SummExecEdit: A Factual Consistency Benchmark in Summarization with Executable Edits [31.98028879922584]
SummExecEditという新しいパイプラインとベンチマークを導入し、実際のエラーを検知し、正確な説明を提供する能力についてモデルを評価する。
トップパフォーマンスモデルであるClaude3-Opusは、ベンチマークでわずか0.49のジョイント検出と説明スコアを達成している。
説明ミスの4つの主要なタイプを特定し、その45.4%は、要約の完全に無関係な部分に焦点を当てている。
論文 参考訳(メタデータ) (2024-12-17T23:26:44Z) - Measuring and Modifying the Readability of English Texts with GPT-4 [2.532202013576547]
GPT-4 Turbo と GPT-4o mini の可読性評価は, 人間の判断と相対的に高い相関性を示した。
事前登録された人間の実験では、Turboがテキストを確実に読みやすくするか、読みにくいかを尋ねる。
この仮説を支持する証拠は見つかっているが、人間の判断にかなりのばらつきは説明されていない。
論文 参考訳(メタデータ) (2024-10-17T21:04:28Z) - Towards Enhancing Coherence in Extractive Summarization: Dataset and Experiments with LLMs [70.15262704746378]
我々は,5つの公開データセットと自然言語ユーザフィードバックのためのコヒーレントな要約からなる,体系的に作成された人間アノテーションデータセットを提案する。
Falcon-40BとLlama-2-13Bによる予備的な実験では、コヒーレントなサマリーを生成するという点で大幅な性能向上(10%ルージュ-L)が見られた。
論文 参考訳(メタデータ) (2024-07-05T20:25:04Z) - Leveraging deep active learning to identify low-resource mobility
functioning information in public clinical notes [0.157286095422595]
国際機能・障害・健康分類(ICF)のモビリティ領域に関する最初の公開アノテートデータセット
我々はNational NLP Clinical Challenges (n2c2) 研究データセットを用いてキーワード拡張を用いた候補文のプールを構築する。
最終的なデータセットは,5,511のアクションエンティティ,5,328のモビリティエンティティ,306のアシストエンティティ,639の量子化エンティティを含む,合計11,784のエンティティからなる4,265の文で構成されています。
論文 参考訳(メタデータ) (2023-11-27T15:53:11Z) - Generating Summaries with Controllable Readability Levels [67.34087272813821]
テキストの複雑さ、主題、読者の背景知識など、可読性レベルに影響を与える要因がいくつかある。
現在のテキスト生成アプローチでは制御が洗練されておらず、結果として読者の習熟度にカスタマイズされないテキストが作られる。
可読性を制御するための3つのテキスト生成手法を開発した。命令ベースの可読性制御,要求される可読性と観測される可読性の間のギャップを最小限に抑える強化学習,および,ルックアヘッドを用いて今後の復号化ステップの可読性を評価する復号手法である。
論文 参考訳(メタデータ) (2023-10-16T17:46:26Z) - Automatically measuring speech fluency in people with aphasia: first
achievements using read-speech data [55.84746218227712]
本研究の目的は,言語習得の分野で開発された信号処理algorithmの関連性を評価することである。
論文 参考訳(メタデータ) (2023-08-09T07:51:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。