論文の概要: Can LLMs Control Readability? A Multi-Dimensional Evaluation Framework for CEFR-Controlled Arabic Generation
- arxiv url: http://arxiv.org/abs/2606.21981v1
- Date: Sat, 20 Jun 2026 10:30:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-26 21:50:48.225761
- Title: Can LLMs Control Readability? A Multi-Dimensional Evaluation Framework for CEFR-Controlled Arabic Generation
- Title(参考訳): LLMは可読性を制御することができるか? CEFR制御アラビア生成のための多次元評価フレームワーク
- Authors: Nour Rabih, Chatrine Qwaider, Ted Briscoe,
- Abstract要約: 大規模言語モデル (LLM) は、アラビア文字を流用できるが、可読性レベルを確実に制御する能力は、まだ不明である。
共通ヨーロッパ言語参照フレームワーク(CEFR)によるアラビア文字生成のための多次元評価フレームワークを提案する。
本フレームワークは,制御的プロンプト,検証されたTaha-19モデルを用いた自動可読性予測,語彙的制約検証,構文的複雑性プロファイルを統合した。
- 参考スコア(独自算出の注目度): 2.831104808316866
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While Large Language Models (LLMs) can generate fluent Arabic text, their ability to reliably control readability levels remains unclear. We propose a multi-dimensional evaluation framework for Common European Framework of Reference for Language (CEFR)-controlled Arabic text generation, assessing whether instruction-following LLMs can serve as reliable generators for adaptive language learning. Our framework integrates controlled prompting, automatic readability prediction using a validated Taha-19 model, lexical constraint validation, and syntactic complexity profiling. Results show that structured prompting substantially improves CEFR alignment. In particular, CEFR-guided prompting with lexical constraints achieves the highest conformity to reference linguistic profiles (0.91 cosine similarity) and near-perfect agreement with predicted readability levels (0.99), while unconstrained prompting exhibits weak control. These findings establish an empirical foundation for integrating readability-aware Arabic text generation into adaptive educational systems.
- Abstract(参考訳): 大規模言語モデル(LLMs)は、アラビア文字を流用できるが、可読性レベルを確実に制御する能力は、まだ不明である。
適応型言語学習のための信頼性のあるジェネレータとして,命令追従 LLM が有効であるかどうかを評価するため,CEFR が制御するアラビア文字生成のための多次元評価フレームワークを提案する。
本フレームワークは,制御的プロンプト,検証されたTaha-19モデルを用いた自動可読性予測,語彙的制約検証,構文的複雑性プロファイリングを統合した。
その結果,構造化プロンプトはCEFRアライメントを大幅に改善することがわかった。
特に、語彙制約によるCEFR誘導プロンプトは、参照言語プロファイル(0.91コサイン類似性)と予測可読性レベル(0.99)とのほぼ完璧な一致を達成する一方、制約のないプロンプトは弱い制御を示す。
これらの知見は、可読性を考慮したアラビア文字生成を適応的な教育システムに統合するための実証的基盤を確立する。
関連論文リスト
- Learning and Enforcing Context-Sensitive Control for LLMs [48.58004364546273]
本稿では,大規模言語モデルの相互作用から文脈依存制約を自動的に学習するフレームワークを提案する。
実験により,本手法は,LLM (1Bパラメータ) の学習と生成を完全制約付きで行うことができることを示した。
論文 参考訳(メタデータ) (2026-04-12T14:50:03Z) - Classifying German Language Proficiency Levels Using Large Language Models [0.24683296459020942]
本稿では,ドイツ語の文章を異なる習熟度に分類するために,Large Language Models (LLMs) を用いて検討する。
頑健なトレーニングと評価を支援するため,既存のCEFR注釈コーパスを合成データと組み合わせ,多様なデータセットを構築した。
提案手法は従来の手法に比べて一貫した性能向上を示し,信頼性とスケーラブルなCEFR分類のためのLCMの可能性を強調した。
論文 参考訳(メタデータ) (2025-12-06T16:15:45Z) - LexInstructEval: Lexical Instruction Following Evaluation for Large Language Models [7.921987175359344]
LexInstructEvalは新しいベンチマークと評価フレームワークである。
私たちのフレームワークは、複雑な命令を標準手順、関係性、値>三重項に分解する形式的なルールベースの文法の上に構築されています。
この文法は、多段階のヒューマン・イン・ザ・ループパイプラインを通じて多様なデータセットを体系的に生成することを可能にする。
論文 参考訳(メタデータ) (2025-11-13T08:04:30Z) - MoRE-LLM: Mixture of Rule Experts Guided by a Large Language Model [54.14155564592936]
大規模言語モデル(MoRE-LLM)によるルールエキスパートの混合を提案する。
MoRE-LLMは、トレーニング中の局所的なルールベースのサロゲートの発見と、それらの分類タスクの利用を操縦する。
LLMはルールを修正・コンテキスト化することで、ルールのドメイン知識の整合性を高める役割を担います。
論文 参考訳(メタデータ) (2025-03-26T11:09:21Z) - CATER: Leveraging LLM to Pioneer a Multidimensional, Reference-Independent Paradigm in Translation Quality Evaluation [0.0]
Comprehensive AI-assisted Translation Edit Ratio (CATER)は、機械翻訳(MT)の品質を評価するための新しいフレームワークである。
大きな言語モデル(LLM)は、慎重に設計されたプロンプトベースのプロトコルによって使用される。
論文 参考訳(メタデータ) (2024-12-15T17:45:34Z) - CELA: Cost-Efficient Language Model Alignment for CTR Prediction [70.65910069412944]
CTR(Click-Through Rate)予測は、レコメンダシステムにおいて最重要位置を占める。
最近の取り組みは、プレトレーニング言語モデル(PLM)を統合することでこれらの課題を緩和しようとしている。
CTR予測のためのtextbfCost-textbfEfficient textbfLanguage Model textbfAlignment (textbfCELA)を提案する。
論文 参考訳(メタデータ) (2024-05-17T07:43:25Z) - Evaluating, Understanding, and Improving Constrained Text Generation for Large Language Models [49.74036826946397]
本研究では,大言語モデル(LLM)の制約付きテキスト生成について検討する。
本研究は主に,制約を語彙型,構造型,関係型に分類するオープンソース LLM に重点を置いている。
その結果、LLMの能力と不足を照らし、制約を取り入れ、制約付きテキスト生成における将来の発展に対する洞察を提供する。
論文 参考訳(メタデータ) (2023-10-25T03:58:49Z) - Flesch or Fumble? Evaluating Readability Standard Alignment of
Instruction-Tuned Language Models [4.867923281108005]
各種のオープンソース・クローズド・ソース・インストラクション・チューニング言語モデルを選択し、ストーリー・コンプリートの作成や物語の簡略化におけるそれらの性能について検討する。
以上の結果から,ChatGPTのような世界規模で認識されているモデルがより効果的であり,これらの生成タスクに対してより洗練されたプロンプトを必要とする可能性が示唆された。
論文 参考訳(メタデータ) (2023-09-11T13:50:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。