Fugu-MT 論文翻訳(概要): Automated Scoring of Arabic Text Using Large Language Models: A Literature Review

論文の概要: Automated Scoring of Arabic Text Using Large Language Models: A Literature Review

arxiv url: http://arxiv.org/abs/2606.09830v2
Date: Wed, 10 Jun 2026 13:54:49 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-15 07:09:36.786139
Title: Automated Scoring of Arabic Text Using Large Language Models: A Literature Review
Title（参考訳）: 大規模言語モデルを用いたアラビア語テキストの自動スコーリング:文献レビュー
Authors: Khaoula Dahimi, Hadda Cherroun, Amel Belabbaci,
Abstract要約: 本研究は、アラビア語テキストの自動評価に焦点を当て、短解級数(ASAG)とエッセイスコア(AES)の両方に焦点を当てる。アプリケーションドメイン,フィードバック生成能力,LLMアーキテクチャの展開,能力的参照フレームワークとの整合性,エンジニアリング戦略の5つの側面からなる構造的分類法を提案する。この調査結果は、アラビア語圏のコミュニティにおける教育的品質向上の重要性から、アラビアのATSにおける持続的かつ教育的に根ざした研究努力の必要性を浮き彫りにした。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: In modern educational systems, Automatic Text Scoring (ATS) plays a central role by enabling scalable and consistent evaluation of learner responses without human intervention. Recently, the increased accessibility of LLMs and Arabic-specific datasets has sparked renewed interest in this area. In this work, we investigate LLM-Based approaches for the automated evaluation of Arabic texts, focusing on both short answer grading (ASAG) and essay scoring (AES). We further introduce a structured taxonomy comprising five dimensions: application domain, feedback generation capability, LLM architecture deployed, alignment with competency referential frameworks, and prompt engineering strategy. By applying this taxonomy, we conduct a comparative analysis of existing studies, examining their methodological approaches, datasets, evaluation metrics, and reported performance. The findings highlight the need for sustained and pedagogically grounded research efforts in Arabic ATS, given its significance for improving educational quality across Arabic-speaking communities.
Abstract（参考訳）: 現代の教育システムでは、人間の介入なしに学習者の反応をスケーラブルかつ一貫した評価を行うことで、ATS(Automatic Text Scoring)が中心的な役割を担っている。近年、LSMやアラビア固有のデータセットのアクセシビリティが向上し、この地域に新たな関心が寄せられている。本研究では,アラビア語テキストの自動評価のためのLLMに基づくアプローチについて検討し,短解級数(ASAG)とエッセイスコア(AES)の両方に着目した。さらに、アプリケーションドメイン、フィードバック生成能力、LLMアーキテクチャ、能力基準フレームワークとの整合性、エンジニアリング戦略の5つの側面からなる構造化分類を導入する。この分類法を適用することで、既存の研究との比較分析を行い、その方法論的アプローチ、データセット、評価指標、報告された性能について検討する。この調査結果は、アラビア語圏のコミュニティにおける教育的品質向上の重要性から、アラビアのATSにおける持続的かつ教育的に根ざした研究努力の必要性を浮き彫りにした。

関連論文リスト

Evaluating LLM-based Agents for Multi-Turn Conversations: A Survey [64.08485471150486]
本研究では,大規模言語モデル(LLM)に基づくマルチターン対話環境におけるエージェントの評価手法について検討する。我々は250近い学術資料を体系的にレビューし、様々な出版場所から芸術の状態を捉えた。
論文参考訳（メタデータ） (2025-03-28T14:08:40Z)
How well can LLMs Grade Essays in Arabic? [3.101490720236325]
本研究では,AR-AESデータセットを用いたアラビア語自動エッセイスコアリング(AES)タスクにおける大規模言語モデル(LLM)の有効性を評価する。ゼロショット、少数ショットのインコンテキスト学習、微調整など、さまざまな評価手法を探求する。英語のプロンプトとアラビア語のコンテンツを統合する混合言語プロンプト戦略は、モデル理解とパフォーマンスを改善するために実装された。
論文参考訳（メタデータ） (2025-01-27T21:30:02Z)
Large Language Model for Qualitative Research -- A Systematic Mapping Study [3.302912592091359]
先進的な生成AIを駆使した大規模言語モデル(LLM)がトランスフォーメーションツールとして登場した。本研究は, LLMを用いた定性的研究に関する文献を体系的にマッピングする。 LLMは様々な分野にまたがって利用されており、プロセスの自動化の可能性を示している。
論文参考訳（メタデータ） (2024-11-18T21:28:00Z)
A Survey of Small Language Models [104.80308007044634]
小言語モデル (SLM) は, 計算資源の最小化による言語タスクの効率化と性能の向上により, ますます重要になってきている。本稿では,SLMのアーキテクチャ,トレーニング技術,モデル圧縮技術に着目した総合的な調査を行う。
論文参考訳（メタデータ） (2024-10-25T23:52:28Z)
A Literature Review of Literature Reviews in Pattern Analysis and Machine Intelligence [51.26815896167173]
本稿では,3つの相補的な側面からPAMIレビューを総合的に分析する。我々の分析は、現在のレビューの実践において、独特の組織パターンと永続的なギャップを明らかにします。最後に、最先端のAI生成レビューの評価は、コヒーレンスと組織の進歩を奨励していることを示している。
論文参考訳（メタデータ） (2024-02-20T11:28:50Z)
Leveraging Large Language Models for NLG Evaluation: Advances and Challenges [57.88520765782177]
大規模言語モデル(LLM)は、コヒーレンス、クリエイティビティ、コンテキスト関連など、生成されたコンテンツ品質を評価するための新たな道を開いた。既存のLCMに基づく評価指標を整理し、これらの手法を理解し比較するための構造化された枠組みを提供する。本稿では, 偏見, 堅牢性, ドメイン固有性, 統一評価などの未解決課題を議論することによって, 研究者に洞察を提供し, より公平で高度なNLG評価手法を提唱することを目的とする。
論文参考訳（メタデータ） (2024-01-13T15:59:09Z)
Investigating Fairness Disparities in Peer Review: A Language Model Enhanced Approach [77.61131357420201]
我々は、大規模言語モデル(LM)の助けを借りて、ピアレビューにおける公平性格差の徹底した厳密な研究を行う。我々は、2017年から現在までのICLR(International Conference on Learning Representations)カンファレンスで、包括的なリレーショナルデータベースを収集、組み立て、維持しています。我々は、著作者性別、地理、著作者、機関的名声など、興味のある複数の保護属性に対する公平性の違いを仮定し、研究する。
論文参考訳（メタデータ） (2022-11-07T16:19:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。