論文の概要: ArabiGEE: A Hierarchical Taxonomy for Arabic Grammatical Error Explanation
- arxiv url: http://arxiv.org/abs/2606.10765v1
- Date: Tue, 09 Jun 2026 12:16:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 15:40:58.48227
- Title: ArabiGEE: A Hierarchical Taxonomy for Arabic Grammatical Error Explanation
- Title(参考訳): ArabiGEE:アラビア語の文法的誤り説明のための階層的な分類法
- Authors: Khaled Elhady, Omar Kallas, Nizar Habash, Bashar Alhafni,
- Abstract要約: ArabiGEEは、明示的なエラータイプに基づく最初の包括的なアラビア語文法的誤り説明(GEE)である。
分類は、27のエラータイプ、140の修正タイプ、および324の関連する説明からなる。
- 参考スコア(独自算出の注目度): 12.26432507394575
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce ArabiGEE, the first comprehensive Arabic grammatical error explanation (GEE) taxonomy grounded in explicit error types. Unlike existing GEE approaches that treat explanation generation as free-form text, ArabiGEE organizes grammatical explanations through a hierarchical structure spanning orthographic, morphological, syntactic, and lexical dimensions. The taxonomy consists of 27 error types, 140 correction types, and 324 associated explanations. We apply ArabiGEE to manually annotate portions of existing Arabic grammatical error correction corpora and demonstrate how structured grammatical explanations can support automatic evaluation of LLMs on Arabic GEE. Our code and data are publicly available.
- Abstract(参考訳): 本稿では,アラビゲエについて紹介する。アラビゲエはアラビア語の文法的誤り説明(GEE)として初めて,明示的な誤り型に基づく分類法である。
説明生成を自由形式テキストとして扱う既存のGEEアプローチとは異なり、アラビゲエは、正書法、形態学、構文学、語彙の次元にまたがる階層構造を通して文法的な説明を整理する。
分類は、27のエラータイプ、140の修正タイプ、および324の関連する説明からなる。
本稿では,既存のアラビア語文法的誤り訂正コーパスの一部にアラビゲエを手動で注釈付けし,構造化した文法的説明がアラビア語 GEE 上での LLM の自動評価をいかに支援できるかを実証する。
私たちのコードとデータは公開されています。
関連論文リスト
- Pattern-and-root inflectional morphology: the Arabic broken plural [0.0]
本稿では,アラビア語名詞の屈折形態素の記述モデルについて概説する。
我々のモデルは、分裂した複数(BP)、すなわち、茎を改変して形成された複数を含む。
これは、伝統的な根の概念とセム的形態学のパターンに基づいている。
論文 参考訳(メタデータ) (2026-05-21T10:55:48Z) - DialectalArabicMMLU: Benchmarking Dialectal Capabilities in Arabic and Multilingual Language Models [54.10223256792762]
アラビア方言における大規模言語モデル(LLM)の性能評価のための新しいベンチマークであるDialectalArabicMMLUを提案する。
MMLU-Redux フレームワークを手動で翻訳し、3K 個の質問応答対を5つの主要な方言に適応することで拡張する。
論文 参考訳(メタデータ) (2025-10-31T15:17:06Z) - ARWI: Arabic Write and Improve [10.198081881605226]
ARWIは、学習者が現代標準アラビア語でエッセイを書くのを助ける文章アシスタントである。
異なる習熟度のためのプロンプトデータベース、アラビア語のテキストエディタ、最先端の文法的誤りの検出と修正、自動エッセイスコアが含まれる。
予備的なユーザスタディでは、ARWIが実用的なフィードバックを提供し、学習者が文法的ギャップを識別し、言語習熟度を評価し、改善をガイドする。
論文 参考訳(メタデータ) (2025-04-16T07:00:47Z) - Enhancing Text Editing for Grammatical Error Correction: Arabic as a Case Study [11.972975896116383]
データから直接編集タグを導出するテキスト編集手法を導入し、言語固有の編集の必要性を排除した。
我々はその効果をアラビア語、古典的、形態学的に豊かな言語で実証し、異なる編集表現がモデル性能に与える影響について検討する。
論文 参考訳(メタデータ) (2025-03-02T18:48:50Z) - AceGPT, Localizing Large Language Models in Arabic [73.39989503874634]
本稿では,アラビア語のテキストによる事前学習,ネイティブなアラビア語命令を利用したSFT(Supervised Fine-Tuning),アラビア語のGPT-4応答を含む総合的なソリューションを提案する。
目標は、文化的に認知され、価値に整合したアラビア語のLLMを、多様で応用特有のアラビア語コミュニティのニーズに適応させることである。
論文 参考訳(メタデータ) (2023-09-21T13:20:13Z) - CLSE: Corpus of Linguistically Significant Entities [58.29901964387952]
専門家が注釈を付けた言語学的に重要なエンティティ(CLSE)のコーパスをリリースする。
CLSEは74種類のセマンティックタイプをカバーし、航空券売機からビデオゲームまで様々なアプリケーションをサポートする。
言語的に代表されるNLG評価ベンチマークを,フランス語,マラティー語,ロシア語の3言語で作成する。
論文 参考訳(メタデータ) (2022-11-04T12:56:12Z) - Automatic Error Type Annotation for Arabic [20.51341894424478]
現代標準アラビア語のための自動エラー型アノテーションシステムであるARETAを提案する。
我々は誤り分類をアラビア学習者コーパス(ALC)のError Tagsetにいくつかの修正を加えている。
ARETAは、ALCのマニュアルアノテートされたブラインドテスト部分において85.8%(マイクロ平均F1スコア)のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-09-16T15:50:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。