論文の概要: Pattern-and-root inflectional morphology: the Arabic broken plural
- arxiv url: http://arxiv.org/abs/2605.22310v1
- Date: Thu, 21 May 2026 10:55:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 20:14:18.555127
- Title: Pattern-and-root inflectional morphology: the Arabic broken plural
- Title(参考訳): パターンと根の屈折形態:アラビアの壊れた複数の形態
- Authors: Alexis Amid Neme, Eric Laporte,
- Abstract要約: 本稿では,アラビア語名詞の屈折形態素の記述モデルについて概説する。
我々のモデルは、分裂した複数(BP)、すなわち、茎を改変して形成された複数を含む。
これは、伝統的な根の概念とセム的形態学のパターンに基づいている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We present a substantially implemented model of description of the inflectional morphology of Arabic nouns, with special attention to the management of dictionaries and other language resources by Arabic-speaking linguists. The breakthrough lies in the reversal of the traditional root-and-pattern Semitic model into pattern-and-root, giving precedence to patterns over roots. Our model includes broken plurals (BPs), i.e. plurals formed by modifying the stem. It is based on the traditional notions of root and pattern of Semitic morphology. However, as compared to traditional Arabic morphology, it keeps the formal description of inflection separate from that of derivation and semantics. As traditional Arabic dictionaries, the updatable dictionary is structured in lexical entries for lemmas, and the reference spelling is fully diacritized. In our model, morphological analysis of Arabic text is performed directly with a dictionary of words and without morphophonological rules. Our taxonomy for noun inflection is simple, orderly and detailed. We simplify the taxonomy of singular patterns by specifying vowel quantity as v or vv, and ignoring vowel quality. Root alternations and orthographical variations are encoded independently from patterns and in a factual way, without deep roots or morphophonological or orthographical rules. Nouns with a triliteral BP are classified according to 22 patterns subdivided into 90 classes, and nouns with a quadriliteral BP according to 3 patterns subdivided into 70 classes. These 160 classes become 300 inflectional classes when we take into account inflectional variations that affect only the singular. We provide a straightforward encoding scheme that we applied to 3 200 entries of BP nouns.
- Abstract(参考訳): アラビア語の言語学者による辞書やその他の言語資源の管理に特に注意を払って、アラビア語の名詞の屈折形態の記述を実質的に実装したモデルを提案する。
このブレークスルーは、伝統的なルート・アンド・パターンのセムティックモデルをパターン・アンド・ルートに逆転させ、ルート上のパターンに優先するものである。
我々のモデルは、分裂した複数(BP)、すなわち、茎を改変して形成された複数を含む。
これは、伝統的な根の概念とセム的形態学のパターンに基づいている。
しかし、伝統的なアラビアの形態学と比較すると、派生や意味論とは別物であるインフレクションの形式的な記述を保っている。
伝統的なアラビア語辞典として、アップダブル辞書はレムマの語彙で構成され、参照の綴りは完全にダイアクリッド化されている。
本モデルでは、アラビア文字の形態素解析を単語の辞書で直接行い、形態素規則を使わずに行う。
名詞の屈折の分類は単純で、秩序があり、詳細です。
我々は、母音量をvまたはvvと指定し、母音の品質を無視して特異パターンの分類を単純化する。
根の交替と正書法の変化はパターンとは独立して符号化され、深い根や形態素的、正書法的な規則を伴わずに事実的に符号化される。
3文字のBPを持つ名詞は、90のクラスに分類される22のパターン、70のクラスに分類される3のパターンに従って4文字のBPを持つ名詞に分類される。
これら 160 個のクラスは特異点のみに影響を与える不変変分を考慮すると 300 個の屈折クラスになる。
BP名詞の3200項目に適用した素直な符号化方式を提案する。
関連論文リスト
- IDIOLEX: Unified and Continuous Representations for Idiolectal and Stylistic Variation [88.98544786373212]
既存の文表現は主に、その表現方法ではなく、ある文が何を言っているかを符号化する。
本研究は,意味内容から分離したスタイルと方言をキャプチャする文表現を開発する。
IDIOLEX(IDIOLEX)は,文の証明から文の内容の言語的特徴までを統括するモデルを訓練するためのフレームワークである。
論文 参考訳(メタデータ) (2026-04-06T14:17:24Z) - Towards a theory of morphology-driven marking in the lexicon: The case of the state [0.0]
形態素駆動マーキングと呼ばれる形式モデルを提案する。
名詞はモジュラー認知集合に編成され、それぞれが独自の形態的テンプレートと無意味な形式を持つ。
状態の概念をすべての合成言語に拡張することが提案されている。
論文 参考訳(メタデータ) (2026-04-03T19:35:41Z) - The Arabic Noun System Generation [0.0]
複数パターンを分割した名詞に対する多節的アプローチは,形態素系においてより広範な一般化を記述できることを示す。
屈折音節の生成には、複数の男性音と複数の女性音を表す接尾辞の事前特定が必要である。
論文 参考訳(メタデータ) (2024-05-17T17:33:10Z) - Graphemic Normalization of the Perso-Arabic Script [47.429213930688086]
本稿では,ペルソ・アラビア語が最良文書言語を超えて提示する課題について述べる。
自然言語処理(NLP)の状況に注目する。
ペルソ・アラビア文字ディアスポラの多言語語族8言語に対する正規化が機械翻訳および統計言語モデリングタスクに及ぼす影響を評価する。
論文 参考訳(メタデータ) (2022-10-21T21:59:44Z) - Modeling Target-Side Morphology in Neural Machine Translation: A
Comparison of Strategies [72.56158036639707]
形態的に豊かな言語は機械翻訳に困難をもたらす。
多数の異なる屈折する単語曲面は、より大きな語彙を必要とする。
いくつかの頻度の低い用語は、通常、トレーニングコーパスには現れない。
言語的合意は、出力文中の屈折語形間の文法的カテゴリを正しく一致させる必要がある。
論文 参考訳(メタデータ) (2022-03-25T10:13:20Z) - Interpreting Arabic Transformer Models [18.98681439078424]
我々は、アラビア語の様々な種類に基づいて訓練された、アラビア語の事前訓練されたモデルにおいて、言語情報がどのように符号化されているかを探る。
MSA(現代の標準アラビア語)に基づく2つの形態的タグ付けタスクと、方言のPOSタグ付けタスクと、方言の識別タスクである。
論文 参考訳(メタデータ) (2022-01-19T06:32:25Z) - Lexical semantic change for Ancient Greek and Latin [61.69697586178796]
歴史的文脈における単語の正しい意味の連想は、ダイアクロニック研究の中心的な課題である。
我々は、動的ベイズ混合モデルに基づくセマンティック変化に対する最近の計算的アプローチに基づいて構築する。
本研究では,動的ベイズ混合モデルと最先端埋め込みモデルとのセマンティックな変化を系統的に比較する。
論文 参考訳(メタデータ) (2021-01-22T12:04:08Z) - Revisiting Neural Language Modelling with Syllables [3.198144010381572]
我々は20言語でオープン語彙生成タスクのために音節を再考する。
ルールベースのシラビフィケーション手法を5つの言語で使用し,残りをハイフン化ツールで処理する。
同等の難易度で、音節は文字、注釈付き形態素、教師なしのサブワードよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-10-24T11:44:41Z) - Investigating Cross-Linguistic Adjective Ordering Tendencies with a
Latent-Variable Model [66.84264870118723]
本稿では,多言語形容詞順序付けを潜在変数モデルとして,初めて純粋コーパス駆動モデルを提案する。
我々は普遍的、言語横断的、階層的形容詞順序付け傾向の存在の強い確固たる証拠を提供する。
論文 参考訳(メタデータ) (2020-10-09T18:27:55Z) - A Simple Joint Model for Improved Contextual Neural Lemmatization [60.802451210656805]
本稿では,20言語で最先端の成果を得られる,単純結合型ニューラルモデルを提案する。
本論文では,トレーニングと復号化に加えて,本モデルについて述べる。
論文 参考訳(メタデータ) (2019-04-04T02:03:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。