論文の概要: Transliterating Kurdish texts in Latin into Persian-Arabic script
- arxiv url: http://arxiv.org/abs/2110.12374v1
- Date: Sun, 24 Oct 2021 07:28:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-31 14:32:38.180072
- Title: Transliterating Kurdish texts in Latin into Persian-Arabic script
- Title(参考訳): ラテン語でクルド語のテキストをペルシア・アラビア文字に翻訳する
- Authors: Hossein Hassani
- Abstract要約: ラテン語のクルド文字をペルシア・アラビア文字に翻訳する文字を提示する。
このツールはクルド人のBLARKの一部であり、非商業的使用のために公開されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Kurdish is written in different scripts. The two most popular scripts are
Latin and Persian-Arabic. However, not all Kurdish readers are familiar with
both mentioned scripts that could be resolved by automatic transliterators. So
far, the developed tools mostly transliterate Persian-Arabic scripts into
Latin. We present a transliterator to transliterate Kurdish texts in Latin into
Persian-Arabic script. We also discuss the issues that should be considered in
the transliteration process. The tool is a part of Kurdish BLARK, and it is
publicly available for non-commercial use
- Abstract(参考訳): クルド語は異なる文字で書かれている。
最も人気のある文字はラテン語とペルシア語である。
しかし、クルド人読者の全員が、自動翻訳者によって解決される可能性のある両方のスクリプトに精通しているわけではない。
これまでのところ、開発ツールは主にペルシア・アラビア語の文字をラテン語に翻訳している。
ラテン語のクルド文字をペルシア・アラビア文字に翻訳する文字を提示する。
また、翻訳過程において考慮すべき課題についても論じる。
このツールはクルド語のblarkの一部であり、非商用で利用可能である。
関連論文リスト
- Exploring the Role of Transliteration in In-Context Learning for Low-resource Languages Written in Non-Latin Scripts [50.40191599304911]
非ラテン文字で書かれた低リソース言語に対するLLMの性能向上にも効果があるか検討する。
本稿では,(1) の原文,(2) ラテン文字,(3) の両文を対象とする3つのプロンプトテンプレートを提案する。
本研究の結果から,翻訳の有効性はタスクタイプやモデルサイズによって異なることが明らかとなった。
論文 参考訳(メタデータ) (2024-07-02T14:51:20Z) - Breaking the Script Barrier in Multilingual Pre-Trained Language Models with Transliteration-Based Post-Training Alignment [50.27950279695363]
転送性能は、低リソースのターゲット言語が高リソースのソース言語とは異なるスクリプトで書かれている場合、しばしば妨げられる。
本論文は,この問題に対処するために翻訳を用いた最近の研究に触発されて,翻訳に基づくポストプレトレーニングアライメント(PPA)手法を提案する。
論文 参考訳(メタデータ) (2024-06-28T08:59:24Z) - TransliCo: A Contrastive Learning Framework to Address the Script Barrier in Multilingual Pretrained Language Models [50.40191599304911]
本稿では,mPLM を微調整する TransliCo を提案する。
Furinaは様々なゼロショット・クロスリンガル・トランスファータスクにおいてオリジナルのGlot500-mより優れていることを示す。
論文 参考訳(メタデータ) (2024-01-12T15:12:48Z) - Romanization-based Large-scale Adaptation of Multilingual Language
Models [124.57923286144515]
大規模多言語事前学習言語モデル (mPLMs) は,NLPにおける多言語間移動のデファクトステートとなっている。
我々は、mPLMをローマン化および非ロマン化した14の低リソース言語コーパスに適用するためのデータとパラメータ効率の戦略を多数検討し、比較した。
以上の結果から, UROMAN をベースとしたトランスリテラルは,多くの言語で高い性能を達成できることがわかった。
論文 参考訳(メタデータ) (2023-04-18T09:58:34Z) - Beyond Arabic: Software for Perso-Arabic Script Manipulation [67.31374614549237]
ペルソ・アラビア文字を使用する言語の書き起こしシステムを操作するための有限状態トランスデューサ(FST)コンポーネントとそれに対応するユーティリティのセットを提供する。
ライブラリはまた、単純なFSTベースのロマン化と文字変換も提供する。
論文 参考訳(メタデータ) (2023-01-26T20:37:03Z) - Graphemic Normalization of the Perso-Arabic Script [47.429213930688086]
本稿では,ペルソ・アラビア語が最良文書言語を超えて提示する課題について述べる。
自然言語処理(NLP)の状況に注目する。
ペルソ・アラビア文字ディアスポラの多言語語族8言語に対する正規化が機械翻訳および統計言語モデリングタスクに及ぼす影響を評価する。
論文 参考訳(メタデータ) (2022-10-21T21:59:44Z) - A machine transliteration tool between Uzbek alphabets [0.0]
本稿では,旧キリル文字と現在公用語であるラテン語と,新たに発表された新ラテン文字の機械翻訳ツールを提案する。
このツールはルールベースのアプローチと微調整のアプローチを組み合わせて作成されている。
我々の知る限り、これはウズベク語で新しく発表されたラテン文字をサポートする最初の機械翻訳ツールである。
論文 参考訳(メタデータ) (2022-05-19T14:19:42Z) - Context based Roman-Urdu to Urdu Script Transliteration System [0.0]
この研究の目的は、ローマ・ウルドゥー文字からウルドゥー文字への文脈ベースの翻訳を改善することである。
このアルゴリズムは、ローマ語の単語を標準のウルドゥー文字の単語に変換し、それを辞書と照合する。
論文 参考訳(メタデータ) (2021-09-29T05:24:55Z) - Leveraging Multilingual News Websites for Building a Kurdish Parallel
Corpus [0.6445605125467573]
クルド語、ソラニ語、クルマンジ語の2つの主要方言に12,327の翻訳ペアを含むコーパスを提示する。
また、英語のクルマンジ語と英語のソルニ語で1,797と650の翻訳ペアを提供している。
論文 参考訳(メタデータ) (2020-10-04T11:52:50Z) - Using Punkt for Sentence Segmentation in non-Latin Scripts: Experiments
on Kurdish (Sorani) Texts [0.76146285961466]
Punktは教師なしの機械学習手法である。
我々はパンクトを使って、ペルシア・アラビア文字で書かれたソラニ方言のクルド語コーパスを区分した。
実験では、F1スコア91.10%、エラーレート16.32%を達成しました。
論文 参考訳(メタデータ) (2020-04-09T06:44:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。