論文の概要: Transliterating Kurdish texts in Latin into Persian-Arabic script
- arxiv url: http://arxiv.org/abs/2110.12374v1
- Date: Sun, 24 Oct 2021 07:28:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-31 14:32:38.180072
- Title: Transliterating Kurdish texts in Latin into Persian-Arabic script
- Title(参考訳): ラテン語でクルド語のテキストをペルシア・アラビア文字に翻訳する
- Authors: Hossein Hassani
- Abstract要約: ラテン語のクルド文字をペルシア・アラビア文字に翻訳する文字を提示する。
このツールはクルド人のBLARKの一部であり、非商業的使用のために公開されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Kurdish is written in different scripts. The two most popular scripts are
Latin and Persian-Arabic. However, not all Kurdish readers are familiar with
both mentioned scripts that could be resolved by automatic transliterators. So
far, the developed tools mostly transliterate Persian-Arabic scripts into
Latin. We present a transliterator to transliterate Kurdish texts in Latin into
Persian-Arabic script. We also discuss the issues that should be considered in
the transliteration process. The tool is a part of Kurdish BLARK, and it is
publicly available for non-commercial use
- Abstract(参考訳): クルド語は異なる文字で書かれている。
最も人気のある文字はラテン語とペルシア語である。
しかし、クルド人読者の全員が、自動翻訳者によって解決される可能性のある両方のスクリプトに精通しているわけではない。
これまでのところ、開発ツールは主にペルシア・アラビア語の文字をラテン語に翻訳している。
ラテン語のクルド文字をペルシア・アラビア文字に翻訳する文字を提示する。
また、翻訳過程において考慮すべき課題についても論じる。
このツールはクルド語のblarkの一部であり、非商用で利用可能である。
関連論文リスト
- Enhancing Cross-lingual Transfer via Phonemic Transcription Integration [57.109031654219294]
PhoneXLは、音素転写を言語間移動のための追加のモダリティとして組み込んだフレームワークである。
本研究は, 音素転写が, 言語間移動を促進するために, 正書法以外の重要な情報を提供することを示すものである。
論文 参考訳(メタデータ) (2023-07-10T06:17:33Z) - Romanization-based Large-scale Adaptation of Multilingual Language
Models [124.57923286144515]
大規模多言語事前学習言語モデル (mPLMs) は,NLPにおける多言語間移動のデファクトステートとなっている。
我々は、mPLMをローマン化および非ロマン化した14の低リソース言語コーパスに適用するためのデータとパラメータ効率の戦略を多数検討し、比較した。
以上の結果から, UROMAN をベースとしたトランスリテラルは,多くの言語で高い性能を達成できることがわかった。
論文 参考訳(メタデータ) (2023-04-18T09:58:34Z) - Beyond Arabic: Software for Perso-Arabic Script Manipulation [67.31374614549237]
ペルソ・アラビア文字を使用する言語の書き起こしシステムを操作するための有限状態トランスデューサ(FST)コンポーネントとそれに対応するユーティリティのセットを提供する。
ライブラリはまた、単純なFSTベースのロマン化と文字変換も提供する。
論文 参考訳(メタデータ) (2023-01-26T20:37:03Z) - Graphemic Normalization of the Perso-Arabic Script [47.429213930688086]
本稿では,ペルソ・アラビア語が最良文書言語を超えて提示する課題について述べる。
自然言語処理(NLP)の状況に注目する。
ペルソ・アラビア文字ディアスポラの多言語語族8言語に対する正規化が機械翻訳および統計言語モデリングタスクに及ぼす影響を評価する。
論文 参考訳(メタデータ) (2022-10-21T21:59:44Z) - A machine transliteration tool between Uzbek alphabets [0.0]
本稿では,旧キリル文字と現在公用語であるラテン語と,新たに発表された新ラテン文字の機械翻訳ツールを提案する。
このツールはルールベースのアプローチと微調整のアプローチを組み合わせて作成されている。
我々の知る限り、これはウズベク語で新しく発表されたラテン文字をサポートする最初の機械翻訳ツールである。
論文 参考訳(メタデータ) (2022-05-19T14:19:42Z) - Comprehensive Benchmark Datasets for Amharic Scene Text Detection and
Recognition [56.048783994698425]
Ethiopic/Amharicスクリプトはアフリカ最古の書記システムの一つで、東アフリカで少なくとも23の言語に対応している。
アムハラ語の表記体系である Abugida は282音節、15句の句読点、20の数字を持つ。
HUST-ART, HUST-AST, ABE, Tana という,自然界におけるアムハラ文字の検出と認識のための総合的な公開データセットを提示した。
論文 参考訳(メタデータ) (2022-03-23T03:19:35Z) - Context based Roman-Urdu to Urdu Script Transliteration System [0.0]
この研究の目的は、ローマ・ウルドゥー文字からウルドゥー文字への文脈ベースの翻訳を改善することである。
このアルゴリズムは、ローマ語の単語を標準のウルドゥー文字の単語に変換し、それを辞書と照合する。
論文 参考訳(メタデータ) (2021-09-29T05:24:55Z) - Leveraging Multilingual News Websites for Building a Kurdish Parallel
Corpus [0.6445605125467573]
クルド語、ソラニ語、クルマンジ語の2つの主要方言に12,327の翻訳ペアを含むコーパスを提示する。
また、英語のクルマンジ語と英語のソルニ語で1,797と650の翻訳ペアを提供している。
論文 参考訳(メタデータ) (2020-10-04T11:52:50Z) - Consecutive Decoding for Speech-to-text Translation [51.155661276936044]
COnSecutive Transcription and Translation (COSTT)は、音声からテキストへの翻訳に不可欠な手法である。
鍵となるアイデアは、ソースの書き起こしとターゲットの翻訳テキストを1つのデコーダで生成することである。
本手法は3つの主流データセットで検証する。
論文 参考訳(メタデータ) (2020-09-21T10:10:45Z) - Using Punkt for Sentence Segmentation in non-Latin Scripts: Experiments
on Kurdish (Sorani) Texts [0.76146285961466]
Punktは教師なしの機械学習手法である。
我々はパンクトを使って、ペルシア・アラビア文字で書かれたソラニ方言のクルド語コーパスを区分した。
実験では、F1スコア91.10%、エラーレート16.32%を達成しました。
論文 参考訳(メタデータ) (2020-04-09T06:44:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。