論文の概要: A Survey on Importance of Homophones Spelling Correction Model for Khmer Authors
- arxiv url: http://arxiv.org/abs/2411.10477v1
- Date: Mon, 11 Nov 2024 10:07:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-24 04:37:26.648705
- Title: A Survey on Importance of Homophones Spelling Correction Model for Khmer Authors
- Title(参考訳): クメール作家の矯正モデルに基づくホモフォンの重要性に関する調査
- Authors: Seanghort Born, Madeth May, Claudine Piau-Toffolon, Sébastien Iksal,
- Abstract要約: ホモフォンは発音の類似性や意味や綴りが異なるため、あらゆる言語の著者にとって重要な課題である。
本研究は、Khmer著者がホモフォンを執筆に用いた際の困難に対処することを目的としている。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Homophones present a significant challenge to authors in any languages due to their similarities of pronunciations but different meanings and spellings. This issue is particularly pronounced in the Khmer language, rich in homophones due to its complex structure and extensive character set. This research aims to address the difficulties faced by Khmer authors when using homophones in their writing and proposes potential solutions based on an extensive literature review and survey analysis. A survey of 108 Khmer native speakers, including students, employees, and professionals, revealed that many frequently encounter challenges with homophones in their writing, often struggling to choose the correct word based on context. The survey also highlighted the absence of effective tools to address homophone errors in Khmer, which complicates the writing process. Additionally, a review of existing studies on spelling correction in other languages, such as English, Azerbaijani, and Bangla, identified a lack of research focused specifically on homophones, particularly in the Khmer language. In summary, this research highlights the necessity for a specialized tool to address Khmer homophone errors. By bridging current gaps in research and available resources, such a tool would enhance the confidence and accuracy of Khmer authors in their writing, thereby contributing to the enrichment and preservation of the language. Continued efforts in this domain are essential for ensuring that Khmer can leverage advancements in technology and linguistics effectively.
- Abstract(参考訳): ホモフォンは発音の類似性や意味や綴りが異なるため、あらゆる言語の著者にとって重要な課題である。
この問題は特にクメール語で発音され、複雑な構造と広範な文字集合のためにホモフォンが豊富である。
本研究は,Khmer著者が文章にホモフォンを用いた場合の難しさに対処することを目的として,広範な文献レビューと調査分析に基づく潜在的な解決策を提案する。
学生、従業員、専門家を含む108人のクメール語話者を対象にした調査では、多くの人が文章の中でホモフォンの難題に遭遇し、文脈に基づいて正しい単語を選択するのに苦労していることがわかった。
調査ではまた、Khmerのホモフォンエラーに対処する効果的なツールが欠如していることを強調した。
さらに、英語、アゼルバイジャン語、バングラ語などの他の言語における綴りの訂正に関する既存の研究のレビューでは、特にクメール語に焦点を絞った研究が欠如していることが判明した。
要約すると、この研究はKhmerホモフォンの誤りに対処する特別なツールの必要性を強調している。
研究と利用可能な資源のギャップを埋めることによって、そのようなツールはクメールの著者の著作における自信と正確さを高め、言語を豊かにし、保存することに貢献した。
この領域における継続的な努力は、クメールが技術と言語学の進歩を効果的に活用できることを保証するために不可欠である。
関連論文リスト
- Understanding Cross-Lingual Alignment -- A Survey [52.572071017877704]
言語間アライメントは多言語言語モデルにおける言語間の表現の有意義な類似性である。
本研究は,言語間アライメントの向上,手法の分類,分野全体からの洞察の要約といった手法の文献を調査する。
論文 参考訳(メタデータ) (2024-04-09T11:39:53Z) - What Do Dialect Speakers Want? A Survey of Attitudes Towards Language Technology for German Dialects [60.8361859783634]
我々はドイツ語に関連する方言と地域言語に関する話者を調査した。
回答者は特に、方言入力で動作する潜在的なNLPツールを好んでいる。
論文 参考訳(メタデータ) (2024-02-19T09:15:28Z) - Quantifying the Dialect Gap and its Correlates Across Languages [69.18461982439031]
この研究は、明らかな相違を明らかにし、マインドフルなデータ収集を通じてそれらに対処する可能性のある経路を特定することによって、方言NLPの分野を強化する基盤となる。
論文 参考訳(メタデータ) (2023-10-23T17:42:01Z) - Improving Rare Words Recognition through Homophone Extension and Unified
Writing for Low-resource Cantonese Speech Recognition [36.10245119706219]
ホモフォン文字は、マンダリンやカントン語のような音節ベースの言語で一般的である。
本稿では,ビーム探索復号化プロセスにホモフォン語彙の人間の知識を統合するための新しいホモホン拡張手法を提案する。
また、カントン文字の変種をマージする統一的な自動記述法を提案する。
論文 参考訳(メタデータ) (2023-02-02T02:46:32Z) - Accuracy of the Uzbek stop words detection: a case study on "School
corpus" [0.0]
本稿では,自動生成を目的とした停止語リストの品質評価手法を提案する。
この手法はウズベク語の停止語のリストを自動生成してテストした。
論文 参考訳(メタデータ) (2022-09-15T05:14:31Z) - Khmer Word Search: Challenges, Solutions, and Semantic-Aware Search [0.0]
複数の文字の順序と異なる単語のスペル認識は、クメール語検索機能に制約を課す。
堅牢なスペルチェッカーは入力デバイスプラットフォームで一般的に利用できないため、スペルミスは一般的である。
提案手法は文字順正規化, 音素ベースのスペルチェッカー, Khmerワードセマンティックモデルなどである。
論文 参考訳(メタデータ) (2021-12-16T14:37:41Z) - Phoneme Recognition through Fine Tuning of Phonetic Representations: a
Case Study on Luhya Language Varieties [77.2347265289855]
音韻アノテーションに基づく多言語認識手法であるAllosaurus を用いた音素認識に焦点を当てた。
挑戦的な実世界シナリオで評価するために,我々は,ケニア西部とウガンダ東部のluhya言語クラスタの2つの種類であるbukusuとsaamiaの音声認識データセットをキュレートした。
私たちは、アロサウルスの微調整がわずか100発話であっても、電話のエラー率を大幅に改善することが分かりました。
論文 参考訳(メタデータ) (2021-04-04T15:07:55Z) - Deciphering Undersegmented Ancient Scripts Using Phonetic Prior [31.707254394215283]
ほとんどの未解読失語言語は、重要な解読課題を引き起こす2つの特徴を持っている。
豊かな言語制約を基礎として,これらの課題に対処するモデルを提案する。
我々は、解読された言語(ゴシック語、ウガル語)と未解読言語(イベリア語)の両方でモデルを評価する。
論文 参考訳(メタデータ) (2020-10-21T15:03:52Z) - A Multitask Learning Approach for Diacritic Restoration [21.288912928687186]
アラビア語のような多くの言語では、発音と意味を区別するためにダイアクリティカルが用いられる。
このようなダイアクリティカル語はテキストで省略されることが多く、単語の発音や意味の数が増加する。
我々は、共同モデリングにおいて考慮すべきタスクに十分なデータ資源があるため、ケーススタディとしてアラビア語を使用します。
論文 参考訳(メタデータ) (2020-06-07T01:20:40Z) - A Corpus for Large-Scale Phonetic Typology [112.19288631037055]
本稿では,VoxClamantis v1.0について紹介する。
635言語にまたがる690の音素レベルラベルと690の音素レベルラベルと母音とシビラントの音響・音韻測定を行った。
論文 参考訳(メタデータ) (2020-05-28T13:03:51Z) - Towards Zero-shot Learning for Automatic Phonemic Transcription [82.9910512414173]
より難しい問題は、トレーニングデータをゼロにする言語のための音素変換器を構築することだ。
我々のモデルは、トレーニングデータなしで、ターゲット言語で見知らぬ音素を認識できる。
標準的な多言語モデルよりも平均して7.7%の音素誤り率を実現している。
論文 参考訳(メタデータ) (2020-02-26T20:38:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。