論文の概要: Joint Transformer/RNN Architecture for Gesture Typing in Indic Languages
- arxiv url: http://arxiv.org/abs/2203.14049v1
- Date: Sat, 26 Mar 2022 11:14:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-29 13:46:42.429013
- Title: Joint Transformer/RNN Architecture for Gesture Typing in Indic Languages
- Title(参考訳): 対話型言語におけるジェスチャタイピングのための共同変換器/RNNアーキテクチャ
- Authors: Emil Biju, Anirudh Sriram, Mitesh M. Khapra, Pratyush Kumar
- Abstract要約: この作業は、Indic言語でのジェスチャータイピングをサポートするキーボードの開発を目的としている。
7つのIndic言語から193,658語のキーボードトレースを含むデータセットを作成する。
第2に、これらの言語にまたがるウィキデータから104,412の英印字ペアをキュレートする。
- 参考スコア(独自算出の注目度): 17.051352821564002
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Gesture typing is a method of typing words on a touch-based keyboard by
creating a continuous trace passing through the relevant keys. This work is
aimed at developing a keyboard that supports gesture typing in Indic languages.
We begin by noting that when dealing with Indic languages, one needs to cater
to two different sets of users: (i) users who prefer to type in the native
Indic script (Devanagari, Bengali, etc.) and (ii) users who prefer to type in
the English script but want the output transliterated into the native script.
In both cases, we need a model that takes a trace as input and maps it to the
intended word. To enable the development of these models, we create and release
two datasets. First, we create a dataset containing keyboard traces for 193,658
words from 7 Indic languages. Second, we curate 104,412 English-Indic
transliteration pairs from Wikidata across these languages. Using these
datasets we build a model that performs path decoding, transliteration, and
transliteration correction. Unlike prior approaches, our proposed model does
not make co-character independence assumptions during decoding. The overall
accuracy of our model across the 7 languages varies from 70-95%.
- Abstract(参考訳): ジェスチャタイピング(英: Gesture typing)とは、タッチベースのキーボード上で、関連するキーを連続的にトレースすることで単語をタイプする方法である。
本研究の目的は,indic 言語でジェスチャ入力をサポートするキーボードの開発である。
まず、Indic言語を扱う際には、2つの異なるユーザセットに注意する必要があることに注意してください。
(i)ネイティブ・インデックス・スクリプト(Devanagari、Bengaliなど)を入力したいユーザ
(ii)英語のスクリプトを入力したいが、その出力をネイティブのスクリプトに書き起こしたいユーザ。
どちらの場合でも、トレースを入力として、それを意図した単語にマップするモデルが必要です。
これらのモデルの開発を可能にするために、2つのデータセットを作成し、リリースする。
まず、7つのindic言語から193,658単語のキーボードトレースを含むデータセットを作成する。
第2に,これらの言語間のウィキデータから104,412個の英字訳ペアを収集した。
これらのデータセットを使用して、パス復号、音訳、音訳補正を行うモデルを構築します。
従来の手法とは異なり,提案モデルではデコード時に共文字独立性を仮定しない。
7言語間のモデルの全体的な精度は70~95%である。
関連論文リスト
- Bukva: Russian Sign Language Alphabet [75.42794328290088]
本稿では,ロシア手話(RSL)ダクティルとしても知られる,ロシア語の指先文字の認識について検討する。
ダクティル (Dactyl) は手の動きが書かれた言語の個々の文字を表す手話の構成要素である。
当社は、RSLダクチル認識のための、最初の本格的なオープンソースビデオデータセットであるBakvaを提供している。
論文 参考訳(メタデータ) (2024-10-11T09:59:48Z) - IndicSentEval: How Effectively do Multilingual Transformer Models encode Linguistic Properties for Indic Languages? [14.77467551053299]
トランスフォーマーベースのモデルは自然言語処理の分野に革命をもたらした。
入力テキストの摂動に直面する言語特性の符号化におけるこれらのモデルはどの程度堅牢か?
本稿では,13の摂動にまたがる8つの言語特性に対して,符号化能力とロバスト性に関する類似の疑問を6つのIndic言語で検討する。
論文 参考訳(メタデータ) (2024-10-03T15:50:08Z) - Navigating Text-to-Image Generative Bias across Indic Languages [53.92640848303192]
本研究ではインドで広く話されているIndic言語に対するテキスト・ツー・イメージ(TTI)モデルのバイアスについて検討する。
これらの言語における主要なTTIモデルの生成的パフォーマンスと文化的関連性を評価し,比較する。
論文 参考訳(メタデータ) (2024-08-01T04:56:13Z) - Pretraining Data and Tokenizer for Indic LLM [1.7729311045335219]
我々は,多言語Indic大言語モデル構築のためのデータ準備のための新しいアプローチを開発する。
われわれの厳密なデータ取得は、Common Crawl、Indic Book、ニュース記事、Wikipediaなど、オープンソースとプロプライエタリなソースにまたがっている。
Indic言語毎に、冗長で低品質なテキストコンテンツを効果的に除去するカスタムプリプロセッシングパイプラインを設計する。
論文 参考訳(メタデータ) (2024-07-17T11:06:27Z) - Breaking the Script Barrier in Multilingual Pre-Trained Language Models with Transliteration-Based Post-Training Alignment [50.27950279695363]
転送性能は、低リソースのターゲット言語が高リソースのソース言語とは異なるスクリプトで書かれている場合、しばしば妨げられる。
本論文は,この問題に対処するために翻訳を用いた最近の研究に触発されて,翻訳に基づくポストプレトレーニングアライメント(PPA)手法を提案する。
論文 参考訳(メタデータ) (2024-06-28T08:59:24Z) - Beyond Arabic: Software for Perso-Arabic Script Manipulation [67.31374614549237]
ペルソ・アラビア文字を使用する言語の書き起こしシステムを操作するための有限状態トランスデューサ(FST)コンポーネントとそれに対応するユーティリティのセットを提供する。
ライブラリはまた、単純なFSTベースのロマン化と文字変換も提供する。
論文 参考訳(メタデータ) (2023-01-26T20:37:03Z) - Aksharantar: Open Indic-language Transliteration datasets and models for
the Next Billion Users [32.23606056944172]
Aksharantarは、モノリンガルコーパスとパラレルコーパスからのマイニングによって生成された、インド語のための最大公用翻訳データセットである。
データセットには、12のスクリプトを使用して、3つの言語ファミリーから21のIndic言語に対する2600万の文字ペアが含まれている。
Aksharantarは、既存のデータセットの21倍の大きさで、7つの言語と1つの言語ファミリーのための最初の公開データセットである。
論文 参考訳(メタデータ) (2022-05-06T05:13:12Z) - Handling Compounding in Mobile Keyboard Input [7.309321705635677]
本稿では,形態的にリッチな言語におけるモバイルユーザのタイピング体験を改善するためのフレームワークを提案する。
スマートフォンのキーボードは典型的には、入力復号化、修正、予測といった言語モデルに依存している機能をサポートしている。
本手法は, 様々な複合言語において, 単語誤り率を約20%削減することを示す。
論文 参考訳(メタデータ) (2022-01-17T15:28:58Z) - Challenge Dataset of Cognates and False Friend Pairs from Indian
Languages [54.6340870873525]
コニャートは異なる言語で同じテキストの複数の変種に存在する。
本稿では,12言語を対象とした2つのコグネートデータセットの作成について述べる。
論文 参考訳(メタデータ) (2021-12-17T14:23:43Z) - Neural Approaches for Data Driven Dependency Parsing in Sanskrit [19.844420181108177]
我々は、もともと異なる言語向けに提案された4つの異なるデータ駆動機械学習モデルを評価し、サンスクリットデータの性能を比較した。
低リソース環境での各モデルのパフォーマンスを1500文のトレーニングで比較する。
また,これらのシステムに対して文を入力として提供する単語順序付けの影響について,詩文とその対応する散文順序を解析することによって検討する。
論文 参考訳(メタデータ) (2020-04-17T06:47:15Z) - Towards Zero-shot Learning for Automatic Phonemic Transcription [82.9910512414173]
より難しい問題は、トレーニングデータをゼロにする言語のための音素変換器を構築することだ。
我々のモデルは、トレーニングデータなしで、ターゲット言語で見知らぬ音素を認識できる。
標準的な多言語モデルよりも平均して7.7%の音素誤り率を実現している。
論文 参考訳(メタデータ) (2020-02-26T20:38:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。