論文の概要: Keyboards for the Endangered Idu Mishmi Language
- arxiv url: http://arxiv.org/abs/2602.19815v1
- Date: Mon, 23 Feb 2026 13:13:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-24 17:42:02.822281
- Title: Keyboards for the Endangered Idu Mishmi Language
- Title(参考訳): 絶滅危惧語「イドゥミシュミ語」のキーボード
- Authors: Akhilesh Kakolu Ramarao,
- Abstract要約: インド・アルナハル・プラデーシュで約11,000人の人々が話していた、絶滅危惧言語であるIdu Mishmiのための、モバイルおよびデスクトップキーボードスイートを提示する。
当社のキーボードは,(1)Google Play Storeで公開されているAndroidモバイルキーボード,(2)現在コミュニティテスト中のWindowsデスクトップキーボードの2つのツールで構成されている。
どちらもネットワークのパーミッションをゼロにして完全にオフラインで動作し、接続制約とデータ主権の懸念に対処する。
- 参考スコア(独自算出の注目度): 1.6921396880325779
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We present a mobile and desktop keyboard suite for Idu Mishmi, an endangered Trans-Himalayan language spoken by approximately 11,000 people in Arunachal Pradesh, India. Although a Latin-based orthography was developed in 2018, no digital input tools existed to use it, forcing speakers into ad-hoc romanizations that cannot represent the full writing system. Our keyboards comprise two tools: (1) an Android mobile keyboard, published on the Google Play Store and actively used in teacher training programs, and (2) a Windows desktop keyboard currently undergoing community testing. Both tools support the complete Idu Mishmi character inventory, including schwa, retracted schwa, nasalized vowels, and accented forms. Both operate fully offline with zero network permissions, addressing connectivity constraints and data sovereignty concerns. We describe the design, implementation, and deployment as a replicable model for other endangered language communities.
- Abstract(参考訳): インド・アルナハル・プラデーシュで約11,000人の人々が話していた、絶滅危惧言語であるIdu Mishmiのための、モバイルおよびデスクトップキーボードスイートを提示する。
ラテン文字の正書法は2018年に開発されたが、それを使うためのデジタル入力ツールは存在せず、話者は完全な文字体系を表現できないアドホックなロマナイゼーションに強制された。
弊社のキーボードは,(1)Google Play Storeで公開されているAndroidモバイルキーボードと(2)現在コミュニティテスト中のWindowsデスクトップキーボードの2つのツールで構成されている。
どちらのツールも、シュワ(schwa)、取り除かれたシュワ(schwa)、鼻母音(nasalized vowels)、アクセントのある形を含む、完全なイドゥ・ミシュミ文字のインベントリをサポートしている。
どちらもネットワークのパーミッションをゼロにして完全にオフラインで動作し、接続制約とデータ主権の懸念に対処する。
我々は、この設計、実装、デプロイを、他の絶滅危惧言語コミュニティのレプリカモデルとして記述する。
関連論文リスト
- Bukva: Russian Sign Language Alphabet [75.42794328290088]
本稿では,ロシア手話(RSL)ダクティルとしても知られる,ロシア語の指先文字の認識について検討する。
ダクティル (Dactyl) は手の動きが書かれた言語の個々の文字を表す手話の構成要素である。
当社は、RSLダクチル認識のための、最初の本格的なオープンソースビデオデータセットであるBakvaを提供している。
論文 参考訳(メタデータ) (2024-10-11T09:59:48Z) - Luganda Speech Intent Recognition for IoT Applications [0.3374875022248865]
この研究プロジェクトは、IoTアプリケーションのためのLuganda音声意図分類システムを開発することを目的としている。
このプロジェクトはRaspberry Pi、Wio Terminal、ESP32ノードなどのハードウェアコンポーネントをマイクロコントローラとして使用している。
この研究の最終的な目的は、Raspberry Pi上にデプロイされた自然言語処理(NLP)モデルを通じて達成されたLugandaを使用した音声制御を可能にすることである。
論文 参考訳(メタデータ) (2024-05-16T10:14:00Z) - NusaWrites: Constructing High-Quality Corpora for Underrepresented and
Extremely Low-Resource Languages [54.808217147579036]
インドネシアの地方言語について事例研究を行う。
データセット構築におけるオンラインスクラップ,人文翻訳,および母語話者による段落作成の有効性を比較した。
本研究は,母語話者による段落作成によって生成されたデータセットが,語彙的多様性と文化的内容の点で優れた品質を示すことを示す。
論文 参考訳(メタデータ) (2023-09-19T14:42:33Z) - Bhasha-Abhijnaanam: Native-script and romanized Language Identification
for 22 Indic languages [32.5582250356516]
我々は、インド憲法に記載されている22の言語で、母国語とローマ語の両方で言語識別データセットとモデルを作成します。
まず、ネイティブスクリプトの言語識別テストセットであるBhasha-Abhijnaanamと、ロマライズされたテキストを作成する。
IndicLIDもトレーニングしています。ネイティブとローマン化されたスクリプトの両方で、上記のすべての言語用の言語識別子です。
論文 参考訳(メタデータ) (2023-05-25T07:53:23Z) - Joint Transformer/RNN Architecture for Gesture Typing in Indic Languages [17.051352821564002]
この作業は、Indic言語でのジェスチャータイピングをサポートするキーボードの開発を目的としている。
7つのIndic言語から193,658語のキーボードトレースを含むデータセットを作成する。
第2に、これらの言語にまたがるウィキデータから104,412の英印字ペアをキュレートする。
論文 参考訳(メタデータ) (2022-03-26T11:14:23Z) - Discovering Phonetic Inventories with Crosslingual Automatic Speech
Recognition [71.49308685090324]
本稿では,未知言語における音声認識における異なる要因(モデルアーキテクチャ,音韻モデル,音声表現の種類)の影響について検討する。
独特な音、類似した音、トーン言語は、音声による在庫発見の大きな課題である。
論文 参考訳(メタデータ) (2022-01-26T22:12:55Z) - Phoneme Recognition through Fine Tuning of Phonetic Representations: a
Case Study on Luhya Language Varieties [77.2347265289855]
音韻アノテーションに基づく多言語認識手法であるAllosaurus を用いた音素認識に焦点を当てた。
挑戦的な実世界シナリオで評価するために,我々は,ケニア西部とウガンダ東部のluhya言語クラスタの2つの種類であるbukusuとsaamiaの音声認識データセットをキュレートした。
私たちは、アロサウルスの微調整がわずか100発話であっても、電話のエラー率を大幅に改善することが分かりました。
論文 参考訳(メタデータ) (2021-04-04T15:07:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。