Fugu-MT 論文翻訳(概要): Keyboards for the Endangered Idu Mishmi Language

論文の概要: Keyboards for the Endangered Idu Mishmi Language

arxiv url: http://arxiv.org/abs/2602.19815v1
Date: Mon, 23 Feb 2026 13:13:40 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-24 17:42:02.822281
Title: Keyboards for the Endangered Idu Mishmi Language
Title（参考訳）: 絶滅危惧語「イドゥミシュミ語」のキーボード
Authors: Akhilesh Kakolu Ramarao,
Abstract要約: インド・アルナハル・プラデーシュで約11,000人の人々が話していた、絶滅危惧言語であるIdu Mishmiのための、モバイルおよびデスクトップキーボードスイートを提示する。当社のキーボードは,(1)Google Play Storeで公開されているAndroidモバイルキーボード,(2)現在コミュニティテスト中のWindowsデスクトップキーボードの2つのツールで構成されている。どちらもネットワークのパーミッションをゼロにして完全にオフラインで動作し、接続制約とデータ主権の懸念に対処する。
参考スコア（独自算出の注目度）: 1.6921396880325779
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: We present a mobile and desktop keyboard suite for Idu Mishmi, an endangered Trans-Himalayan language spoken by approximately 11,000 people in Arunachal Pradesh, India. Although a Latin-based orthography was developed in 2018, no digital input tools existed to use it, forcing speakers into ad-hoc romanizations that cannot represent the full writing system. Our keyboards comprise two tools: (1) an Android mobile keyboard, published on the Google Play Store and actively used in teacher training programs, and (2) a Windows desktop keyboard currently undergoing community testing. Both tools support the complete Idu Mishmi character inventory, including schwa, retracted schwa, nasalized vowels, and accented forms. Both operate fully offline with zero network permissions, addressing connectivity constraints and data sovereignty concerns. We describe the design, implementation, and deployment as a replicable model for other endangered language communities.
Abstract（参考訳）: インド・アルナハル・プラデーシュで約11,000人の人々が話していた、絶滅危惧言語であるIdu Mishmiのための、モバイルおよびデスクトップキーボードスイートを提示する。ラテン文字の正書法は2018年に開発されたが、それを使うためのデジタル入力ツールは存在せず、話者は完全な文字体系を表現できないアドホックなロマナイゼーションに強制された。弊社のキーボードは,(1)Google Play Storeで公開されているAndroidモバイルキーボードと(2)現在コミュニティテスト中のWindowsデスクトップキーボードの2つのツールで構成されている。どちらのツールも、シュワ(schwa)、取り除かれたシュワ(schwa)、鼻母音(nasalized vowels)、アクセントのある形を含む、完全なイドゥ・ミシュミ文字のインベントリをサポートしている。どちらもネットワークのパーミッションをゼロにして完全にオフラインで動作し、接続制約とデータ主権の懸念に対処する。我々は、この設計、実装、デプロイを、他の絶滅危惧言語コミュニティのレプリカモデルとして記述する。

関連論文リスト

Kinship in Speech: Leveraging Linguistic Relatedness for Zero-Shot TTS in Indian Languages [6.74683227658822]
インドには1369の言語があり、22の公用語が13のスクリプトを使用している。我々の研究はゼロショット合成に焦点を当てており、特にスクリプトとフォノタクティクスが異なる家系の言語を対象としている。サンスクリット語、マハーラーシュトリアン語、カナラ・コンカニ語、マイティリ語、クルフ語のために、知的で自然なスピーチが作られた。
論文参考訳（メタデータ） (2025-06-04T12:22:24Z)
Bukva: Russian Sign Language Alphabet [75.42794328290088]
本稿では,ロシア手話(RSL)ダクティルとしても知られる,ロシア語の指先文字の認識について検討する。ダクティル (Dactyl) は手の動きが書かれた言語の個々の文字を表す手話の構成要素である。当社は、RSLダクチル認識のための、最初の本格的なオープンソースビデオデータセットであるBakvaを提供している。
論文参考訳（メタデータ） (2024-10-11T09:59:48Z)
Luganda Speech Intent Recognition for IoT Applications [0.3374875022248865]
この研究プロジェクトは、IoTアプリケーションのためのLuganda音声意図分類システムを開発することを目的としている。このプロジェクトはRaspberry Pi、Wio Terminal、ESP32ノードなどのハードウェアコンポーネントをマイクロコントローラとして使用している。この研究の最終的な目的は、Raspberry Pi上にデプロイされた自然言語処理(NLP)モデルを通じて達成されたLugandaを使用した音声制御を可能にすることである。
論文参考訳（メタデータ） (2024-05-16T10:14:00Z)
Seamless: Multilingual Expressive and Streaming Speech Translation [71.12826355107889]
本稿では,エンドツーエンドの表現型および多言語翻訳をストリーミング形式で実現するモデル群を紹介する。まず,多言語およびマルチモーダルのSeamlessM4Tモデル-SeamlessM4T v2の改良版をコントリビュートする。 SeamlessExpressiveとSeamlessStreamingの主なコンポーネントをまとめてSeamlessを作ります。
論文参考訳（メタデータ） (2023-12-08T17:18:42Z)
NusaWrites: Constructing High-Quality Corpora for Underrepresented and Extremely Low-Resource Languages [54.808217147579036]
インドネシアの地方言語について事例研究を行う。データセット構築におけるオンラインスクラップ,人文翻訳,および母語話者による段落作成の有効性を比較した。本研究は,母語話者による段落作成によって生成されたデータセットが,語彙的多様性と文化的内容の点で優れた品質を示すことを示す。
論文参考訳（メタデータ） (2023-09-19T14:42:33Z)
Bhasha-Abhijnaanam: Native-script and romanized Language Identification for 22 Indic languages [32.5582250356516]
我々は、インド憲法に記載されている22の言語で、母国語とローマ語の両方で言語識別データセットとモデルを作成します。まず、ネイティブスクリプトの言語識別テストセットであるBhasha-Abhijnaanamと、ロマライズされたテキストを作成する。 IndicLIDもトレーニングしています。ネイティブとローマン化されたスクリプトの両方で、上記のすべての言語用の言語識別子です。
論文参考訳（メタデータ） (2023-05-25T07:53:23Z)
Slovo: Russian Sign Language Dataset [83.93252084624997]
本稿では,クラウドソーシングプラットフォームを用いたロシア手話(RSL)ビデオデータセットであるSlovoについて述べる。データセットには20,000のFullHDレコードが含まれており、194人の署名者が受信した1,000の独立したRSLジェスチャーに分割されている。
論文参考訳（メタデータ） (2023-05-23T21:00:42Z)
Joint Transformer/RNN Architecture for Gesture Typing in Indic Languages [17.051352821564002]
この作業は、Indic言語でのジェスチャータイピングをサポートするキーボードの開発を目的としている。 7つのIndic言語から193,658語のキーボードトレースを含むデータセットを作成する。第2に、これらの言語にまたがるウィキデータから104,412の英印字ペアをキュレートする。
論文参考訳（メタデータ） (2022-03-26T11:14:23Z)
Discovering Phonetic Inventories with Crosslingual Automatic Speech Recognition [71.49308685090324]
本稿では,未知言語における音声認識における異なる要因(モデルアーキテクチャ,音韻モデル,音声表現の種類)の影響について検討する。独特な音、類似した音、トーン言語は、音声による在庫発見の大きな課題である。
論文参考訳（メタデータ） (2022-01-26T22:12:55Z)
Phoneme Recognition through Fine Tuning of Phonetic Representations: a Case Study on Luhya Language Varieties [77.2347265289855]
音韻アノテーションに基づく多言語認識手法であるAllosaurus を用いた音素認識に焦点を当てた。挑戦的な実世界シナリオで評価するために,我々は,ケニア西部とウガンダ東部のluhya言語クラスタの2つの種類であるbukusuとsaamiaの音声認識データセットをキュレートした。私たちは、アロサウルスの微調整がわずか100発話であっても、電話のエラー率を大幅に改善することが分かりました。
論文参考訳（メタデータ） (2021-04-04T15:07:55Z)
MuRIL: Multilingual Representations for Indian Languages [3.529875637780551]
インドは、1369の合理化された言語と方言が全国で話されている多言語社会です。それにもかかわらず、今日の最先端の多言語システムは、インド(IN)言語で最適に動作します。 IN言語に特化した多言語言語モデルであるMuRILを提案します。
論文参考訳（メタデータ） (2021-03-19T11:06:37Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。