論文の概要: A Model for Translation of Text from Indian Languages to Bharti Braille
Characters
- arxiv url: http://arxiv.org/abs/2305.06475v1
- Date: Fri, 5 May 2023 09:21:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-14 20:47:24.111128
- Title: A Model for Translation of Text from Indian Languages to Bharti Braille
Characters
- Title(参考訳): インド語からbharti braille文字への翻訳モデル
- Authors: Nisheeth Joshi, Pragya Katyayan
- Abstract要約: インドの主要言語のテキストをBharti Brailleスクリプトに変換するスキームを提案する。
このシステムは、まず、インド語のテキストをルールベースシステムに付与するハイブリッドアプローチを用いており、曖昧さがある場合、LSTMベースのモデルを適用することで解決する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: People who are visually impaired face a lot of difficulties while studying.
One of the major causes to this is lack of available text in Bharti Braille
script. In this paper, we have suggested a scheme to convert text in major
Indian languages into Bharti Braille. The system uses a hybrid approach where
at first the text in Indian language is given to a rule based system and in
case if there is any ambiguity then it is resolved by applying a LSTM based
model. The developed model has also been tested and found to have produced near
accurate results.
- Abstract(参考訳): 視覚障害者は勉強中に多くの困難に直面している。
主な原因の1つは、Bharti Brailleスクリプトで利用可能なテキストがないことである。
本稿では,インドの主要言語におけるテキストをBharti Brailleに変換する手法を提案する。
このシステムは、まず、インド語のテキストをルールベースシステムに付与するハイブリッドアプローチを用いており、曖昧さがある場合、LSTMベースのモデルを適用することで解決する。
開発されたモデルもテストされ、ほぼ正確な結果が得られた。
関連論文リスト
- TextDiffuser-2: Unleashing the Power of Language Models for Text
Rendering [118.30923824681642]
TextDiffuser-2は、テキストレンダリングのための言語モデルのパワーを解き放つことを目的としている。
拡散モデル内の言語モデルを用いて,行レベルでの位置とテキストを符号化する。
我々は広範な実験を行い、GPT-4Vと同様に、ヒトの参加者を含むユーザスタディを取り入れた。
論文 参考訳(メタデータ) (2023-11-28T04:02:40Z) - Language Generation from Brain Recordings [68.97414452707103]
本稿では,大言語モデルと意味脳デコーダの容量を利用した生成言語BCIを提案する。
提案モデルでは,視覚的・聴覚的言語刺激のセマンティック内容に整合したコヒーレントな言語系列を生成することができる。
本研究は,直接言語生成におけるBCIの活用の可能性と可能性を示すものである。
論文 参考訳(メタデータ) (2023-11-16T13:37:21Z) - Question answering using deep learning in low resource Indian language
Marathi [0.0]
本稿では,読解理解に基づく質問応答システムを構築するためのトランスフォーマーモデルについて検討する。
EMスコアが0.64、F1スコアが0.74のMuRIL多言語モデルでは、マラシデータセット上でモデルを微調整することで、最良の精度を得ることができた。
論文 参考訳(メタデータ) (2023-09-27T16:53:11Z) - Bhasha-Abhijnaanam: Native-script and romanized Language Identification
for 22 Indic languages [32.5582250356516]
我々は、インド憲法に記載されている22の言語で、母国語とローマ語の両方で言語識別データセットとモデルを作成します。
まず、ネイティブスクリプトの言語識別テストセットであるBhasha-Abhijnaanamと、ロマライズされたテキストを作成する。
IndicLIDもトレーニングしています。ネイティブとローマン化されたスクリプトの両方で、上記のすべての言語用の言語識別子です。
論文 参考訳(メタデータ) (2023-05-25T07:53:23Z) - Machine Translation by Projecting Text into the Same
Phonetic-Orthographic Space Using a Common Encoding [3.0422770070015295]
本稿では,言語類似性を利用した共通多言語ラテン文字符号化(WX表記法)を提案する。
提案手法を類似言語対の実験により検証する。
また、遠距離とゼロショットの言語ペアで最大1BLEUポイントの改善も行います。
論文 参考訳(メタデータ) (2023-05-21T06:46:33Z) - Challenge Dataset of Cognates and False Friend Pairs from Indian
Languages [54.6340870873525]
コニャートは異なる言語で同じテキストの複数の変種に存在する。
本稿では,12言語を対象とした2つのコグネートデータセットの作成について述べる。
論文 参考訳(メタデータ) (2021-12-17T14:23:43Z) - Harnessing Cross-lingual Features to Improve Cognate Detection for
Low-resource Languages [50.82410844837726]
言語間単語埋め込みを用いた14言語間のコニャートの検出を実証する。
インドの12言語からなる挑戦的データセットを用いて,コニャート検出手法の評価を行った。
我々は,コグネート検出のためのFスコアで最大18%の改善点を観察した。
論文 参考訳(メタデータ) (2021-12-16T11:17:58Z) - Towards Zero-shot Language Modeling [90.80124496312274]
人間の言語学習に誘導的に偏りを持つニューラルモデルを構築した。
類型的に多様な訓練言語のサンプルからこの分布を推測する。
我々は、保留言語に対する遠隔監視として、追加の言語固有の側情報を利用する。
論文 参考訳(メタデータ) (2021-08-06T23:49:18Z) - Read Like Humans: Autonomous, Bidirectional and Iterative Language
Modeling for Scene Text Recognition [80.446770909975]
言語知識はシーンのテキスト認識に非常に有益である。
エンドツーエンドのディープネットワークで言語規則を効果的にモデル化する方法はまだ研究の課題です。
シーンテキスト認識のための自律的双方向反復型ABINetを提案する。
論文 参考訳(メタデータ) (2021-03-11T06:47:45Z) - Experimental Evaluation of Deep Learning models for Marathi Text
Classification [0.0]
CNN, LSTM, ULMFiT, BERT ベースのモデルを, 2つの公開 Marathi テキスト分類データセットで評価する。
CNNとLSTMに基づく基本単層モデルとFastTextの埋め込みは、利用可能なデータセット上でBERTベースのモデルと同等に動作することを示す。
論文 参考訳(メタデータ) (2021-01-13T06:21:27Z) - Braille to Text Translation for Bengali Language: A Geometric Approach [0.0]
一般人は点字を読めない。だから教師や親類は、学習を手伝うのが難しい。
ここでは、これらの触覚アルファベットを画像化し、それらをプレーンテキストに変換する点字 to Text Translatorを提案する。
この手法は点字認識において97.25%の精度が得られる。
論文 参考訳(メタデータ) (2020-12-02T19:57:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。