Fugu-MT 論文翻訳(概要): A Model for Translation of Text from Indian Languages to Bharti Braille Characters

論文の概要: A Model for Translation of Text from Indian Languages to Bharti Braille Characters

arxiv url: http://arxiv.org/abs/2305.06475v1
Date: Fri, 5 May 2023 09:21:13 GMT
ステータス: 翻訳完了
システム内更新日: 2023-05-14 20:47:24.111128
Title: A Model for Translation of Text from Indian Languages to Bharti Braille Characters
Title（参考訳）: インド語からbharti braille文字への翻訳モデル
Authors: Nisheeth Joshi, Pragya Katyayan
Abstract要約: インドの主要言語のテキストをBharti Brailleスクリプトに変換するスキームを提案する。このシステムは、まず、インド語のテキストをルールベースシステムに付与するハイブリッドアプローチを用いており、曖昧さがある場合、LSTMベースのモデルを適用することで解決する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: People who are visually impaired face a lot of difficulties while studying. One of the major causes to this is lack of available text in Bharti Braille script. In this paper, we have suggested a scheme to convert text in major Indian languages into Bharti Braille. The system uses a hybrid approach where at first the text in Indian language is given to a rule based system and in case if there is any ambiguity then it is resolved by applying a LSTM based model. The developed model has also been tested and found to have produced near accurate results.
Abstract（参考訳）: 視覚障害者は勉強中に多くの困難に直面している。主な原因の1つは、Bharti Brailleスクリプトで利用可能なテキストがないことである。本稿では,インドの主要言語におけるテキストをBharti Brailleに変換する手法を提案する。このシステムは、まず、インド語のテキストをルールベースシステムに付与するハイブリッドアプローチを用いており、曖昧さがある場合、LSTMベースのモデルを適用することで解決する。開発されたモデルもテストされ、ほぼ正確な結果が得られた。

関連論文リスト

Bilingual Word Level Language Identification for Omotic Languages [44.04646981451376]
本稿では,エチオピア南部,すなわちWolaitaとGofaで話されている言語に対するバイリンガル言語識別(BLID)について述べる。この課題を克服するために、様々なアプローチで様々な実験を行った。 BERTベースの事前訓練言語モデルとLSTMアプローチの組み合わせは、テストセットのF1スコアが0.72であった。
論文参考訳（メタデータ） (2025-09-05T23:36:26Z)
Vision-Braille: An End-to-End Tool for Chinese Braille Image-to-Text Translation [12.027431535689717]
視覚障害者は、読み書きに点字しか使えない大規模なグループである。点字作家はしばしば音色を省略して空間を節約し、同じ子音と母音の点字が中国語に翻訳されると混乱する。このプロジェクトは、初めて公開された点字翻訳システムである。
論文参考訳（メタデータ） (2024-07-08T15:51:37Z)
CoSTA: Code-Switched Speech Translation using Aligned Speech-Text Interleaving [61.73180469072787]
インド語から英語のテキストへのコード変更音声の音声翻訳(ST)の問題に焦点をあてる。本稿では、事前訓練された自動音声認識(ASR)と機械翻訳(MT)モジュールを足場として、新しいエンドツーエンドモデルアーキテクチャCOSTAを提案する。 COSTAは、多くの競合するカスケードおよびエンドツーエンドのマルチモーダルベースラインを3.5BLEUポイントまで上回っている。
論文参考訳（メタデータ） (2024-06-16T16:10:51Z)
TextDiffuser-2: Unleashing the Power of Language Models for Text Rendering [118.30923824681642]
TextDiffuser-2は、テキストレンダリングのための言語モデルのパワーを解き放つことを目的としている。拡散モデル内の言語モデルを用いて,行レベルでの位置とテキストを符号化する。我々は広範な実験を行い、GPT-4Vと同様に、ヒトの参加者を含むユーザスタディを取り入れた。
論文参考訳（メタデータ） (2023-11-28T04:02:40Z)
Language Generation from Brain Recordings [68.97414452707103]
本稿では,大言語モデルと意味脳デコーダの容量を利用した生成言語BCIを提案する。提案モデルでは,視覚的・聴覚的言語刺激のセマンティック内容に整合したコヒーレントな言語系列を生成することができる。本研究は,直接言語生成におけるBCIの活用の可能性と可能性を示すものである。
論文参考訳（メタデータ） (2023-11-16T13:37:21Z)
Question answering using deep learning in low resource Indian language Marathi [0.0]
本稿では,読解理解に基づく質問応答システムを構築するためのトランスフォーマーモデルについて検討する。 EMスコアが0.64、F1スコアが0.74のMuRIL多言語モデルでは、マラシデータセット上でモデルを微調整することで、最良の精度を得ることができた。
論文参考訳（メタデータ） (2023-09-27T16:53:11Z)
Bhasha-Abhijnaanam: Native-script and romanized Language Identification for 22 Indic languages [32.5582250356516]
我々は、インド憲法に記載されている22の言語で、母国語とローマ語の両方で言語識別データセットとモデルを作成します。まず、ネイティブスクリプトの言語識別テストセットであるBhasha-Abhijnaanamと、ロマライズされたテキストを作成する。 IndicLIDもトレーニングしています。ネイティブとローマン化されたスクリプトの両方で、上記のすべての言語用の言語識別子です。
論文参考訳（メタデータ） (2023-05-25T07:53:23Z)
Machine Translation by Projecting Text into the Same Phonetic-Orthographic Space Using a Common Encoding [3.0422770070015295]
本稿では,言語類似性を利用した共通多言語ラテン文字符号化(WX表記法)を提案する。提案手法を類似言語対の実験により検証する。また、遠距離とゼロショットの言語ペアで最大1BLEUポイントの改善も行います。
論文参考訳（メタデータ） (2023-05-21T06:46:33Z)
Prompting Multilingual Large Language Models to Generate Code-Mixed Texts: The Case of South East Asian Languages [47.78634360870564]
東南アジア7言語(SEA)のコードミキシングデータ生成のための多言語モデルの構築について検討する。 BLOOMZのような多言語学習モデルでは、異なる言語からフレーズや節でテキストを生成できないことが判明した。 ChatGPTは、コード混合テキストの生成において矛盾する機能を示しており、そのパフォーマンスはプロンプトテンプレートと言語ペアリングによって異なる。
論文参考訳（メタデータ） (2023-03-23T18:16:30Z)
Challenge Dataset of Cognates and False Friend Pairs from Indian Languages [54.6340870873525]
コニャートは異なる言語で同じテキストの複数の変種に存在する。本稿では,12言語を対象とした2つのコグネートデータセットの作成について述べる。
論文参考訳（メタデータ） (2021-12-17T14:23:43Z)
Harnessing Cross-lingual Features to Improve Cognate Detection for Low-resource Languages [50.82410844837726]
言語間単語埋め込みを用いた14言語間のコニャートの検出を実証する。インドの12言語からなる挑戦的データセットを用いて,コニャート検出手法の評価を行った。我々は,コグネート検出のためのFスコアで最大18%の改善点を観察した。
論文参考訳（メタデータ） (2021-12-16T11:17:58Z)
Read Like Humans: Autonomous, Bidirectional and Iterative Language Modeling for Scene Text Recognition [80.446770909975]
言語知識はシーンのテキスト認識に非常に有益である。エンドツーエンドのディープネットワークで言語規則を効果的にモデル化する方法はまだ研究の課題です。シーンテキスト認識のための自律的双方向反復型ABINetを提案する。
論文参考訳（メタデータ） (2021-03-11T06:47:45Z)
Factorization of Fact-Checks for Low Resource Indian Languages [44.94080515860928]
FactDRILは、インドの地域言語のための最初の大規模多言語ファクトチェックデータセットです。本データセットは英語9,058サンプル,ヒンディー語5,155サンプルからなり,残りの8,222サンプルは様々な地域言語に分布する。このデータセットは貴重なリソースであり、低リソース言語での偽ニュースの拡散と戦う出発点となると期待しています。
論文参考訳（メタデータ） (2021-02-23T16:47:41Z)
Braille to Text Translation for Bengali Language: A Geometric Approach [0.0]
一般人は点字を読めない。だから教師や親類は、学習を手伝うのが難しい。ここでは、これらの触覚アルファベットを画像化し、それらをプレーンテキストに変換する点字 to Text Translatorを提案する。この手法は点字認識において97.25%の精度が得られる。
論文参考訳（メタデータ） (2020-12-02T19:57:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。