論文の概要: An automated approach to mitigate transcription errors in braille texts
for the Portuguese language
- arxiv url: http://arxiv.org/abs/2103.03935v1
- Date: Fri, 5 Mar 2021 20:41:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-09 15:43:06.344704
- Title: An automated approach to mitigate transcription errors in braille texts
for the Portuguese language
- Title(参考訳): ポルトガル語の点字テキストにおける転写誤りを軽減させる自動的アプローチ
- Authors: Andr\'e Roberto Ortoncelli and Marlon Marcon and Franciele Beal
- Abstract要約: 本稿では、ポルトガル語の点字テキストにおける転写誤りを軽減させる自動アプローチを提案する。
本稿では,その点字表現に基づく単語の最適な対応を提供する辞書と組み合わせた選択関数を提案する。
- 参考スコア(独自算出の注目度): 1.0742675209112622
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The quota system in Brazil made it possible to include blind students in
higher education. Teachers' lack of knowledge about the braille system can
represent a barrier between them and students who use it for writing and
reading. Computer-vision-based transcription solutions represent mechanisms for
reducing understanding restrictions on this system. However, such tools face
nuisances inherent to image processing systems, e.g., illumination, noise, and
scale, harming the result. This paper presents an automated approach to
mitigate transcription errors in braille texts for the Portuguese language. We
propose a selection function, combined with dictionaries, that provides the
best correspondence of words based on their braille representation. We
validated our proposal on a dataset of synthetic images by submitting them to
different noise levels and testing the proposal's robustness. Experimental
results confirm the effectiveness of the solution compared to a standard
approach. As a contribution of this paper, we expect to provide a method to
support robust and adaptable solutions to real use conditions.
- Abstract(参考訳): ブラジルのクォータ制度は、高等教育に盲目の学生を含めることを可能にした。
点字システムに関する教師の知識の欠如は、それらとそれを読み書きに使う学生の間の障壁を表している。
コンピュータビジョンベースの転写ソリューションは、このシステムの理解制限を減らすメカニズムを表す。
しかし、このようなツールは、照明、ノイズ、スケールなどの画像処理システム固有の迷惑に直面し、その結果を害します。
本稿では、ポルトガル語の点字テキストにおける転写誤りを軽減させる自動アプローチを提案する。
本稿では,その点字表現に基づく単語の最適な対応を提供する辞書と組み合わせた選択関数を提案する。
提案手法を合成画像のデータセット上で検証し, 異なる雑音レベルに適用し, 提案手法の頑健性を検証する。
実験の結果, 標準手法と比較し, 溶液の有効性を確認した。
本論文のコントリビューションとして,実使用条件に対する堅牢かつ適応可能なソリューションをサポートする方法を提供することが期待されます。
関連論文リスト
- Vision-Language Models are Strong Noisy Label Detectors [76.07846780815794]
本稿では、視覚言語モデルに適応するためのDeFTと呼ばれるDenoising Fine-Tuningフレームワークを提案する。
DeFTは、何百万もの補助的な画像テキストペアで事前訓練されたテキストと視覚的特徴のロバストなアライメントを利用して、ノイズの多いラベルを抽出する。
7つの合成および実世界のノイズデータセットの実験結果から,ノイズラベル検出と画像分類の両方においてDeFTの有効性が検証された。
論文 参考訳(メタデータ) (2024-09-29T12:55:17Z) - Vision-Braille: An End-to-End Tool for Chinese Braille Image-to-Text Translation [12.027431535689717]
視覚障害者は、読み書きに点字しか使えない大規模なグループである。
点字作家はしばしば音色を省略して空間を節約し、同じ子音と母音の点字が中国語に翻訳されると混乱する。
このプロジェクトは、初めて公開された点字翻訳システムである。
論文 参考訳(メタデータ) (2024-07-08T15:51:37Z) - Provably Secure Disambiguating Neural Linguistic Steganography [66.30965740387047]
サブワードに基づく言語モデルを使用する際に生じるセグメンテーションの曖昧さ問題は、時にはデコード障害を引き起こす。
そこで我々はSyncPoolという,セグメンテーションのあいまいさ問題に効果的に対処する,セキュアな曖昧さ回避手法を提案する。
SyncPoolは、候補プールのサイズやトークンの分布を変えないため、確実に安全な言語ステガノグラフィー手法に適用できる。
論文 参考訳(メタデータ) (2024-03-26T09:25:57Z) - DenoSent: A Denoising Objective for Self-Supervised Sentence
Representation Learning [59.4644086610381]
本稿では,他の視点,すなわち文内視点から継承する新たな認知的目的を提案する。
離散ノイズと連続ノイズの両方を導入することで、ノイズの多い文を生成し、モデルを元の形式に復元するように訓練する。
我々の経験的評価は,本手法が意味的テキスト類似性(STS)と幅広い伝達タスクの両面で競合する結果をもたらすことを示した。
論文 参考訳(メタデータ) (2024-01-24T17:48:45Z) - Text as Image: Learning Transferable Adapter for Multi-Label
Classification [13.11583340598517]
マルチラベル命令追従テキスト生成に大規模言語モデルを用いるための効果的なアプローチを提案する。
このように、ビジュアルラベル認識のための完全に自動化されたパイプラインは、手動のデータに頼ることなく開発される。
論文 参考訳(メタデータ) (2023-12-07T09:22:20Z) - Looking and Listening: Audio Guided Text Recognition [62.98768236858089]
野生におけるテキスト認識は、コンピュータビジョンにおける長年の問題である。
近年の研究では、視覚と言語処理がシーンテキスト認識に有効であることが示唆されている。
しかし、既存のアプローチでは、追加、削除、置換といった編集エラーの解決が依然として大きな課題である。
本稿では,メルスペクトル列予測のためのシンプルで効果的な確率的オーディオデコーダであるAudioOCRを提案する。
論文 参考訳(メタデータ) (2023-06-06T08:08:18Z) - Lexically Aware Semi-Supervised Learning for OCR Post-Correction [90.54336622024299]
世界中の多くの言語における既存の言語データの多くは、非デジタル化された書籍や文書に閉じ込められている。
従来の研究は、あまり良くない言語を認識するためのニューラル・ポスト・コレクション法の有用性を実証してきた。
そこで本研究では,生画像を利用した半教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2021-11-04T04:39:02Z) - Optical Braille Recognition using Circular Hough Transform [0.0]
本研究の目的は、盲目の学生の個人文書を翻訳することで、学術機関におけるコミュニケーションギャップを強化することである。
ハフ変換に基づくドット検出機構を提案する。
検出されたドットは、距離ベースのクラスタリングアルゴリズムを使用して点字セルにクラスタリングされる。
54点字スクリプトのデータセットに対するこの手法の包括的な評価は、98.71%の精度で行われている。
論文 参考訳(メタデータ) (2021-07-02T12:15:24Z) - Optical Braille Recognition Using Object Detection CNN [0.0]
本稿では,物体検出畳み込みニューラルネットワークを用いて,点字文字全体を同時に検出する光点字認識手法を提案する。
これは、スマートフォンのカメラで撮影されている点字テキストを認識できるようにします。
論文 参考訳(メタデータ) (2020-12-22T23:22:59Z) - Braille to Text Translation for Bengali Language: A Geometric Approach [0.0]
一般人は点字を読めない。だから教師や親類は、学習を手伝うのが難しい。
ここでは、これらの触覚アルファベットを画像化し、それらをプレーンテキストに変換する点字 to Text Translatorを提案する。
この手法は点字認識において97.25%の精度が得られる。
論文 参考訳(メタデータ) (2020-12-02T19:57:29Z) - Self-Supervised Representations Improve End-to-End Speech Translation [57.641761472372814]
自己教師付き事前学習機能により,翻訳性能が一貫的に向上することを示す。
言語間の変換は、チューニングの必要なく、あるいはほとんどチューニングすることなく、さまざまな言語に拡張することができる。
論文 参考訳(メタデータ) (2020-06-22T10:28:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。