論文の概要: Optical Braille Recognition using Circular Hough Transform
- arxiv url: http://arxiv.org/abs/2107.00993v1
- Date: Fri, 2 Jul 2021 12:15:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-05 12:49:14.852220
- Title: Optical Braille Recognition using Circular Hough Transform
- Title(参考訳): 円形ハフ変換を用いた光点字認識
- Authors: Zeba Khanam and Atiya Usmani
- Abstract要約: 本研究の目的は、盲目の学生の個人文書を翻訳することで、学術機関におけるコミュニケーションギャップを強化することである。
ハフ変換に基づくドット検出機構を提案する。
検出されたドットは、距離ベースのクラスタリングアルゴリズムを使用して点字セルにクラスタリングされる。
54点字スクリプトのデータセットに対するこの手法の包括的な評価は、98.71%の精度で行われている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Braille has empowered visually challenged community to read and write. But at
the same time, it has created a gap due to widespread inability of non-Braille
users to understand Braille scripts. This gap has fuelled researchers to
propose Optical Braille Recognition techniques to convert Braille documents to
natural language. The main motivation of this work is to cement the
communication gap at academic institutions by translating personal documents of
blind students. This has been accomplished by proposing an economical and
effective technique which digitizes Braille documents using a smartphone
camera. For any given Braille image, a dot detection mechanism based on Hough
transform is proposed which is invariant to skewness, noise and other
deterrents. The detected dots are then clustered into Braille cells using
distance-based clustering algorithm. In succession, the standard physical
parameters of each Braille cells are estimated for feature extraction and
classification as natural language characters. The comprehensive evaluation of
this technique on the proposed dataset of 54 Braille scripts has yielded into
accuracy of 98.71%.
- Abstract(参考訳): 点字は視覚障害者に読み書きの権限を与えてきた。
しかし同時に、点字以外のユーザーが点字のスクリプトを理解できないことによるギャップも生んでいる。
このギャップにより、研究者は点字文書を自然言語に変換する光学点字認識技術を提案するようになった。
この研究の主な動機は、盲目の学生の個人文書を翻訳することで、学術機関のコミュニケーションギャップを埋めることである。
これはスマートフォンのカメラを使って点字文書をデジタル化する経済的かつ効果的な手法を提案している。
任意の点字画像に対して、スキューネス、ノイズ、その他の抑止に不変なハフ変換に基づくドット検出機構が提案されている。
検出されたドットは、距離ベースのクラスタリングアルゴリズムを使用して点字細胞にクラスタリングされる。
続いて、各点字細胞の標準的な物理パラメータを、特徴抽出と自然言語文字の分類のために推定する。
54点字スクリプトのデータセットに対するこの手法の包括的な評価は、98.71%の精度で行われている。
関連論文リスト
- Vision-Language Models are Strong Noisy Label Detectors [76.07846780815794]
本稿では、視覚言語モデルに適応するためのDeFTと呼ばれるDenoising Fine-Tuningフレームワークを提案する。
DeFTは、何百万もの補助的な画像テキストペアで事前訓練されたテキストと視覚的特徴のロバストなアライメントを利用して、ノイズの多いラベルを抽出する。
7つの合成および実世界のノイズデータセットの実験結果から,ノイズラベル検出と画像分類の両方においてDeFTの有効性が検証された。
論文 参考訳(メタデータ) (2024-09-29T12:55:17Z) - Vision-Braille: An End-to-End Tool for Chinese Braille Image-to-Text Translation [12.027431535689717]
視覚障害者は、読み書きに点字しか使えない大規模なグループである。
点字作家はしばしば音色を省略して空間を節約し、同じ子音と母音の点字が中国語に翻訳されると混乱する。
このプロジェクトは、初めて公開された点字翻訳システムである。
論文 参考訳(メタデータ) (2024-07-08T15:51:37Z) - Open Vocabulary Electroencephalography-To-Text Decoding and Zero-shot
Sentiment Classification [78.120927891455]
最先端のブレイン・トゥ・テキストシステムは、ニューラルネットワークを使用して脳信号から直接言語を復号することに成功した。
本稿では,自然読解課題における語彙的脳波(EEG)-テキスト列列列復号化とゼロショット文感性分類に問題を拡張する。
脳波-テキストデコーディングで40.1%のBLEU-1スコア、ゼロショット脳波に基づく3次感情分類で55.6%のF1スコアを達成し、教師付きベースラインを著しく上回る結果となった。
論文 参考訳(メタデータ) (2021-12-05T21:57:22Z) - Speaker Embedding-aware Neural Diarization for Flexible Number of
Speakers with Textual Information [55.75018546938499]
本稿では,話者埋め込み認識型ニューラルダイアリゼーション(SEND)手法を提案する。
本手法は,ターゲット話者の音声活動検出よりも低いダイアリゼーション誤差率を実現する。
論文 参考訳(メタデータ) (2021-11-28T12:51:04Z) - Skeleton Based Sign Language Recognition Using Whole-body Keypoints [71.97020373520922]
手話は聴覚障害者や言語障害者のコミュニケーションに使用される。
また,RGB-D法と組み合わせて最先端の性能を実現することで,Skeletonに基づく音声認識が普及しつつある。
近年のボディポーズ推定用citejin 2020wholeの開発に触発されて,全身キーポイントと特徴に基づく手話認識を提案する。
論文 参考訳(メタデータ) (2021-03-16T03:38:17Z) - An automated approach to mitigate transcription errors in braille texts
for the Portuguese language [1.0742675209112622]
本稿では、ポルトガル語の点字テキストにおける転写誤りを軽減させる自動アプローチを提案する。
本稿では,その点字表現に基づく単語の最適な対応を提供する辞書と組み合わせた選択関数を提案する。
論文 参考訳(メタデータ) (2021-03-05T20:41:14Z) - Optical Braille Recognition Using Object Detection CNN [0.0]
本稿では,物体検出畳み込みニューラルネットワークを用いて,点字文字全体を同時に検出する光点字認識手法を提案する。
これは、スマートフォンのカメラで撮影されている点字テキストを認識できるようにします。
論文 参考訳(メタデータ) (2020-12-22T23:22:59Z) - Braille to Text Translation for Bengali Language: A Geometric Approach [0.0]
一般人は点字を読めない。だから教師や親類は、学習を手伝うのが難しい。
ここでは、これらの触覚アルファベットを画像化し、それらをプレーンテキストに変換する点字 to Text Translatorを提案する。
この手法は点字認識において97.25%の精度が得られる。
論文 参考訳(メタデータ) (2020-12-02T19:57:29Z) - Near-imperceptible Neural Linguistic Steganography via Self-Adjusting
Arithmetic Coding [88.31226340759892]
本稿では,ニューラルネットワークモデルに基づく自己調整型算術符号を用いた秘密メッセージを符号化する新しい言語ステガノグラフィー手法を提案する。
人間の評価によると、生成されたカバーテキストの51%は、実際に盗聴器を騙すことができる。
論文 参考訳(メタデータ) (2020-10-01T20:40:23Z) - Separating Content from Style Using Adversarial Learning for Recognizing
Text in the Wild [103.51604161298512]
画像中の複数の文字の生成と認識のための逆学習フレームワークを提案する。
我々のフレームワークは、新しい最先端の認識精度を達成するために、最近の認識手法に統合することができる。
論文 参考訳(メタデータ) (2020-01-13T12:41:42Z) - Smart Summarizer for Blind People [0.0]
本稿では,ニュースを重要なキーワードに要約することで,毎回,全文を要約する作業を省くための効率的な手法について述べる。
本稿で扱う他の機能は、要約されたテキストを音声に変換することで、視覚障害者にも役立てることができる。
論文 参考訳(メタデータ) (2020-01-01T20:39:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。