論文の概要: Banknote Recognition for Visually Impaired People (Case of Ethiopian
note)
- arxiv url: http://arxiv.org/abs/2209.03236v1
- Date: Thu, 25 Aug 2022 19:46:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-11 13:07:38.939412
- Title: Banknote Recognition for Visually Impaired People (Case of Ethiopian
note)
- Title(参考訳): 視覚障害者に対する紙幣認識(エチオピア紙幣の場合)
- Authors: Nuredin Ali Abdelkadir
- Abstract要約: 我々は、データセットで98.9%の分類精度を達成したモデルで、AndroidとIOS互換のモバイルアプリを開発した。
このアプリケーションは、エチオピアの作業言語であるアムハラ語でスキャンされた通貨の種類を示す音声統合機能を備えている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Currency is used almost everywhere to facilitate business. In most developing
countries, especially the ones in Africa, tangible notes are predominantly used
in everyday financial transactions. One of these countries, Ethiopia, is
believed to have one of the world highest rates of blindness (1.6%) and low
vision (3.7%). There are around 4 million visually impaired people; With 1.7
million people being in complete vision loss. Those people face a number of
challenges when they are in a bus station, in shopping centers, or anywhere
which requires the physical exchange of money. In this paper, we try to provide
a solution to this issue using AI/ML applications. We developed an Android and
IOS compatible mobile application with a model that achieved 98.9%
classification accuracy on our dataset. The application has a voice integrated
feature that tells the type of the scanned currency in Amharic, the working
language of Ethiopia. The application is developed to be easily accessible by
its users. It is build to reduce the burden of visually impaired people in
Ethiopia.
- Abstract(参考訳): 通貨は至る所でビジネスに利用されている。
ほとんどの発展途上国、特にアフリカの国々では、有形紙幣は日常的な金融取引で主に使われている。
これらの国の1つであるエチオピアは、世界最高視力(1.6%)と低視力(3.7%)の1つであると考えられている。
視覚障害者は約400万人で、170万人が視力喪失に陥っている。
これらの人々は、バス停やショッピングセンターにいるとき、あるいはお金の物理的交換を必要とする場所にいるとき、多くの課題に直面します。
本稿では,AI/MLアプリケーションを用いてこの問題に対する解決策を提供する。
我々は、データセットで98.9%の分類精度を達成したモデルで、AndroidとIOS互換のモバイルアプリを開発した。
このアプリケーションには、エチオピアの作業言語であるamharicでスキャンされた通貨の種類を示す音声統合機能がある。
アプリケーションはユーザが簡単にアクセスできるように開発されている。
エチオピアの視覚障害者の負担を軽減するために建設された。
関連論文リスト
- Money Recognition for the Visually Impaired: A Case Study on Sri Lankan Banknotes [0.0]
本研究では,スリランカ通貨紙幣の識別にユーザフレンドリーなスタンドアローンシステムを提案する。
スリランカの通貨紙幣の画像のカスタム作成データセットは、EfficientDetモデルを微調整するために使用された。
このモデルは検証データセットで0.9847 APを達成し、現実世界のシナリオでは極めてよく機能した。
論文 参考訳(メタデータ) (2025-02-20T05:07:46Z) - Real-time Yemeni Currency Detection [0.49109372384514843]
銀行券の認識は、視覚障害者が直面する大きな問題である。
本稿では,視覚障害者のためのリアルタイムイエメン通貨検出システムを提案する。
論文 参考訳(メタデータ) (2024-06-18T19:57:15Z) - Improve accessibility for Low Vision and Blind people using Machine Learning and Computer Vision [0.0]
このプロジェクトでは、視覚障害者のアクセシビリティ向上に機械学習とコンピュータビジョンを活用する方法について検討する。
このプロジェクトでは、視覚障害者が音声や触覚のフィードバックを受信することで、空間内でのオリエントを支援するモバイルアプリケーションの構築に集中する。
論文 参考訳(メタデータ) (2024-03-24T21:19:17Z) - The All-Seeing Project: Towards Panoptic Visual Recognition and
Understanding of the Open World [71.52132776748628]
オープンな世界のすべてを認識、理解するための大規模データとモデルであるAll-Seeing (AS)プロジェクトを紹介します。
我々は10億以上の領域に意味タグ、質問応答ペア、詳細なキャプションを付加した新しいデータセット(AS-1B)を作成します。
視覚認識と理解のための統合フレームワークであるAll-Seeing Model (ASM) を開発した。
論文 参考訳(メタデータ) (2023-08-03T17:59:47Z) - Do All Languages Cost the Same? Tokenization in the Era of Commercial
Language Models [68.29126169579132]
APIベンダは、使用量に基づいてユーザを課金する。具体的には、基盤となる言語モデルによって処理されたトークンの数や生成されるトークンの数に基づいて。
しかし、トークンを構成するのは、異なる言語で同じ情報を伝達するのに必要なトークンの数に大きなばらつきに依存するトレーニングデータとモデルである。
我々は, OpenAI の言語モデル API のコストと有用性について,22言語で多言語ベンチマークを行った。
論文 参考訳(メタデータ) (2023-05-23T05:46:45Z) - AfriSenti: A Twitter Sentiment Analysis Benchmark for African Languages [45.88640066767242]
アフリカには6以上の言語族から2000以上の言語があり、全大陸で最高の言語多様性がある。
しかし、アフリカ語で実施されているNLP研究はほとんどない。そのような研究を可能にする上で重要なのは、高品質な注釈付きデータセットが利用可能であることだ。
本稿では,14のアフリカ語で110,000以上のツイートを含む感情分析ベンチマークであるAfriSentiを紹介する。
論文 参考訳(メタデータ) (2023-02-17T15:40:12Z) - Complex Daily Activities, Country-Level Diversity, and Smartphone
Sensing: A Study in Denmark, Italy, Mongolia, Paraguay, and UK [6.52702503779308]
スマートフォンは、人々の日常生活を支援するために、行動認識による人間の行動を理解することができる。
人々は、リモート/ハイブリッドワーク/スタディ設定の頻度で、ポストパンデミックな世界でより鎮静的です。
5か国637人の大学生のスマートフォンデータと216万件の自己申告データを分析した。
論文 参考訳(メタデータ) (2023-02-16T21:34:55Z) - Comprehensive Benchmark Datasets for Amharic Scene Text Detection and
Recognition [56.048783994698425]
Ethiopic/Amharicスクリプトはアフリカ最古の書記システムの一つで、東アフリカで少なくとも23の言語に対応している。
アムハラ語の表記体系である Abugida は282音節、15句の句読点、20の数字を持つ。
HUST-ART, HUST-AST, ABE, Tana という,自然界におけるアムハラ文字の検出と認識のための総合的な公開データセットを提示した。
論文 参考訳(メタデータ) (2022-03-23T03:19:35Z) - Phoneme Recognition through Fine Tuning of Phonetic Representations: a
Case Study on Luhya Language Varieties [77.2347265289855]
音韻アノテーションに基づく多言語認識手法であるAllosaurus を用いた音素認識に焦点を当てた。
挑戦的な実世界シナリオで評価するために,我々は,ケニア西部とウガンダ東部のluhya言語クラスタの2つの種類であるbukusuとsaamiaの音声認識データセットをキュレートした。
私たちは、アロサウルスの微調整がわずか100発話であっても、電話のエラー率を大幅に改善することが分かりました。
論文 参考訳(メタデータ) (2021-04-04T15:07:55Z) - Skeleton Based Sign Language Recognition Using Whole-body Keypoints [71.97020373520922]
手話は聴覚障害者や言語障害者のコミュニケーションに使用される。
また,RGB-D法と組み合わせて最先端の性能を実現することで,Skeletonに基づく音声認識が普及しつつある。
近年のボディポーズ推定用citejin 2020wholeの開発に触発されて,全身キーポイントと特徴に基づく手話認識を提案する。
論文 参考訳(メタデータ) (2021-03-16T03:38:17Z) - Unblind Your Apps: Predicting Natural-Language Labels for Mobile GUI
Components by Deep Learning [21.56849865328527]
10,408のAndroidアプリの分析によると、77%以上のアプリがラベルを欠落している。
画像ベースボタンのラベルを自動的に予測するディープラーニングベースモデルであるLabelDroidを開発した。
実験の結果,我々のモデルでは正確な予測が可能であり,生成したラベルは実際のAndroid開発者よりも高品質であることがわかった。
論文 参考訳(メタデータ) (2020-03-01T02:31:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。