論文の概要: Use of Metric Learning for the Recognition of Handwritten Digits, and its Application to Increase the Outreach of Voice-based Communication Platforms
- arxiv url: http://arxiv.org/abs/2504.18948v1
- Date: Sat, 26 Apr 2025 15:14:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:54.058595
- Title: Use of Metric Learning for the Recognition of Handwritten Digits, and its Application to Increase the Outreach of Voice-based Communication Platforms
- Title(参考訳): 手書きディジット認識におけるメトリックラーニングの利用とその音声通信プラットフォームへの活用
- Authors: Devesh Pant, Dibyendu Talukder, Deepak Kumar, Rachit Pandey, Aaditeshwar Seth, Chetan Arora,
- Abstract要約: 紙ベースのデータ収集は、いくつかの文脈でより適切であると議論されている。
我々は、手書き桁の大規模なデータセットと、このデータを用いて構築されたディープラーニングベースのモデルと方法を提供する。
インド北部における母子保健意識プロジェクトにおけるこれらのツールの展開を実演する。
- 参考スコア(独自算出の注目度): 5.316686791692299
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Initiation, monitoring, and evaluation of development programmes can involve field-based data collection about project activities. This data collection through digital devices may not always be feasible though, for reasons such as unaffordability of smartphones and tablets by field-based cadre, or shortfalls in their training and capacity building. Paper-based data collection has been argued to be more appropriate in several contexts, with automated digitization of the paper forms through OCR (Optical Character Recognition) and OMR (Optical Mark Recognition) techniques. We contribute with providing a large dataset of handwritten digits, and deep learning based models and methods built using this data, that are effective in real-world environments. We demonstrate the deployment of these tools in the context of a maternal and child health and nutrition awareness project, which uses IVR (Interactive Voice Response) systems to provide awareness information to rural women SHG (Self Help Group) members in north India. Paper forms were used to collect phone numbers of the SHG members at scale, which were digitized using the OCR tools developed by us, and used to push almost 4 million phone calls. The data, model, and code have been released in the open-source domain.
- Abstract(参考訳): 開発プログラムの開始、監視、評価には、プロジェクト活動に関するフィールドベースのデータ収集が含まれる。
しかし、このデジタルデバイスによるデータ収集は、フィールドベースのケイデントによるスマートフォンやタブレットの不調や、トレーニングやキャパシティビルディングの不足など、必ずしも実現不可能であるとは限らない。
紙ベースのデータ収集は、OCR(Optical Character Recognition)とOMR(Optical Mark Recognition)技術による紙フォームの自動デジタル化により、いくつかの文脈でより適切であると議論されている。
実環境において有効な,手書き桁の大規模なデータセットと,このデータを用いて構築されたディープラーニングベースのモデルと手法の提供に貢献する。
インド北部の農村女性SHG(Self Help Group)のメンバーに、IVR(Interactive Voice Response)システムを用いて、これらのツールの展開を実演する。
紙紙はSHGメンバーの電話番号を大規模に収集するために用いられ、それは私たちが開発したOCRツールを使ってデジタル化され、400万近い電話をプッシュするのに使われました。
データ、モデル、コードはオープンソースドメインでリリースされている。
関連論文リスト
- Handwritten Digit Recognition: An Ensemble-Based Approach for Superior Performance [9.174021241188143]
本稿では,CNN(Convolutional Neural Networks)と従来の機械学習技術を組み合わせて,認識精度と堅牢性を向上させるアンサンブルに基づくアプローチを提案する。
我々は,70,000個の手書き桁画像からなるMNISTデータセットを用いて本手法の評価を行った。
特徴抽出にCNNを,分類にSVM(Support Vector Machines)を併用したハイブリッドモデルは,99.30%の精度を実現する。
論文 参考訳(メタデータ) (2025-03-08T07:09:49Z) - TelegramScrap: A comprehensive tool for scraping Telegram data [0.0]
TelegramScrapは、Telegramチャンネルやグループからデータを抽出して分析するツールである。
このホワイトペーパーは、学術・科学研究におけるツールの開発、能力、応用について概説する。
論文 参考訳(メタデータ) (2024-12-21T21:46:56Z) - Deep Neural Network-Based Sign Language Recognition: A Comprehensive Approach Using Transfer Learning with Explainability [0.0]
我々は、ディープニューラルネットワークを使って手話認識を完全に自動化する新しいソリューションを提案する。
この手法は、高度な前処理方法論を統合し、全体的なパフォーマンスを最適化する。
SHAP (SHapley Additive exPlanations) 法を用いて, 情報的明瞭度の提供能力を評価した。
論文 参考訳(メタデータ) (2024-09-11T17:17:44Z) - Unsupervised Sentiment Analysis of Plastic Surgery Social Media Posts [91.3755431537592]
ソーシャルメディアプラットフォームにまたがる膨大なユーザー投稿は、主に人工知能(AI)のユースケースに使われていない。
自然言語処理(NLP)は、コーパス(corpora)として知られるドキュメントの体系を利用して、人間のような言語理解でコンピュータを訓練するAIのサブフィールドである。
本研究は, 教師なし解析の応用により, コンピュータがプラスティック手術に対する否定的, 肯定的, 中立的なユーザ感情を予測できることを示した。
論文 参考訳(メタデータ) (2023-07-05T20:16:20Z) - MyDigitalFootprint: an extensive context dataset for pervasive computing
applications at the edge [7.310043452300736]
MyDigitalFootprintは、スマートフォンセンサーデータ、物理的な近接情報、オンラインソーシャルネットワークのインタラクションを含む大規模なデータセットである。
自然環境における31人のボランティアユーザーによる2ヶ月の計測で、制限なしの行動を可能にする。
データセットの有効性を示すために,各種機械学習タスクを利用したコンテキスト認識3つのアプリケーションを提案する。
論文 参考訳(メタデータ) (2023-06-28T07:59:47Z) - Robotic Skill Acquisition via Instruction Augmentation with
Vision-Language Models [70.82705830137708]
言語条件制御のためのデータ駆動型インストラクション拡張(DIAL)について紹介する。
我々は,CLIPのセマンティック理解を利用したセミ言語ラベルを用いて,未知の実演データの大規模なデータセットに知識を伝達する。
DIALは、模倣学習ポリシーによって、新しい能力を獲得し、元のデータセットにない60の新しい命令を一般化することができる。
論文 参考訳(メタデータ) (2022-11-21T18:56:00Z) - Semantic Segmentation of Vegetation in Remote Sensing Imagery Using Deep
Learning [77.34726150561087]
本稿では,公開されているリモートセンシングデータからなるマルチモーダル・大規模時間データセットを作成するためのアプローチを提案する。
我々は、異なる種類の植生を分離できる畳み込みニューラルネットワーク(CNN)モデルを使用する。
論文 参考訳(メタデータ) (2022-09-28T18:51:59Z) - Lexically Aware Semi-Supervised Learning for OCR Post-Correction [90.54336622024299]
世界中の多くの言語における既存の言語データの多くは、非デジタル化された書籍や文書に閉じ込められている。
従来の研究は、あまり良くない言語を認識するためのニューラル・ポスト・コレクション法の有用性を実証してきた。
そこで本研究では,生画像を利用した半教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2021-11-04T04:39:02Z) - Handwritten Digit Recognition using Machine and Deep Learning Algorithms [0.0]
我々は,MNISTデータセットを用いて,Support Vector Machines (SVM), Multi-Layer Perceptron (MLP), Convolution Neural Network (CNN)モデルを用いて手書き桁認識を行った。
我々の主な目的は、上述したモデルの精度と実行時間を比較して、桁認識に最適なモデルを得ることである。
論文 参考訳(メタデータ) (2021-06-23T18:23:01Z) - Reinforced Iterative Knowledge Distillation for Cross-Lingual Named
Entity Recognition [54.92161571089808]
言語間NERは、知識をリッチリソース言語から低リソース言語に転送する。
既存の言語間NERメソッドは、ターゲット言語でリッチなラベル付けされていないデータをうまく利用しない。
半教師付き学習と強化学習のアイデアに基づく新しいアプローチを開発する。
論文 参考訳(メタデータ) (2021-06-01T05:46:22Z) - FedOCR: Communication-Efficient Federated Learning for Scene Text
Recognition [76.26472513160425]
本研究では、分散化されたデータセットを用いて、ロバストなシーンテキスト認識器を訓練する方法について研究する。
FedOCRをエンドデバイスにデプロイするのに適したものにするために、軽量モデルとハッシュ技術の使用を含む2つの改善を行った。
論文 参考訳(メタデータ) (2020-07-22T14:30:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。