論文の概要: Optical Script Identification for multi-lingual Indic-script
- arxiv url: http://arxiv.org/abs/2308.05780v1
- Date: Thu, 10 Aug 2023 14:02:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-14 15:52:54.464204
- Title: Optical Script Identification for multi-lingual Indic-script
- Title(参考訳): 多言語indic-scriptの光学的文字識別
- Authors: Sidhantha Poddar and Rohan Gupta
- Abstract要約: 本論文の目的は,スクリプト前処理とテキスト認識技術の発展について論じることである。
インドには12の著名なIndicスクリプトがあり、英語とは異なり、これらのスクリプトには様々な特徴がある。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Script identification and text recognition are some of the major domains in
the application of Artificial Intelligence. In this era of digitalization, the
use of digital note-taking has become a common practice. Still, conventional
methods of using pen and paper is a prominent way of writing. This leads to the
classification of scripts based on the method they are obtained. A survey on
the current methodologies and state-of-art methods used for processing and
identification would prove beneficial for researchers. The aim of this article
is to discuss the advancement in the techniques for script pre-processing and
text recognition. In India there are twelve prominent Indic scripts, unlike the
English language, these scripts have layers of characteristics. Complex
characteristics such as similarity in text shape make them difficult to
recognize and analyze, thus this requires advance preprocessing methods for
their accurate recognition. A sincere attempt is made in this survey to provide
a comparison between all algorithms. We hope that this survey would provide
insight to a researcher working not only on Indic scripts but also other
languages.
- Abstract(参考訳): スクリプトの識別とテキスト認識は、人工知能の応用において主要な領域である。
デジタル化の時代には、デジタルノートテイクの使用が一般的になっている。
それでも、従来のペンと紙の使い方は筆記法として顕著である。
これにより、得られたメソッドに基づいてスクリプトの分類が行われる。
処理と識別に用いられる現在の方法論と最先端の手法に関する調査は、研究者にとって有益である。
本論文の目的は,スクリプト前処理とテキスト認識技術の発展について論じることである。
インドには12の著名なIndicスクリプトがあり、英語とは異なり、これらのスクリプトには様々な特徴がある。
テキスト形状の類似性などの複雑な特徴により、認識や解析が困難になるため、正確な認識には事前処理方法が必要である。
この調査では、すべてのアルゴリズムを比較するために、誠実な試みがなされている。
この調査は、Indicスクリプトだけでなく、他の言語にも取り組んでいる研究者に洞察を提供することを期待しています。
関連論文リスト
- Efficiently Leveraging Linguistic Priors for Scene Text Spotting [63.22351047545888]
本稿では,大規模テキストコーパスから言語知識を活用する手法を提案する。
シーンテキストデータセットとよく一致したテキスト分布を生成し、ドメイン内の微調整の必要性を取り除く。
実験結果から,本手法は認識精度を向上するだけでなく,単語のより正確な局所化を可能にすることが示された。
論文 参考訳(メタデータ) (2024-02-27T01:57:09Z) - Chinese Text Recognition with A Pre-Trained CLIP-Like Model Through
Image-IDS Aligning [61.34060587461462]
中国語テキスト認識(CTR)のための2段階フレームワークを提案する。
印刷文字画像とIdeographic Description Sequences (IDS) の整列によるCLIP様モデルの事前学習を行う。
この事前学習段階は、漢字を認識する人間をシミュレートし、各文字の標準表現を得る。
学習された表現はCTRモデルを監督するために使用され、従来の単一文字認識はテキストライン認識に改善される。
論文 参考訳(メタデータ) (2023-09-03T05:33:16Z) - Separate Scene Text Detector for Unseen Scripts is Not All You Need [12.848024214330234]
過去10年間で、いくつかのスクリプトが研究コミュニティの注目を集め、優れた検出性能を達成した。
多くのスクリプトは、ディープラーニングベースのシーンテキスト検出のトレーニングのために低リソースである。
新しいスクリプトの個別のトレーニングが必要か?
本稿では,この問題を認識し,トレーニング中に存在しないスクリプトを検知する手法を提案する。
論文 参考訳(メタデータ) (2023-07-29T14:03:05Z) - DeepSolo++: Let Transformer Decoder with Explicit Points Solo for Multilingual Text Spotting [112.45423990924283]
DeepSolo++は単純なDETRライクなベースラインで、テキスト検出、認識、スクリプト識別を同時に行うために、明示的なポイントを持つ1つのデコーダを単独で使用することができる。
本手法は、英語のシーンだけでなく、複雑なフォント構造と中国語などの1000レベルの文字クラスで書き起こしを習得する。
論文 参考訳(メタデータ) (2023-05-31T15:44:00Z) - CSSL-MHTR: Continual Self-Supervised Learning for Scalable Multi-script Handwritten Text Recognition [16.987008461171065]
我々は,手書き文字認識における破滅的な忘れの問題を軽減するために,連続的な自己指導型学習の可能性を探究する。
提案手法は,各タスクにアダプタと呼ばれる中間層を追加し,現在のタスクを学習しながら,前モデルからの知識を効率的に抽出する。
私たちは英語、イタリア語、ロシア語のスクリプトで最先端のパフォーマンスを達成しましたが、タスクごとにいくつかのパラメータしか追加していません。
論文 参考訳(メタデータ) (2023-03-16T14:27:45Z) - Writer Retrieval and Writer Identification in Greek Papyri [4.44566870214758]
著者識別は、既知の著者の分類であり、著者検索は、画像のデータセットにおける画像の類似性によって、著者を見つけようとする。
自動書き手識別・検索手法はすでに多くの歴史的文書タイプに対して有望な結果を提供しているが,繊維構造や重度アーティファクトのため,パピリデータは非常に困難である。
そこで本研究では,パピリ文字における書き手識別の改善に,優れたバイナライゼーションが重要であることを示す。
論文 参考訳(メタデータ) (2022-12-15T08:42:25Z) - Human-in-the-Loop Disinformation Detection: Stance, Sentiment, or
Something Else? [93.91375268580806]
政治とパンデミックは、機械学習対応の偽ニュース検出アルゴリズムの開発に十分な動機を与えている。
既存の文献は、主に完全自動化されたケースに焦点を当てているが、その結果得られた技術は、軍事応用に必要な様々なトピック、ソース、時間スケールに関する偽情報を確実に検出することはできない。
既に利用可能なアナリストを人間のループとして活用することにより、感情分析、アスペクトベースの感情分析、姿勢検出といった標準的な機械学習技術は、部分的に自動化された偽情報検出システムに使用するためのもっとも有効な方法となる。
論文 参考訳(メタデータ) (2021-11-09T13:30:34Z) - Handwritten Script Identification from Text Lines [38.1188690493442]
テキスト行レベルで手書き文書からスクリプトを識別する頑健な手法を提案する。
チェインコードヒストグラム(CCH)と離散フーリエ変換(DFT)を用いて抽出した特徴に基づく。
提案手法は、グジャラート、カンナダ、マラヤラム、オリヤ、タミル、テルグ、ウルドゥーの7文字で書かれた800行の手書きのテキストに対して、ローマ文字とともに実験されている。
論文 参考訳(メタデータ) (2020-09-16T02:43:24Z) - Screenplay Quality Assessment: Can We Predict Who Gets Nominated? [53.9153892362629]
本稿では,言語的手がかりに基づく脚本の品質評価手法を提案する。
産業の意見やナラトロジーに基づいて、ドメイン固有の特徴を共通分類技法に抽出し、統合する。
論文 参考訳(メタデータ) (2020-05-13T02:39:56Z) - TextScanner: Reading Characters in Order for Robust Scene Text
Recognition [60.04267660533966]
TextScannerはシーンテキスト認識の代替手法である。
文字クラス、位置、順序に対する画素単位のマルチチャネルセグメンテーションマップを生成する。
また、コンテキストモデリングにRNNを採用し、文字の位置とクラスを並列で予測する。
論文 参考訳(メタデータ) (2019-12-28T07:52:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。