論文の概要: A complete character recognition and transliteration technique for
Devanagari script
- arxiv url: http://arxiv.org/abs/2009.13460v1
- Date: Mon, 28 Sep 2020 16:43:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-13 22:17:01.353974
- Title: A complete character recognition and transliteration technique for
Devanagari script
- Title(参考訳): デヴァナガリ文字の完全文字認識と書き起こし技術
- Authors: Jasmine Kaur and Vinay Kumar
- Abstract要約: 本稿では,文字認識を用いたデバナガリ文字の自動翻訳手法を提案する。
構成文字を分離するための最初のタスクの1つはセグメンテーションである。
デヴァナガリ文字は対応するローマ字にマッピングされ、その結果のローマ字は原文字と類似の発音を持つ。
- 参考スコア(独自算出の注目度): 12.208787849155048
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Transliteration involves transformation of one script to another based on
phonetic similarities between the characters of two distinctive scripts. In
this paper, we present a novel technique for automatic transliteration of
Devanagari script using character recognition. One of the first tasks performed
to isolate the constituent characters is segmentation. Line segmentation
methodology in this manuscript discusses the case of overlapping lines.
Character segmentation algorithm is designed to segment conjuncts and separate
shadow characters. Presented shadow character segmentation scheme employs
connected component method to isolate the character, keeping the constituent
characters intact. Statistical features namely different order moments like
area, variance, skewness and kurtosis along with structural features of
characters are employed in two phase recognition process. After recognition,
constituent Devanagari characters are mapped to corresponding roman alphabets
in way that resulting roman alphabets have similar pronunciation to source
characters.
- Abstract(参考訳): 書き起こしは、2つの固有のスクリプトの文字間の音韻的類似性に基づいて、あるスクリプトを別のスクリプトに変換する。
本稿では,文字認識を用いたデヴァナガリ文字の自動書き起こし手法を提案する。
構成文字を分離するための最初のタスクの1つはセグメンテーションである。
本書の行分割手法は重なり合う行の場合について論じる。
文字分割アルゴリズムは、結束と別々の影文字を分割するように設計されている。
シャドウキャラクタのセグメンテーションスキームは連結成分法を用いてキャラクタを分離し、構成キャラクタをそのまま保持する。
2つの位相認識プロセスでは, 領域, ばらつき, 歪度, クルトシスなどの統計的特徴, 文字の構造的特徴が用いられる。
認識された後、デヴァナガリ文字は対応するローマ字にマッピングされ、その結果のローマ字は原文字と類似の発音を持つ。
関連論文リスト
- CHIRON: Rich Character Representations in Long-Form Narratives [98.273323001781]
文字のテキスト情報を整理・フィルタリングする新しい文字シートの表現であるCHIRONを提案する。
実験の結果,CHIRONは類似の要約に基づくベースラインよりも優れ,柔軟であることが判明した。
CHIRONから派生したメトリクスは、ストーリーのキャラクター中心性を自動的に推測するために使用することができ、これらのメトリクスは人間の判断と一致している。
論文 参考訳(メタデータ) (2024-06-14T17:23:57Z) - Structural analysis of Hindi online handwritten characters for character
recognition [0.0]
オンラインストロークの方向特性は、同種領域やサブストロークの観点から解析するために用いられる。
これらの性質と幾何はヒンディー語のオンライン手書き文字からサブユニットを抽出するために用いられる。
点ストローク、時計回りのカーブストローク、反時計回りのカーブストローク、ループストロークセグメントをサブユニットとして抽出する手法を開発した。
論文 参考訳(メタデータ) (2023-10-12T11:14:27Z) - Character Queries: A Transformer-based Approach to On-Line Handwritten
Character Segmentation [4.128716153761773]
本稿では,文字分割が代入問題となる場合に,事前に書き起こしが知られているシナリオに焦点を当てる。
k$-meansクラスタリングアルゴリズムにヒントを得て、クラスタ割り当ての観点から見た上で、Transformerベースのアーキテクチャを提示する。
提案手法の質を評価するために,2つの有名なオンライン手書きデータセットに対して,文字分割基底真理を生成する。
論文 参考訳(メタデータ) (2023-09-06T15:19:04Z) - Siamese based Neural Network for Offline Writer Identification on word
level data [7.747239584541488]
入力語画像に基づいて文書の著者を特定する新しい手法を提案する。
本手法はテキスト独立であり,入力画像のサイズに制約を課さない。
論文 参考訳(メタデータ) (2022-11-17T10:01:46Z) - Getting the Most out of Simile Recognition [48.5838790615549]
Simile認識には2つのサブタスクがある: 文がsimileを含むかどうかを識別するsimile文分類と、対応するオブジェクトを特定するsimileコンポーネント抽出である。
最近の研究は表面弦以外の特徴を無視している。
1)POSタグ,依存性木,単語定義を含む入力側機能,2)デコード決定の相互依存性をキャプチャするデコード機能,の2つの特徴について検討する。
論文 参考訳(メタデータ) (2022-11-11T03:22:45Z) - CDistNet: Perceiving Multi-Domain Character Distance for Robust Text
Recognition [87.3894423816705]
本稿では,MDCDP (Multi-Domain Character Distance Perception) と呼ばれる新しいモジュールを提案する。
MDCDPは位置埋め込みを使用して、クロスアテンションメカニズムに従って視覚的特徴と意味的特徴の両方を問合せする。
我々は、複数のMDCDPを積み重ねたCDistNetを開発し、徐々に正確な距離モデリングをガイドする。
論文 参考訳(メタデータ) (2021-11-22T06:27:29Z) - I2C2W: Image-to-Character-to-Word Transformers for Accurate Scene Text
Recognition [68.95544645458882]
本稿では,シーンの様々なノイズに対して正確かつ耐性のある新しいシーンテキスト認識装置I2C2Wについて述べる。
i2c2wはイメージ・ツー・キャラクタモジュール(i2c)と文字・ワードモジュール(c2w)から構成される。
論文 参考訳(メタデータ) (2021-05-18T09:20:58Z) - 2kenize: Tying Subword Sequences for Chinese Script Conversion [54.33749520569979]
本稿では,2つのスクリプト間のマッピングと変換をあいまいにできるモデルを提案する。
提案手法は,従来の漢字変換手法よりも精度が6ポイント向上した。
論文 参考訳(メタデータ) (2020-05-07T10:53:05Z) - Neural Computing for Online Arabic Handwriting Character Recognition
using Hard Stroke Features Mining [0.0]
オンラインアラビア文字認識における書字ストローク特徴の垂直方向と水平方向から所望の臨界点を検出する方法を提案する。
バックプロパゲーション学習アルゴリズムと修正シグモイド関数に基づくアクティベーション関数を備えた多層パーセプトロンを用いて、文字の分類のためにこれらのトークンから最小の特徴セットを抽出する。
提案手法は,文字認識技術に匹敵する98.6%の平均精度を実現する。
論文 参考訳(メタデータ) (2020-05-02T23:17:08Z) - A Skip-connected Multi-column Network for Isolated Handwritten Bangla
Character and Digit recognition [12.551285203114723]
マルチスケールマルチカラムスキップ畳み込みニューラルネットワークを用いた非明示的特徴抽出手法を提案する。
本手法は,手書き文字と数字の4つの公開データセットを用いて評価する。
論文 参考訳(メタデータ) (2020-04-27T13:18:58Z) - TextScanner: Reading Characters in Order for Robust Scene Text
Recognition [60.04267660533966]
TextScannerはシーンテキスト認識の代替手法である。
文字クラス、位置、順序に対する画素単位のマルチチャネルセグメンテーションマップを生成する。
また、コンテキストモデリングにRNNを採用し、文字の位置とクラスを並列で予測する。
論文 参考訳(メタデータ) (2019-12-28T07:52:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。