論文の概要: Off-Line Arabic Handwritten Words Segmentation using Morphological
Operators
- arxiv url: http://arxiv.org/abs/2101.02797v1
- Date: Thu, 7 Jan 2021 23:38:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-10 14:14:29.099577
- Title: Off-Line Arabic Handwritten Words Segmentation using Morphological
Operators
- Title(参考訳): 形態的演算子を用いたオフラインアラビア語手書き単語セグメンテーション
- Authors: Nisreen AbdAllah and Serestina Viriri
- Abstract要約: このフレームワークは、前処理、セグメンテーション、評価の3つのステップに基づいて提案される。
提案モデルは、関連作品と比較して最高精度を達成しました。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The main aim of this study is the assessment and discussion of a model for
hand-written Arabic through segmentation. The framework is proposed based on
three steps: pre-processing, segmentation, and evaluation. In the
pre-processing step, morphological operators are applied for Connecting Gaps
(CGs) in written words. Gaps happen when pen lifting-off during writing,
scanning documents, or while converting images to binary type. In the
segmentation step, first removed the small diacritics then bounded a connected
component to segment offline words. Huge data was utilized in the proposed
model for applying a variety of handwriting styles so that to be more
compatible with real-life applications. Consequently, on the automatic
evaluation stage, selected randomly 1,131 images from the IESK-ArDB database,
and then segmented into sub-words. After small gaps been connected, the model
performance evaluation had been reached 88% against the standard ground truth
of the database. The proposed model achieved the highest accuracy when compared
with the related works.
- Abstract(参考訳): 本研究の主な目的は,手書きアラビア語のセグメンテーションによるモデルの評価と議論である。
このフレームワークは、前処理、セグメンテーション、評価の3つのステップに基づいて提案されている。
前処理のステップでは、形態論的演算子を記述された単語で接続ギャップ(CG)に適用する。
ギャップは、書き込みやドキュメントのスキャン、あるいはイメージをバイナリタイプに変換するときに発生する。
セグメンテーションのステップでは、まず小さなダイアクリティカルを取り除き、接続されたコンポーネントに境界を付けてオフラインの単語をセグメンテーションする。
提案モデルでは, 様々な手書きスタイルを適用し, 実際のアプリケーションとの互換性を高めるために, 膨大なデータを利用した。
その結果,IESK-ArDBデータベースからランダムに1,131個の画像を選択し,サブワードに分割する。
小さなギャップが接続された後、モデルの性能評価はデータベースの標準的真実に対して88%に達した。
提案手法は, 関連作品と比較して高い精度を達成した。
関連論文リスト
- An End-to-End, Segmentation-Free, Arabic Handwritten Recognition Model on KHATT [0.0]
スクラッチから学習したエンドツーエンドのセグメンテーションフリーのディープラーニングモデルを提案する。
トレーニングフェーズでは、文字レベルでのテストデータセットでの認識率が84%、単語レベルでは71%と顕著な結果が得られる。
論文 参考訳(メタデータ) (2024-06-21T17:42:07Z) - SEGIC: Unleashing the Emergent Correspondence for In-Context Segmentation [87.18373801829314]
In-context segmentationは、"in-context example"と呼ばれるいくつかのラベル付きサンプルイメージを使用して、新しいイメージをセグメント化することを目的としている。
単一ビジョン基盤モデル(VFM)に基づくエンドツーエンドのセグメンテーション・イン・コンテクストフレームワークSEGICを提案する。
SEGICは、ワンショットセグメンテーションベンチマークで最先端のパフォーマンスをもたらす、単純だが効果的なアプローチである。
論文 参考訳(メタデータ) (2023-11-24T18:59:42Z) - Linguistically Motivated Sign Language Segmentation [51.06873383204105]
個々の記号へのセグメンテーションとフレーズへのセグメンテーションという2種類のセグメンテーションを考える。
本手法は手話コーパスで観察される言語的手がかりによって動機付けられている。
私たちは、主要なIOタグ付けスキームをBIOタグに置き換えて、継続的な署名を可能にします。
論文 参考訳(メタデータ) (2023-10-21T10:09:34Z) - Character Queries: A Transformer-based Approach to On-Line Handwritten
Character Segmentation [4.128716153761773]
本稿では,文字分割が代入問題となる場合に,事前に書き起こしが知られているシナリオに焦点を当てる。
k$-meansクラスタリングアルゴリズムにヒントを得て、クラスタ割り当ての観点から見た上で、Transformerベースのアーキテクチャを提示する。
提案手法の質を評価するために,2つの有名なオンライン手書きデータセットに対して,文字分割基底真理を生成する。
論文 参考訳(メタデータ) (2023-09-06T15:19:04Z) - Diffusion Models for Open-Vocabulary Segmentation [79.02153797465324]
OVDiffは、教師なしオープン語彙セグメンテーションに生成テキストから画像への拡散モデルを利用する新しい手法である。
トレーニング済みのコンポーネントのみに依存し、トレーニングなしで合成セグメンタを直接出力する。
論文 参考訳(メタデータ) (2023-06-15T17:51:28Z) - BN-HTRd: A Benchmark Dataset for Document Level Offline Bangla
Handwritten Text Recognition (HTR) and Line Segmentation [0.0]
我々は,単語,行,文書レベルのアノテーションからなるBanglaスクリプトの画像から,オフライン手書き文字認識(HTR)のための新しいデータセットを提案する。
BN-HTRdデータセットはBBC Bangla News corpusに基づいている。
私たちのデータセットには、約150の異なる著者によって作成された手書きページの788のイメージが含まれています。
論文 参考訳(メタデータ) (2022-05-29T22:56:26Z) - A combined approach to the analysis of speech conversations in a contact
center domain [2.575030923243061]
本稿では, インバウンドフローやアウトバウンドフローから抽出した通話記録を扱う, イタリアのコンタクトセンターにおける音声分析プロセスの実験について述べる。
まず,Kaldi フレームワークをベースとした社内音声合成ソリューションの開発について詳述する。
そこで我々は,コールトランスクリプトのセマンティックタグ付けに対する異なるアプローチの評価と比較を行った。
最後に、タグ付け問題にJ48Sと呼ばれる決定木インデューサを適用する。
論文 参考訳(メタデータ) (2022-03-12T10:03:20Z) - Word Segmentation on Discovered Phone Units with Dynamic Programming and
Self-Supervised Scoring [23.822788597966646]
教師なし音声セグメンテーションの最近の研究は、電話セグメンテーションモジュールと、共同で訓練された単語セグメンテーションモジュールを備えた自己教師型モデルを用いている。
本稿では,この共同手法と,まずボトムアップ電話のような単位探索を行い,その上で記号的単語セグメンテーションを行うという,従来の考え方と比較する。
具体的には、セグメントコストを与える自己監督型スコアリングネットワークを変更することで、電話や単語のセグメンテーションに使用可能な、期間金化動的プログラミング(DPDP)手順を具体的に記述する。
論文 参考訳(メタデータ) (2022-02-24T07:02:56Z) - Sentiment analysis in tweets: an assessment study from classical to
modern text representation models [59.107260266206445]
Twitterで公開された短いテキストは、豊富な情報源として大きな注目を集めている。
非公式な言語スタイルや騒々しい言語スタイルといったそれらの固有の特徴は、多くの自然言語処理(NLP)タスクに挑戦し続けている。
本研究では,22データセットの豊富なコレクションを用いて,ツイートに表される感情を識別する既存言語モデルの評価を行った。
論文 参考訳(メタデータ) (2021-05-29T21:05:28Z) - SCNet: Enhancing Few-Shot Semantic Segmentation by Self-Contrastive
Background Prototypes [56.387647750094466]
Few-shot セマンティックセマンティックセマンティクスは,クエリイメージ内の新規クラスオブジェクトを,アノテーション付きの例で分割することを目的としている。
先進的なソリューションのほとんどは、各ピクセルを学習した前景のプロトタイプに合わせることでセグメンテーションを行うメトリクス学習フレームワークを利用している。
このフレームワークは、前景プロトタイプのみとのサンプルペアの不完全な構築のために偏った分類に苦しんでいます。
論文 参考訳(メタデータ) (2021-04-19T11:21:47Z) - Grounded Compositional Outputs for Adaptive Language Modeling [59.02706635250856]
言語モデルの語彙$-$典型的にはトレーニング前に選択され、後で永久に固定される$-$は、そのサイズに影響します。
言語モデルのための完全合成出力埋め込み層を提案する。
我々の知る限り、この結果はトレーニング語彙に依存しないサイズを持つ最初の単語レベル言語モデルである。
論文 参考訳(メタデータ) (2020-09-24T07:21:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。