論文の概要: BeHGAN: Bengali Handwritten Word Generation from Plain Text Using Generative Adversarial Networks
- arxiv url: http://arxiv.org/abs/2512.21694v1
- Date: Thu, 25 Dec 2025 14:38:12 GMT
- ステータス: 情報取得中
- システム内更新日: 2025-12-29 11:53:57.918617
- Title: BeHGAN: Bengali Handwritten Word Generation from Plain Text Using Generative Adversarial Networks
- Title(参考訳): BeHGAN: 生成逆数ネットワークを用いたプレーンテキストからのベンガル手書き語生成
- Authors: Md. Rakibul Islam, Md. Kamrozzaman Bhuiyan, Safwan Muntasir, Arifur Rahman Jawad, Most. Sharmin Sultana Samu,
- Abstract要約: 我々はベンガル人手書きサンプルの自己収集データセットを開発し,使用する。
データセットには、年齢や性別の異なる約500人の個人からのコントリビューションが含まれている。
提案手法は,入力プレーンテキストから多種多様な手書き出力を生成する能力を示す。
- 参考スコア(独自算出の注目度): 0.2446672595462589
- License:
- Abstract: Handwritten Text Recognition (HTR) is a well-established research area. In contrast, Handwritten Text Generation (HTG) is an emerging field with significant potential. This task is challenging due to the variation in individual handwriting styles. A large and diverse dataset is required to generate realistic handwritten text. However, such datasets are difficult to collect and are not readily available. Bengali is the fifth most spoken language in the world. While several studies exist for languages such as English and Arabic, Bengali handwritten text generation has received little attention. To address this gap, we propose a method for generating Bengali handwritten words. We developed and used a self-collected dataset of Bengali handwriting samples. The dataset includes contributions from approximately five hundred individuals across different ages and genders. All images were pre-processed to ensure consistency and quality. Our approach demonstrates the ability to produce diverse handwritten outputs from input plain text. We believe this work contributes to the advancement of Bengali handwriting generation and can support further research in this area.
- Abstract(参考訳): 手書き文字認識(HTR)は、よく確立された研究分野である。
対照的に、手書きテキスト生成(HTG)は大きなポテンシャルを持つ新興分野である。
このタスクは、個々の手書きスタイルのバリエーションのため、難しい。
現実的な手書きテキストを生成するには、大規模で多様なデータセットが必要である。
しかし、このようなデータセットの収集は困難であり、簡単には利用できない。
ベンガル語は世界で5番目に話されている言語である。
英語やアラビア語などの言語にはいくつかの研究があるが、ベンガルの手書きテキスト生成はほとんど注目されていない。
このギャップに対処するために,ベンガル手書き単語を生成する手法を提案する。
我々はベンガル人手書きサンプルの自己収集データセットを開発し,使用した。
データセットには、年齢や性別の異なる約500人の個人からのコントリビューションが含まれている。
すべての画像は、一貫性と品質を保証するために前処理された。
提案手法は,入力プレーンテキストから多種多様な手書き出力を生成する能力を示す。
我々は,この研究がベンガルの筆跡生成の進展に寄与し,この分野のさらなる研究を支援することができると考えている。
関連論文リスト
- Bharat Scene Text: A Novel Comprehensive Dataset and Benchmark for Indian Language Scene Text Understanding [3.40492636281753]
Bharat Scene Text datasetは、インドの言語シーンテキスト認識を研究するための総合的なベンチマークである。
インドの11の言語と英語にまたがる100万語以上の単語で構成されており、インドの様々な言語領域で撮影された6500以上の風景画像から来ている。
Scene Text Detection、Script Identification、Cropped Word Recognition、End-to-End Scene Text Recognitionなど、複数のシーンテキストタスクをサポートする。
論文 参考訳(メタデータ) (2025-11-28T10:58:37Z) - GraDeT-HTR: A Resource-Efficient Bengali Handwritten Text Recognition System utilizing Grapheme-based Tokenizer and Decoder-only Transformer [2.2550831568419456]
世界で6番目に話されている言語であるにもかかわらず、ベンガル語のための手書き文字認識システムはいまだに未発達のままである。
本稿では,GraDeT-HTRについて述べる。これは,Grapheme対応のデコーダのみのトランスフォーマアーキテクチャに基づく,リソース効率の良いベンガル手書きテキスト認識システムである。
論文 参考訳(メタデータ) (2025-09-22T17:56:17Z) - JaccDiv: A Metric and Benchmark for Quantifying Diversity of Generated Marketing Text in the Music Industry [47.76073133338117]
本稿では,マーケティングテキストの自動生成のためのデータ・テキスト・アプローチについて検討する。
T5, GPT-3.5, GPT-4, LLaMa2などの言語モデルと, 微調整, 少数ショット, ゼロショットのアプローチを併用する。
この研究は音楽産業を超えてその関連性を高め、様々な分野で有益であることが証明された。
論文 参考訳(メタデータ) (2025-04-29T15:19:06Z) - Multichannel Attention Networks with Ensembled Transfer Learning to Recognize Bangla Handwritten Charecter [1.5236380958983642]
この研究では、アンサンブルトランスファーラーニングとマルチチャネルアテンションネットワークを備えた畳み込みニューラルネットワーク(CNN)を用いた。
我々は、CAMTERdb 3.1.2データセットを用いて提案モデルを評価し、生データセットの92%、前処理データセットの98.00%の精度を達成した。
論文 参考訳(メタデータ) (2024-08-20T15:51:01Z) - Dataset and Benchmark for Urdu Natural Scenes Text Detection, Recognition and Visual Question Answering [50.52792174648067]
このイニシアチブは、テキストと視覚的理解のギャップを埋めようとしている。
そこで本研究では,1000以上の自然シーン画像からなるマルチタスクUrduシーンテキストデータセットを提案する。
テキストインスタンスの細かいアノテーションを提供し、以前のデータセットの制限に対処します。
論文 参考訳(メタデータ) (2024-05-21T06:48:26Z) - NusaWrites: Constructing High-Quality Corpora for Underrepresented and
Extremely Low-Resource Languages [54.808217147579036]
インドネシアの地方言語について事例研究を行う。
データセット構築におけるオンラインスクラップ,人文翻訳,および母語話者による段落作成の有効性を比較した。
本研究は,母語話者による段落作成によって生成されたデータセットが,語彙的多様性と文化的内容の点で優れた品質を示すことを示す。
論文 参考訳(メタデータ) (2023-09-19T14:42:33Z) - Efficient approach of using CNN based pretrained model in Bangla
handwritten digit recognition [0.0]
手書き文字認識は、様々な産業において多くの応用に不可欠である。
形状、サイズ、書体スタイルの多様性でベンガル文字を書くのが複雑であるため、研究者はSupervisedの機械学習アルゴリズムを使って精度を向上できなかった。
Inception-v3, EfficientNetB0を含むCNNベースの手書き文字認識モデルを提案する。
論文 参考訳(メタデータ) (2022-09-19T15:58:53Z) - Bengali Handwritten Grapheme Classification: Deep Learning Approach [0.0]
画像中のベンガルグラフの3つの構成要素を分類することが課題となるKaggleコンペティション citek_link に参加する。
我々は,Multi-Layer Perceptron(MLP)やResNet50の現状など,既存のニューラルネットワークモデルの性能について検討する。
そこで我々は,ベンガル語文法分類のための独自の畳み込みニューラルネットワーク(CNN)モデルを提案し,検証根の精度95.32%,母音の精度98.61%,子音の精度98.76%を示した。
論文 参考訳(メタデータ) (2021-11-16T06:14:59Z) - Deep Learning for Text Style Transfer: A Survey [71.8870854396927]
テキストスタイル転送は、生成したテキストの特定の属性を制御することを目的として、自然言語生成において重要なタスクである。
2017年の最初のニューラルテキストスタイル転送作業以降,100以上の代表的な記事を対象とした,ニューラルテキストスタイル転送の研究の体系的な調査を行う。
タスクの定式化、既存のデータセットとサブタスク、評価、並列データと非並列データの存在下での豊富な方法論について論じる。
論文 参考訳(メタデータ) (2020-11-01T04:04:43Z) - A Survey of Knowledge-Enhanced Text Generation [81.24633231919137]
テキスト生成の目標は、機械を人間の言語で表現できるようにすることである。
入力テキストを出力テキストにマッピングすることを学ぶことで、目的を達成するために、様々なニューラルエンコーダデコーダモデルが提案されている。
この問題に対処するために、研究者は入力テキスト以外の様々な種類の知識を生成モデルに組み込むことを検討してきた。
論文 参考訳(メタデータ) (2020-10-09T06:46:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。