Fugu-MT 論文翻訳(概要): Calliar: An Online Handwritten Dataset for Arabic Calligraphy

論文の概要: Calliar: An Online Handwritten Dataset for Arabic Calligraphy

arxiv url: http://arxiv.org/abs/2106.10745v1
Date: Sun, 20 Jun 2021 20:04:51 GMT
ステータス: 翻訳完了
システム内更新日: 2021-06-23 07:24:58.366001
Title: Calliar: An Online Handwritten Dataset for Arabic Calligraphy
Title（参考訳）: Calliar:アラビア文字のオンライン手書きデータセット
Authors: Zaid Alyafeai, Maged S. Al-shaibani, Mustafa Ghaleb, Yousif Ahmed Al-Wajih
Abstract要約: 書道はアラビアの遺産と文化の重要な部分ですアラビア文字のオンラインデータセットは存在しない。 Calliarは、ストローク、文字、単語、および文レベルの予測のために注釈付けされる。
参考スコア（独自算出の注目度）: 3.345437353879255
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Calligraphy is an essential part of the Arabic heritage and culture. It has been used in the past for the decoration of houses and mosques. Usually, such calligraphy is designed manually by experts with aesthetic insights. In the past few years, there has been a considerable effort to digitize such type of art by either taking a photo of decorated buildings or drawing them using digital devices. The latter is considered an online form where the drawing is tracked by recording the apparatus movement, an electronic pen for instance, on a screen. In the literature, there are many offline datasets collected with a diversity of Arabic styles for calligraphy. However, there is no available online dataset for Arabic calligraphy. In this paper, we illustrate our approach for the collection and annotation of an online dataset for Arabic calligraphy called Calliar that consists of 2,500 sentences. Calliar is annotated for stroke, character, word and sentence level prediction.
Abstract（参考訳）: 書道はアラビア語の遺産と文化の重要な部分である。過去には家屋やモスクの装飾に使われたことがある。通常、こうした書風は美学の専門家によって手作業で設計される。ここ数年、装飾された建物の写真を撮ったり、デジタルデバイスで描いたりすることで、このような芸術をデジタル化する努力が続けられてきた。後者は、例えば電子ペンである装置の動きを画面上に記録することにより、描画が追跡されるオンライン形式と考えられる。文献では、書道のアラビア語スタイルを多用したオフラインデータセットが多数収集されている。しかし、アラビア文字のオンラインデータセットは存在しない。本稿では,2500文からなるアラビア語書体Calliarのオンラインデータセットの収集とアノテーションに対するアプローチについて述べる。 Calliarは、ストローク、文字、単語、および文レベルの予測のために注釈付けされる。

関連論文リスト

DuwatBench: Bridging Language and Visual Heritage through an Arabic Calligraphy Benchmark for Multimodal Understanding [32.85312741808662]
1,272のキュレートされたサンプルのベンチマークであるDuwatBenchについて紹介する。このデータセットは、複雑なストロークパターン、密集したリグチュア、スタイリスティックなバリエーションなど、アラビア文字の現実的な課題を反映している。 DuwatBenchを用いて、アラビア語と多言語のマルチモーダルモデルを13種類評価し、クリーンテキストでうまく機能する一方で、書体の変化、芸術的歪み、正確な視覚的テキストアライメントに苦慮していることを示した。
論文参考訳（メタデータ） (2026-01-27T18:59:19Z)
Calligrapher: Freestyle Text Image Customization [72.71919410487881]
Calligrapherは、高度なテキストのカスタマイズと芸術的なタイポグラフィを統合する、新しい拡散ベースのフレームワークである。高品質で視覚的に一貫したタイポグラフィーを自動化することで、Calligrapherは従来のモデルを上回っている。
論文参考訳（メタデータ） (2025-06-30T17:59:06Z)
Moyun: A Diffusion-Based Model for Style-Specific Chinese Calligraphy Generation [10.7430517947254]
「もゆん」は、生成過程を効果的に制御し、特定の様式で書を書ける。書道においても「もゆん」は書道の様式にマッチした書風を書ける。
論文参考訳（メタデータ） (2024-10-10T05:14:03Z)
Muharaf: Manuscripts of Handwritten Arabic Dataset for Cursive Text Recognition [5.28595286827031]
Manuscripts of Hand written Arabic(Muharaf)データセットは、1,600以上の歴史的な手書きページイメージからなる機械学習データセットである。このデータセットは、手書きのテキスト認識において、最先端の技術を前進させるためにコンパイルされた。
論文参考訳（メタデータ） (2024-06-13T23:40:34Z)
Ashaar: Automatic Analysis and Generation of Arabic Poetry Using Deep Learning Approaches [7.021140304091526]
本稿では,アラビア詩の分析・生成に特化して設計されたデータセットと事前学習モデルの集合を含むtextitAshaar というフレームワークを紹介する。提案手法で確立されたパイプラインは, メーター, テーマ, 年代分類など, 詩の様々な側面を包含する。この取り組みの一環として、詩生成のためのデータセットと、診断のためのデータセットと、Arudiスタイルの予測のためのデータセットを4つ提供します。
論文参考訳（メタデータ） (2023-07-12T15:07:16Z)
Beyond Arabic: Software for Perso-Arabic Script Manipulation [67.31374614549237]
ペルソ・アラビア文字を使用する言語の書き起こしシステムを操作するための有限状態トランスデューサ(FST)コンポーネントとそれに対応するユーティリティのセットを提供する。ライブラリはまた、単純なFSTベースのロマン化と文字変換も提供する。
論文参考訳（メタデータ） (2023-01-26T20:37:03Z)
Graphemic Normalization of the Perso-Arabic Script [47.429213930688086]
本稿では,ペルソ・アラビア語が最良文書言語を超えて提示する課題について述べる。自然言語処理(NLP)の状況に注目する。ペルソ・アラビア文字ディアスポラの多言語語族8言語に対する正規化が機械翻訳および統計言語モデリングタスクに及ぼす影響を評価する。
論文参考訳（メタデータ） (2022-10-21T21:59:44Z)
Comprehensive Benchmark Datasets for Amharic Scene Text Detection and Recognition [56.048783994698425]
Ethiopic/Amharicスクリプトはアフリカ最古の書記システムの一つで、東アフリカで少なくとも23の言語に対応している。アムハラ語の表記体系である Abugida は282音節、15句の句読点、20の数字を持つ。 HUST-ART, HUST-AST, ABE, Tana という,自然界におけるアムハラ文字の検出と認識のための総合的な公開データセットを提示した。
論文参考訳（メタデータ） (2022-03-23T03:19:35Z)
Digital Editions as Distant Supervision for Layout Analysis of Printed Books [76.29918490722902]
本稿では,この意味的マークアップを,レイアウト解析モデルのトレーニングと評価のための遠隔監視として利用する手法について述べる。 DTA(Deutsches Textarchiv)の50万ページにわたるモデルアーキテクチャの実験では、これらの領域レベルの評価手法と画素レベルのメトリクスとワードレベルのメトリクスとの高い相関性を見出した。自己学習による精度向上の可能性と、DTAで訓練されたモデルが他の歴史書に一般化できる可能性について論じる。
論文参考訳（メタデータ） (2021-12-23T16:51:53Z)
ShufaNet: Classification method for calligraphers who have reached the professional level [0.0]
そこで我々は,中国の書道スタイルを計量学習に基づいて分類する新しい手法,ShufaNetを提案する。提案手法は,resNetや他の主流CNNを超越した,数ショット学習のためのデータセットの精度を65%向上した。
論文参考訳（メタデータ） (2021-11-22T16:55:31Z)
New Arabic Medical Dataset for Diseases Classification [55.41644538483948]
いくつかのアラブの医療ウェブサイトから収集された2000の医療資料を含む、アラブの医療データセットを新たに導入する。データセットはテキストの分類作業のために構築され、10つのクラス(Blood, Bone, Cardiovascular, Ear, Endocrine, Eye, Gastrointestinal, Immune, Liver, Nephrological)を含んでいる。データセットの実験は、GoogleのBERT、大きなアラビアのコーパスを持つBERTに基づくアラビアト、アラビアの医療コーパスをベースとしたAraBioNERの3つの事前トレーニングモデルによって行われた。
論文参考訳（メタデータ） (2021-06-29T10:42:53Z)
CCPM: A Chinese Classical Poetry Matching Dataset [50.90794811956129]
本稿では,詩のマッチングによるモデルの意味的理解を評価するための新しい課題を提案する。この課題は、現代漢訳の漢詩では、4人の候補者の中から1行の漢詩を選ばなければならない。このデータセットを構築するために、まず中国古典詩と現代中国語の翻訳の並列データを得る。
論文参考訳（メタデータ） (2021-06-03T16:49:03Z)
AraDIC: Arabic Document Classification using Image-Based Character Embeddings and Class-Balanced Loss [7.734726150561088]
本稿では,アラビア文書イメージベース分類器 (AraDIC) を新たに提案する。 AraDICは画像ベースの文字エンコーダと分類器から構成される。長期データ分散問題に対処するために、クラスバランス損失を用いてエンドツーエンドで訓練される。我々の知る限りでは、アラビア文字分類の問題に対処する最初の画像ベースの文字埋め込みフレームワークである。
論文参考訳（メタデータ） (2020-06-20T14:25:06Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。