論文の概要: Computer-Aided Multi-Stroke Character Simplification by Stroke Removal
- arxiv url: http://arxiv.org/abs/2506.23106v1
- Date: Sun, 29 Jun 2025 06:14:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:53.720039
- Title: Computer-Aided Multi-Stroke Character Simplification by Stroke Removal
- Title(参考訳): ストローク除去によるコンピュータ支援マルチストローク文字の簡易化
- Authors: Ryo Ishiyama, Shinnosuke Matsuo, Seiichi Uchida,
- Abstract要約: 中国語や日本語などのスクリプトのマルチストローク文字は非常に複雑である。
本稿では,ストロークを選択的に除去することで,マルチストローク文字を体系的に単純化するフレームワークを提案する。
- 参考スコア(独自算出の注目度): 6.7659763626415135
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-stroke characters in scripts such as Chinese and Japanese can be highly complex, posing significant challenges for both native speakers and, especially, non-native learners. If these characters can be simplified without degrading their legibility, it could reduce learning barriers for non-native speakers, facilitate simpler and legible font designs, and contribute to efficient character-based communication systems. In this paper, we propose a framework to systematically simplify multi-stroke characters by selectively removing strokes while preserving their overall legibility. More specifically, we use a highly accurate character recognition model to assess legibility and remove those strokes that minimally impact it. Experimental results on 1,256 character classes with 5, 10, 15, and 20 strokes reveal several key findings, including the observation that even after removing multiple strokes, many characters remain distinguishable. These findings suggest the potential for more formalized simplification strategies.
- Abstract(参考訳): 中国語や日本語などのスクリプトのマルチストローク文字は非常に複雑であり,母語話者,特に非母語学習者にとって重要な課題となっている。
もしこれらの文字が可否を損なうことなく単純化できるなら、非ネイティブ話者の学習障壁を減らし、シンプルで可読なフォント設計を容易にし、文字ベースの効率的なコミュニケーションシステムに寄与することができる。
そこで,本稿では,ストロークを選択的に除去し,全体の可読性を保ちつつ,マルチストローク文字を体系的に単純化する枠組みを提案する。
具体的には、精度の高い文字認識モデルを使用して、妥当性を評価し、最小限に影響を及ぼすストロークを取り除く。
5,10,15,20ストロークの1,256文字級の実験結果から,複数のストロークを除去した後でも,多くの文字が識別可能であることが示唆された。
これらの結果は、より形式化された単純化戦略の可能性を示している。
関連論文リスト
- Skeleton and Font Generation Network for Zero-shot Chinese Character Generation [53.08596064763731]
そこで我々は,より堅牢な漢字フォント生成を実現するために,新しいSkeleton and Font Generation Network (SFGN)を提案する。
ミススペル文字について実験を行い、その大部分は共通文字とわずかに異なる。
提案手法は、生成した画像の有効性を視覚的に実証し、現在最先端のフォント生成方法より優れていることを示す。
論文 参考訳(メタデータ) (2025-01-14T12:15:49Z) - Signs as Tokens: A Retrieval-Enhanced Multilingual Sign Language Generator [55.94334001112357]
テキスト入力から3Dサインアバターを自動回帰的に生成できる多言語手話モデルSigns as Tokens(SOKE)を導入する。
単語レベルの正確な記号を提供するために,外部記号辞書を組み込んだ検索強化SLG手法を提案する。
論文 参考訳(メタデータ) (2024-11-26T18:28:09Z) - A New Dataset and Empirical Study for Sentence Simplification in Chinese [50.0624778757462]
本稿では,中国語で文の単純化を評価するための新しいデータセットであるCSSを紹介する。
我々は、人間のアノテーションから手作業による単純化を収集し、英語と中国語の文の簡易化の違いを示すデータ解析を行う。
最後に,CSS上で評価することで,大言語モデルが高品質な中国語文の簡易化システムとして機能するかどうかを考察する。
論文 参考訳(メタデータ) (2023-06-07T06:47:34Z) - Improving Scene Text Recognition for Character-Level Long-Tailed
Distribution [35.14058653707104]
本稿では,2つの専門家を用いた新しい文脈認識フリーエキスパートネットワーク(CAFE-Net)を提案する。
CAFE-Netは多数の文字を含む言語でのSTR性能を改善する。
論文 参考訳(メタデータ) (2023-03-31T06:11:33Z) - Scalable Font Reconstruction with Dual Latent Manifolds [55.29525824849242]
タイポグラフィー解析とフォント再構成を行う深層生成モデルを提案する。
このアプローチによって、効果的にモデル化できるキャラクタの種類を大規模にスケールアップすることが可能になります。
多くの言語の文字タイプを表す様々なデータセット上でフォント再構成のタスクを評価する。
論文 参考訳(メタデータ) (2021-09-10T20:37:43Z) - ZiGAN: Fine-grained Chinese Calligraphy Font Generation via a Few-shot
Style Transfer Approach [7.318027179922774]
ZiGANは、強力なエンドツーエンドの漢字フォント生成フレームワークである。
微粒なターゲットスタイルの文字を生成するために手動操作や冗長な前処理を一切必要としない。
提案手法は,数発の漢字スタイル転送における最先端の一般化能力を有する。
論文 参考訳(メタデータ) (2021-08-08T09:50:20Z) - Zero-Shot Chinese Character Recognition with Stroke-Level Decomposition [37.808021793372504]
本稿では,各文字をストローク列に分解することで,ストロークに基づく手法を提案する。
我々は、予測されたストロークシーケンスを特定の文字に変換するためにマッチングベースの戦略を用いる。
提案手法は、文字をストロークに分解できる他の言語に容易に一般化できる。
論文 参考訳(メタデータ) (2021-06-22T08:49:03Z) - Hippocampus-heuristic Character Recognition Network for Zero-shot
Learning [3.720802292070508]
本稿では,Hippocampus-heuristic character Recognition Network (HCRN)を提案する。
HCRNは、急進派の訓練によってのみ、目に見えない漢字(すなわちゼロショット学習)を認識できる。
正確に予測できる漢字は約16,330文字で、500文字しか訓練されていない。
論文 参考訳(メタデータ) (2021-04-06T01:57:20Z) - Leveraging Adversarial Training in Self-Learning for Cross-Lingual Text
Classification [52.69730591919885]
本稿では,ラベル保存型入力摂動の最大損失を最小限に抑える半教師付き対向学習法を提案する。
多様な言語群に対する文書分類と意図分類において,有効性が著しく向上するのを観察する。
論文 参考訳(メタデータ) (2020-07-29T19:38:35Z) - Separating Content from Style Using Adversarial Learning for Recognizing
Text in the Wild [103.51604161298512]
画像中の複数の文字の生成と認識のための逆学習フレームワークを提案する。
我々のフレームワークは、新しい最先端の認識精度を達成するために、最近の認識手法に統合することができる。
論文 参考訳(メタデータ) (2020-01-13T12:41:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。