論文の概要: Instance Segmentation for Chinese Character Stroke Extraction, Datasets
and Benchmarks
- arxiv url: http://arxiv.org/abs/2210.13826v1
- Date: Tue, 25 Oct 2022 08:09:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-26 15:08:43.044507
- Title: Instance Segmentation for Chinese Character Stroke Extraction, Datasets
and Benchmarks
- Title(参考訳): 漢字ストローク抽出,データセット,ベンチマークのためのインスタンスセグメンテーション
- Authors: Lizhao Liu, Kunyang Lin, Shangxin Huang, Zhongli Li, Chao Li, Yunbo
Cao, and Qingyu Zhou
- Abstract要約: ストロークは漢字の基本要素であり、ストローク抽出は重要かつ長年の努力である。
異なるストローク抽出法を公平に比較するための標準ベンチマークは存在しない。
我々は,2つの新しい大規模データセットを用いた中国語文字ストローク抽出ベンチマークを公開している。
- 参考スコア(独自算出の注目度): 19.176839237739085
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Stroke is the basic element of Chinese character and stroke extraction has
been an important and long-standing endeavor. Existing stroke extraction
methods are often handcrafted and highly depend on domain expertise due to the
limited training data. Moreover, there are no standardized benchmarks to
provide a fair comparison between different stroke extraction methods, which,
we believe, is a major impediment to the development of Chinese character
stroke understanding and related tasks. In this work, we present the first
public available Chinese Character Stroke Extraction (CCSE) benchmark, with two
new large-scale datasets: Kaiti CCSE (CCSE-Kai) and Handwritten CCSE (CCSE-HW).
With the large-scale datasets, we hope to leverage the representation power of
deep models such as CNNs to solve the stroke extraction task, which, however,
remains an open question. To this end, we turn the stroke extraction problem
into a stroke instance segmentation problem. Using the proposed datasets to
train a stroke instance segmentation model, we surpass previous methods by a
large margin. Moreover, the models trained with the proposed datasets benefit
the downstream font generation and handwritten aesthetic assessment tasks. We
hope these benchmark results can facilitate further research. The source code
and datasets are publicly available at: https://github.com/lizhaoliu-Lec/CCSE.
- Abstract(参考訳): ストロークは漢字の基本要素であり、ストローク抽出は重要かつ長年の努力である。
既存のストローク抽出法はしばしば手作りであり、限られたトレーニングデータのためにドメインの専門知識に依存する。
さらに,中国語の文字認識や関連タスクの発達に障害があると考えられる,異なるストローク抽出法を公平に比較するための標準化されたベンチマークは存在しない。
本研究では,Caiti CCSE (CCSE-Kai) とHandwriting CCSE (CCSE-HW) の2つの大規模データセットを用いた,最初の公開可能な漢字ストローク抽出(CCSE)ベンチマークを示す。
大規模なデータセットでは、CNNのような深層モデルの表現力を活用して、ストローク抽出の課題を解決したいと考えています。
この目的のために、ストローク抽出問題をストロークインスタンスセグメンテーション問題に変換する。
提案したデータセットを用いて、ストロークインスタンスセグメンテーションモデルをトレーニングし、従来の手法を大きなマージンで上回ります。
さらに、提案したデータセットでトレーニングされたモデルは、下流フォントの生成と手書きの美的評価タスクに有効である。
これらのベンチマーク結果がさらなる研究を促進することを願っています。
ソースコードとデータセットは、https://github.com/lizhaoliu-Lec/CCSEで公開されている。
関連論文リスト
- Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.02530777915362]
本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。
DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。
10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2024-07-20T01:34:13Z) - Analyzing Vietnamese Legal Questions Using Deep Neural Networks with
Biaffine Classifiers [3.116035935327534]
我々は深層ニューラルネットワークを用いてベトナムの法的問題から重要な情報を抽出することを提案する。
自然言語で法的疑問が与えられた場合、その疑問に答えるために必要な情報を含む全てのセグメントを抽出することが目的である。
論文 参考訳(メタデータ) (2023-04-27T18:19:24Z) - Bag of Tricks for Training Data Extraction from Language Models [98.40637430115204]
公開データセットを用いてトレーニングデータ抽出を改善するための手法とベンチマーク手法について検討する。
実験結果から,これまで見過ごされていたいくつかのトリックが,トレーニングデータ抽出の成功に不可欠であることが示唆された。
論文 参考訳(メタデータ) (2023-02-09T06:46:42Z) - Ensemble Transfer Learning for Multilingual Coreference Resolution [60.409789753164944]
非英語で作業する場合に頻繁に発生する問題は、注釈付きトレーニングデータの不足である。
我々は,様々なトランスファー学習技術を組み合わせた,シンプルだが効果的なアンサンブルベースのフレームワークを設計する。
また、ウィキペディアアンカーテキストを利用して、コア参照解決モデルをブートストラップする低コストのTL手法を提案する。
論文 参考訳(メタデータ) (2023-01-22T18:22:55Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - ClueGraphSum: Let Key Clues Guide the Cross-Lingual Abstractive
Summarization [5.873920727236548]
言語間の要約は、異なる言語の記事に対して1つの言語で要約を生成するタスクである。
CLSに関するこれまでの研究は主にパイプライン方式を採用し、翻訳された並列データを使ってエンドツーエンドモデルを訓練していた。
本稿では,言語間要約の品質向上を図るために,手掛かり付き言語間抽象要約手法を提案する。
論文 参考訳(メタデータ) (2022-03-05T18:01:11Z) - Syntactic-GCN Bert based Chinese Event Extraction [2.3104000011280403]
本研究では,中国語イベント抽出を行う統合フレームワークを提案する。
提案するアプローチは、意味的特徴と構文的特徴を統合するマルチチャネル入力ニューラルフレームワークである。
実験結果から,提案手法はベンチマーク手法よりも有意に優れていることがわかった。
論文 参考訳(メタデータ) (2021-12-18T14:07:54Z) - HRCenterNet: An Anchorless Approach to Chinese Character Segmentation in
Historical Documents [0.7734726150561089]
本稿では,アンカーレス物体検出法と並列化アーキテクチャを組み合わせたHRCenterNetというモデルを提案する。
データセットは、3000以上の中国史料と100万以上の漢字で構成されている。
本モデルでは,IoU 0.81を平均で達成し,他のモデルと比較して最高速度精度のトレードオフを実現している。
論文 参考訳(メタデータ) (2020-12-10T15:21:02Z) - RethinkCWS: Is Chinese Word Segmentation a Solved Task? [81.11161697133095]
中国語の単語(CWS)システムの性能は、ディープニューラルネットワークの急速な発展とともに、徐々に高水準に達している。
本稿では、私たちが達成した事柄の株式を取得し、CWSタスクに残されている事柄を再考する。
論文 参考訳(メタデータ) (2020-11-13T11:07:08Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。