論文の概要: Unsupervised Structure-Texture Separation Network for Oracle Character
Recognition
- arxiv url: http://arxiv.org/abs/2205.06549v1
- Date: Fri, 13 May 2022 10:27:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-16 19:18:10.796802
- Title: Unsupervised Structure-Texture Separation Network for Oracle Character
Recognition
- Title(参考訳): Oracle文字認識のための教師なし構造・テクスチャ分離ネットワーク
- Authors: Mei Wang, Weihong Deng, Cheng-Lin Liu
- Abstract要約: オラクルの骨書は上海王朝の中国最古の書記体系であり、考古学や文献学に重要視されている。
そこで本稿では, 連関, 変換, 適応, 認識のためのエンドツーエンド学習フレームワークである構造テクスチャ分離ネットワーク(STSN)を提案する。
- 参考スコア(独自算出の注目度): 70.29024469395608
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Oracle bone script is the earliest-known Chinese writing system of the Shang
dynasty and is precious to archeology and philology. However, real-world
scanned oracle data are rare and few experts are available for annotation which
make the automatic recognition of scanned oracle characters become a
challenging task. Therefore, we aim to explore unsupervised domain adaptation
to transfer knowledge from handprinted oracle data, which are easy to acquire,
to scanned domain. We propose a structure-texture separation network (STSN),
which is an end-to-end learning framework for joint disentanglement,
transformation, adaptation and recognition. First, STSN disentangles features
into structure (glyph) and texture (noise) components by generative models, and
then aligns handprinted and scanned data in structure feature space such that
the negative influence caused by serious noises can be avoided when adapting.
Second, transformation is achieved via swapping the learned textures across
domains and a classifier for final classification is trained to predict the
labels of the transformed scanned characters. This not only guarantees the
absolute separation, but also enhances the discriminative ability of the
learned features. Extensive experiments on Oracle-241 dataset show that STSN
outperforms other adaptation methods and successfully improves recognition
performance on scanned data even when they are contaminated by long burial and
careless excavation.
- Abstract(参考訳): オラクルの骨書は上海王朝の中国最古の書記体系であり、考古学や文献学に重要視されている。
しかし、実世界のスキャンされたoracleデータはまれであり、スキャンされたoracleの文字の自動認識が困難なタスクになるようなアノテーションの専門家はほとんどいない。
そこで本研究では,手書きのオラクルデータからスキャンされたドメインへの知識伝達のための教師なしドメイン適応を探求する。
そこで本稿では, 連関, 変換, 適応, 認識のためのエンドツーエンド学習フレームワークである構造テクスチャ分離ネットワーク(STSN)を提案する。
まず、STSNは、特徴を生成モデルにより構造(グリフ)とテクスチャ(ノイズ)に切り離し、次に、重騒音による負の影響を回避できるように、手書きおよびスキャンされたデータを構造特徴空間に整列させる。
第二に、学習したテクスチャをドメイン間で交換することで変換を行い、最終分類のための分類器を訓練して、変換されたスキャンされた文字のラベルを予測する。
これは絶対的な分離を保証するだけでなく、学習した特徴の識別能力を高める。
oracle-241データセットに関する広範な実験は、stsnが他の適応方法よりも優れており、長い埋葬や不注意な発掘によって汚染された場合でも、スキャンされたデータの認識性能が向上していることを示している。
関連論文リスト
- Boosting Semi-Supervised Scene Text Recognition via Viewing and Summarizing [71.29488677105127]
既存のシーンテキスト認識(STR)手法は、特に芸術的で歪んだ文字に対して、挑戦的なテキストを認識するのに苦労している。
人的コストを伴わずに、合成データと実際のラベルなしデータを活用して、対照的な学習ベースのSTRフレームワークを提案する。
本手法は,共通ベンチマークとUnion14M-Benchmarkで平均精度94.7%,70.9%のSOTA性能を実現する。
論文 参考訳(メタデータ) (2024-11-23T15:24:47Z) - Unsupervised Attention Regularization Based Domain Adaptation for Oracle Character Recognition [59.05212866862219]
オラクル文字の研究は中国考古学や文献学において重要な役割を担っている。
実世界のスキャンされたオラクル文字の収集と注釈の難しさは、オラクル文字認識の発達を妨げる。
我々は,ラベル付き手書きオラクル文字からラベル付きスキャンデータへの認識知識を伝達するための,新しい教師なしドメイン適応(UDA)手法を開発した。
論文 参考訳(メタデータ) (2024-09-24T09:07:05Z) - Oracle Character Recognition using Unsupervised Discriminative
Consistency Network [65.64172835624206]
オラクル文字認識(OrCR)のための新しい教師なしドメイン適応手法を提案する。
擬似ラベルを利用して意味情報を適応と制約強化の整合性に組み込む。
提案手法は,Oracle-241データセットの最先端結果を実現し,最近提案した構造・テクスチャ分離ネットワークを15.1%向上させる。
論文 参考訳(メタデータ) (2023-12-11T02:52:27Z) - Transformer-Based UNet with Multi-Headed Cross-Attention Skip
Connections to Eliminate Artifacts in Scanned Documents [0.0]
Swin Transformerのバックボーンを使用したUNet構造の変更を行い、スキャンされたドキュメントの典型的なアーティファクトを削除する。
合成データのエラー率を最大53.9%削減したテキスト抽出品質の改善をアーカイブする。
論文 参考訳(メタデータ) (2023-06-05T12:12:23Z) - UIA-ViT: Unsupervised Inconsistency-Aware Method based on Vision
Transformer for Face Forgery Detection [52.91782218300844]
そこで我々は、UIA-ViTと呼ばれるビジョン変換器に基づく教師なし不整合認識手法を提案する。
自己注意機構により、パッチ埋め込み間の注意マップは自然に一貫性関係を表現し、一貫性表現学習に適した視覚変換器となる。
論文 参考訳(メタデータ) (2022-10-23T15:24:47Z) - DFCANet: Dense Feature Calibration-Attention Guided Network for Cross
Domain Iris Presentation Attack Detection [2.95102708174421]
アイリス提示攻撃検出(IPAD)は個人識別の確保に不可欠である。
既存のIPADアルゴリズムは、目に見えないクロスドメインシナリオにうまく一般化しない。
本稿では,DFCANet: Dense Feature and Attention Guided Networkを提案する。
論文 参考訳(メタデータ) (2021-11-01T13:04:23Z) - SPIN: Structure-Preserving Inner Offset Network for Scene Text
Recognition [48.676064155070556]
任意テキストの出現は、シーンテキスト認識タスクにおいて大きな課題となる。
我々は新しい学習可能な幾何学的非関連モジュールであるStructure-Preserving Inner Offset Network (SPIN)を導入する。
SPINは、ネットワーク内のソースデータの色操作を可能にする。
論文 参考訳(メタデータ) (2020-05-27T01:47:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。