論文の概要: Maximum Entropy Regularization and Chinese Text Recognition
- arxiv url: http://arxiv.org/abs/2007.04651v1
- Date: Thu, 9 Jul 2020 09:19:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-12 04:33:27.169127
- Title: Maximum Entropy Regularization and Chinese Text Recognition
- Title(参考訳): 最大エントロピー正規化と中国語テキスト認識
- Authors: Changxu Cheng, Wuheng Xu, Xiang Bai, Bin Feng, and Wenyu Liu
- Abstract要約: トレーニングプロセスの調整に最大エントロピー正規化を適用することを提案する。
中国語の文字認識、中国語のテキストライン認識、きめ細かい画像分類の実験は、一貫した改善を実現している。
- 参考スコア(独自算出の注目度): 48.63412684890815
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Chinese text recognition is more challenging than Latin text due to the large
amount of fine-grained Chinese characters and the great imbalance over classes,
which causes a serious overfitting problem. We propose to apply Maximum Entropy
Regularization to regularize the training process, which is to simply add a
negative entropy term to the canonical cross-entropy loss without any
additional parameters and modification of a model. We theoretically give the
convergence probability distribution and analyze how the regularization
influence the learning process. Experiments on Chinese character recognition,
Chinese text line recognition and fine-grained image classification achieve
consistent improvement, proving that the regularization is beneficial to
generalization and robustness of a recognition model.
- Abstract(参考訳): 中国語の文字認識がラテン文字よりも難しいのは、きめ細かい漢字が多すぎることと、クラスに対する大きな不均衡が原因で、深刻な過度な問題を引き起こしている。
本稿では,学習過程の正則化に最大エントロピー正規化を適用し,モデルのパラメータや修正を伴わずに,正準クロスエントロピー損失に負のエントロピー項を単に付加することを提案する。
理論的には収束確率分布を与え、正規化が学習過程に与える影響を分析する。
認識モデルの一般化と頑健性には正則化が有効であることを証明し,漢字認識,中国語テキスト行認識,細粒度画像分類の実験により一貫した改善が得られた。
関連論文リスト
- Instilling Multi-round Thinking to Text-guided Image Generation [72.2032630115201]
シングルラウンド世代は、特に靴やスリーブのようなきめ細かい変更の領域において、重要な詳細を見落としていることが多い。
既存の手法と互換性のある,新たな自己監督型正規化,すなわちマルチラウンド正規化を導入する。
修正順序が最終結果に概して影響を与えないという観察に基づいている。
論文 参考訳(メタデータ) (2024-01-16T16:19:58Z) - ngram-OAXE: Phrase-Based Order-Agnostic Cross Entropy for
Non-Autoregressive Machine Translation [51.06378042344563]
オートレグレッシブ翻訳(NAT)におけるマルチモーダリティの効果を改善できる新しい訓練用Oaxe損失が証明された
我々は、ngram 句間の並べ替えのみを許し、句内の単語順序の厳密な一致をいまだ必要とすることで oaxe を拡張する。
さらに分析したところ、ngram-oaxeは実際にngram句の翻訳を改善し、文構造をより良くモデル化してより流動的な翻訳を生成することがわかった。
論文 参考訳(メタデータ) (2022-10-08T11:39:15Z) - Improving Pre-trained Language Models with Syntactic Dependency
Prediction Task for Chinese Semantic Error Recognition [52.55136323341319]
既存の中国語のテキスト誤り検出は主にスペルと単純な文法的誤りに焦点を当てている。
中国の意味的誤りは、人間が容易に認識できないほど過小評価され、複雑である。
論文 参考訳(メタデータ) (2022-04-15T13:55:32Z) - An End-to-end Chinese Text Normalization Model based on Rule-guided
Flat-Lattice Transformer [37.0774363352316]
本稿では,漢字を直接入力として受け入れるエンドツーエンドの中国語テキスト正規化モデルを提案する。
また、中国語のテキスト正規化のための、初めて一般公開された大規模データセットもリリースしました。
論文 参考訳(メタデータ) (2022-03-31T11:19:53Z) - A Contrastive Framework for Neural Text Generation [46.845997620234265]
モデル変性の根底にある理由はトークン表現の異方性分布であることを示す。
モデル表現空間を校正するための対照的な学習目標であるSimCTGと,生成したテキストのコヒーレンスを維持しつつ多様性を高めるためのデコード手法であるコントラスト検索を提案する。
論文 参考訳(メタデータ) (2022-02-13T21:46:14Z) - Controlled Evaluation of Grammatical Knowledge in Mandarin Chinese
Language Models [22.57309958548928]
構造的監督が言語モデルの文法的依存の学習能力を向上させるかどうかを検討する。
LSTM、リカレントニューラルネットワーク文法、トランスフォーマー言語モデル、および異なるサイズのデータセットに対する生成解析モデルをトレーニングする。
構造的監督がコンテンツ間のシナティクス状態の表現に役立ち、低データ設定における性能向上に役立つという示唆的な証拠が得られます。
論文 参考訳(メタデータ) (2021-09-22T22:11:30Z) - Consistency Regularization for Cross-Lingual Fine-Tuning [61.08704789561351]
整合性正規化による言語間微調整の改善を提案する。
具体的には、例の整合性正規化を用いて、予測感度を4種類のデータ拡張にペナルティ化する。
XTREMEベンチマークの実験結果から,本手法は様々なタスクにおける言語間微調整を大幅に改善することが示された。
論文 参考訳(メタデータ) (2021-06-15T15:35:44Z) - Inference-only sub-character decomposition improves translation of
unseen logographic characters [18.148675498274866]
ログソース言語上のニューラルマシン翻訳(NMT)は、未知の文字を翻訳する際に苦労する。
中国語と日本語のNMTにおける既存のイデオログラフに基づくサブ文字分解手法について検討する。
完全部分文字分解は文字翻訳を損なうことが多く、概して矛盾する結果をもたらす。
論文 参考訳(メタデータ) (2020-11-12T17:36:22Z) - Pseudo-Convolutional Policy Gradient for Sequence-to-Sequence
Lip-Reading [96.48553941812366]
唇読解は唇運動系列から音声内容を推測することを目的としている。
seq2seqモデルの伝統的な学習プロセスには2つの問題がある。
本稿では,これら2つの問題に対処するために,PCPGに基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2020-03-09T09:12:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。