論文の概要: A Chinese Spelling Check Framework Based on Reverse Contrastive Learning
- arxiv url: http://arxiv.org/abs/2210.13823v2
- Date: Thu, 6 Jul 2023 07:34:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-07 18:18:43.332902
- Title: A Chinese Spelling Check Framework Based on Reverse Contrastive Learning
- Title(参考訳): 逆コントラスト学習に基づく中国語スペルチェックフレームワーク
- Authors: Nankai Lin, Hongyan Wu, Sihui Fu, Shengyi Jiang, Aimin Yang
- Abstract要約: 本稿では,中国語のスペルチェックのための新しいフレームワークを提案する。
具体的には,モデルに類似事例間の合意を最小化するよう強制する,逆対比学習戦略を提案する。
実験結果から,本フレームワークはモデル非依存であり,既存の中国語スペルチェックモデルと組み合わせることで,最先端の性能が得られることが示された。
- 参考スコア(独自算出の注目度): 4.60495447017298
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Chinese spelling check is a task to detect and correct spelling mistakes in
Chinese text. Existing research aims to enhance the text representation and use
multi-source information to improve the detection and correction capabilities
of models, but does not pay too much attention to improving their ability to
distinguish between confusable words. Contrastive learning, whose aim is to
minimize the distance in representation space between similar sample pairs, has
recently become a dominant technique in natural language processing. Inspired
by contrastive learning, we present a novel framework for Chinese spelling
checking, which consists of three modules: language representation, spelling
check and reverse contrastive learning. Specifically, we propose a reverse
contrastive learning strategy, which explicitly forces the model to minimize
the agreement between the similar examples, namely, the phonetically and
visually confusable characters. Experimental results show that our framework is
model-agnostic and could be combined with existing Chinese spelling check
models to yield state-of-the-art performance.
- Abstract(参考訳): 中国語のスペルチェックは、漢字のスペルミスを検出し、訂正するタスクである。
既存の研究は、テキスト表現を強化し、マルチソース情報を用いてモデルの検出と修正能力を向上させることを目的としているが、不明瞭な単語を区別する能力にはあまり注意を払わない。
類似したサンプルペア間の表現空間距離を最小化することを目的としたコントラスト学習は,近年,自然言語処理において主流となっている。
コントラスト学習にインスパイアされた中国語のスペルチェックのための新しいフレームワークを提案し,言語表現,スペルチェック,逆コントラスト学習の3つのモジュールからなる。
具体的には,類似した例,すなわち音韻的および視覚的に表現可能な文字間の一致を最小限に抑えるための逆コントラスト学習戦略を提案する。
実験の結果,我々のフレームワークはモデルに依存しず,既存の中国語綴りチェックモデルと組み合わせて,最先端のパフォーマンスを実現することができた。
関連論文リスト
- FINEMATCH: Aspect-based Fine-grained Image and Text Mismatch Detection and Correction [66.98008357232428]
我々は新しいアスペクトベースのきめ細かいテキストと画像マッチングベンチマークであるFineMatchを提案する。
FineMatchはテキストと画像のミスマッチの検出と修正に焦点を当てている。
FineMatchで訓練されたモデルは、きめ細かいテキストや画像のミスマッチを検出する能力の向上を示す。
論文 参考訳(メタデータ) (2024-04-23T03:42:14Z) - Pixel Sentence Representation Learning [67.4775296225521]
本研究では,視覚表現学習プロセスとして,文レベルのテキスト意味論の学習を概念化する。
タイポスや単語順シャッフルのような視覚的に接地されたテキスト摂動法を採用し、人間の認知パターンに共鳴し、摂動を連続的に認識できるようにする。
我々のアプローチは、大規模に教師なしのトピックアライメントトレーニングと自然言語推論監督によってさらに強化されている。
論文 参考訳(メタデータ) (2024-02-13T02:46:45Z) - An Adversarial Multi-Task Learning Method for Chinese Text Correction
with Semantic Detection [0.0]
中国語文文脈における文字認識のモデル化と検出能力を高めるために, 逆多タスク学習法を提案する。
モンテカルロ木探索戦略とポリシーネットワークを導入し,意味検出による効率の良い中国語テキスト修正作業を実現する。
論文 参考訳(メタデータ) (2023-06-28T15:46:00Z) - ABINet++: Autonomous, Bidirectional and Iterative Language Modeling for
Scene Text Spotting [121.11880210592497]
言語モデルの限られた能力は,1)暗黙的な言語モデリング,2)一方向の特徴表現,3)雑音入力を伴う言語モデルから生じる。
シーンテキストスポッティングのための自律的で双方向かつ反復的なABINet++を提案する。
論文 参考訳(メタデータ) (2022-11-19T03:50:33Z) - Improving Chinese Story Generation via Awareness of Syntactic
Dependencies and Semantics [17.04903530992664]
本稿では,単語間の依存関係の生成モデルをインフォームすることで,特徴メカニズムを向上する新世代フレームワークを提案する。
我々は様々な実験を行い、その結果、我々のフレームワークは、すべての評価指標において、最先端の中国世代モデルよりも優れていることを示した。
論文 参考訳(メタデータ) (2022-10-19T15:01:52Z) - Improving Pre-trained Language Models with Syntactic Dependency
Prediction Task for Chinese Semantic Error Recognition [52.55136323341319]
既存の中国語のテキスト誤り検出は主にスペルと単純な文法的誤りに焦点を当てている。
中国の意味的誤りは、人間が容易に認識できないほど過小評価され、複雑である。
論文 参考訳(メタデータ) (2022-04-15T13:55:32Z) - Read, Listen, and See: Leveraging Multimodal Information Helps Chinese
Spell Checking [20.74049189959078]
本稿では,漢字のマルチモーダル情報を直接活用して,ReaLiSeという中国語スペルチェッカーを提案する。
ReaLiSeは、(1)入力文字のセマンティック、音声、グラフィック情報をキャプチャし、(2)これらのモダリティに情報を混ぜて正しい出力を予測することによって、CSCタスクをモデル化する。
SIGHANベンチマークの実験では、提案されたモデルは大きなマージンで強いベースラインを上回ります。
論文 参考訳(メタデータ) (2021-05-26T02:38:11Z) - An Alignment-Agnostic Model for Chinese Text Error Correction [17.429266115653007]
本稿では,誤字・欠字・冗長字の種類で中国語の誤りを訂正する方法を検討する。
ほとんどの既存モデルは誤り文字の誤りを訂正できるが、欠落文字や冗長文字を扱うことはできない。
本稿では,テキストアライメントと非アライメントの両方を処理可能な,アライメント非依存な新たな検出訂正フレームワークを提案する。
論文 参考訳(メタデータ) (2021-04-15T01:17:34Z) - LET: Linguistic Knowledge Enhanced Graph Transformer for Chinese Short
Text Matching [29.318730227080675]
外部知識基盤としてHowNetを導入し,単語のあいまいさに対処する言語知識拡張グラフ変換器(LET)を提案する。
2つの中国語データセットによる実験結果から、我々のモデルは様々な典型的なテキストマッチング手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-02-25T04:01:51Z) - SLUA: A Super Lightweight Unsupervised Word Alignment Model via
Cross-Lingual Contrastive Learning [79.91678610678885]
超軽量非教師付き単語アライメントモデル(SLUA)を提案する。
いくつかの公開ベンチマークによる実験結果から,我々のモデルは性能が向上しても競争力を発揮することが示された。
特に、我々のモデルはバイリンガル単語の埋め込みと単語のアライメントを統一する先駆的な試みであると認識している。
論文 参考訳(メタデータ) (2021-02-08T05:54:11Z) - Probing Contextual Language Models for Common Ground with Visual
Representations [76.05769268286038]
我々は、マッチングと非マッチングの視覚表現を区別する上で、テキストのみの表現がいかに効果的かを評価するための探索モデルを設計する。
以上の結果から,言語表現だけでは,適切な対象カテゴリから画像パッチを検索する強力な信号が得られることがわかった。
視覚的に接地された言語モデルは、例えば検索においてテキストのみの言語モデルよりわずかに優れているが、人間よりもはるかに低い。
論文 参考訳(メタデータ) (2020-05-01T21:28:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。