論文の概要: Bi-DCSpell: A Bi-directional Detector-Corrector Interactive Framework for Chinese Spelling Check
- arxiv url: http://arxiv.org/abs/2406.01879v2
- Date: Tue, 13 Aug 2024 00:07:22 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-14 22:15:08.205278
- Title: Bi-DCSpell: A Bi-directional Detector-Corrector Interactive Framework for Chinese Spelling Check
- Title(参考訳): Bi-DCSpell:中国製スペルチェック用双方向検出器・コレクタインタラクティブフレームワーク
- Authors: Haiming Wu, Hanqing Zhang, Richeng Xuan, Dawei Song,
- Abstract要約: Chinese Spelling Check (CSC) は、中国語の文中の潜在的な誤字を検出し、訂正することを目的としている。
現在のCSCアプローチには2つのタイプがある。
本稿では,CSC(Bi-DCSpell)のための双方向検出器・コレクタフレームワークを提案する。
- 参考スコア(独自算出の注目度): 4.5155966681435595
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Chinese Spelling Check (CSC) aims to detect and correct potentially misspelled characters in Chinese sentences. Naturally, it involves the detection and correction subtasks, which interact with each other dynamically. Such interactions are bi-directional, i.e., the detection result would help reduce the risk of over-correction and under-correction while the knowledge learnt from correction would help prevent false detection. Current CSC approaches are of two types: correction-only or single-directional detection-to-correction interactive frameworks. Nonetheless, they overlook the bi-directional interactions between detection and correction. This paper aims to fill the gap by proposing a Bi-directional Detector-Corrector framework for CSC (Bi-DCSpell). Notably, Bi-DCSpell contains separate detection and correction encoders, followed by a novel interactive learning module facilitating bi-directional feature interactions between detection and correction to improve each other's representation learning. Extensive experimental results demonstrate a robust correction performance of Bi-DCSpell on widely used benchmarking datasets while possessing a satisfactory detection ability.
- Abstract(参考訳): Chinese Spelling Check (CSC) は、中国語の文中の潜在的な誤字を検出し、訂正することを目的としている。
当然、検出と修正のサブタスクが伴い、動的に相互に相互作用する。
このような相互作用は双方向であり、すなわち検出結果は過補正や過補正のリスクを減らすのに役立ち、一方で補正から学んだ知識は誤検出を防ぐのに役立ちます。
現在のCSCアプローチには2つのタイプがある。
それでも、検出と修正の間の双方向の相互作用を見落としている。
本稿では,CSC(Bi-DCSpell)のための双方向検出器・コレクタフレームワークを提案することにより,このギャップを埋めることを目的とする。
特に、Bi-DCSpellは、別途検出および修正エンコーダを含み、次いで、検出と修正の間の双方向の特徴相互作用を容易にし、お互いの表現学習を改善するインタラクティブな学習モジュールである。
広範に使用されているベンチマークデータセットに対して,Bi-DCSpellの堅牢な補正性能を示すとともに,良好な検出能力を有することを示した。
関連論文リスト
- A Coin Has Two Sides: A Novel Detector-Corrector Framework for Chinese Spelling Correction [79.52464132360618]
中国語のSpelling Correction(CSC)は、自然言語処理(NLP)の基本課題である。
本稿では,エラー検出・相関器の枠組みに基づく新しい手法を提案する。
我々の検出器は2つのエラー検出結果を得るように設計されており、それぞれ高精度とリコールが特徴である。
論文 参考訳(メタデータ) (2024-09-06T09:26:45Z) - C2P-CLIP: Injecting Category Common Prompt in CLIP to Enhance Generalization in Deepfake Detection [98.34703790782254]
本稿では、カテゴリ共通プロンプトCLIPを紹介し、カテゴリ共通プロンプトをテキストエンコーダに統合し、カテゴリ関連概念をイメージエンコーダに注入する。
提案手法は,テスト中に追加パラメータを導入することなく,元のCLIPと比較して検出精度が12.41%向上した。
論文 参考訳(メタデータ) (2024-08-19T02:14:25Z) - Detection-Correction Structure via General Language Model for Grammatical Error Correction [22.609760120265587]
本稿では,汎用言語モデル(GLM)に基づく,DeCoGLMという統合された検出補正構造を提案する。
検出フェーズはフォールトトレラント検出テンプレートを使用し、補正フェーズは自己回帰マスクの埋め込みを利用して局所的な誤り訂正を行う。
我々のモデルは、英語と中国語のECデータセットの最先端モデルと競合する性能を示す。
論文 参考訳(メタデータ) (2024-05-28T04:04:40Z) - A Bi-directional Multi-hop Inference Model for Joint Dialog Sentiment
Classification and Act Recognition [25.426172735931463]
ダイアログ知覚分類(DSC)とアクト認識(DAR)の併用作業は,ダイアログ中の各発話に対する感情ラベルと行動ラベルを同時に予測することを目的としている。
本稿では,リッチな感情を反復的に抽出・統合し,双方向で手掛かりを行動させる双方向マルチホップ推論モデル(BMIM)を提案する。
BMIMは、DARのF1スコアで少なくとも2.6%、DSCのF1スコアで1.4%、最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2023-08-08T17:53:24Z) - SoftCorrect: Error Correction with Soft Detection for Automatic Speech
Recognition [116.31926128970585]
我々は,明示的かつ暗黙的な誤り検出の限界を回避するため,ソフトエラー検出機構を備えたSoftCorrectを提案する。
暗黙的な誤り検出とCTC損失と比較すると、SoftCorrectはどの単語が誤りであるかを明示的な信号を提供する。
AISHELL-1とAidatatangデータセットの実験では、SoftCorrectはそれぞれ26.1%と9.4%のCER削減を達成した。
論文 参考訳(メタデータ) (2022-12-02T09:11:32Z) - Mitigating the Mutual Error Amplification for Semi-Supervised Object
Detection [92.52505195585925]
擬似ラベルの修正機構を導入し,相互誤りの増幅を緩和するクロス・インストラクション(CT)手法を提案する。
他の検出器からの予測を直接擬似ラベルとして扱う既存の相互指導法とは対照的に,我々はラベル修正モジュール(LRM)を提案する。
論文 参考訳(メタデータ) (2022-01-26T03:34:57Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z) - Dual-Attention Enhanced BDense-UNet for Liver Lesion Segmentation [3.1667381240856987]
本稿では,DA-BDense-UNetと呼ばれる,DenseUNetと双方向LSTMを統合した新たなセグメンテーションネットワークを提案する。
DenseUNetは十分な多様な特徴を学習し、情報フローを調節することでネットワークの代表的能力を高める。
論文 参考訳(メタデータ) (2021-07-24T16:28:00Z) - Reformulating HOI Detection as Adaptive Set Prediction [25.44630995307787]
我々は適応セット予測問題としてHOI検出を再構成する。
本稿では,並列インスタンスとインタラクションブランチを備えた適応型セットベースワンステージフレームワーク(as-net)を提案する。
この手法は、人間のポーズや言語的特徴を必要とせず、従来の最先端の手法を上回ります。
論文 参考訳(メタデータ) (2021-03-10T10:40:33Z) - Improving the Efficiency of Grammatical Error Correction with Erroneous
Span Detection and Correction [106.63733511672721]
ESD(Eroneous Span Detection)とESC(Eroneous Span Correction)の2つのサブタスクに分割することで、文法的誤り訂正(GEC)の効率を改善するための言語に依存しない新しいアプローチを提案する。
ESDは、効率的なシーケンスタグ付けモデルを用いて文法的に誤りテキストスパンを識別する。ESCは、Seq2seqモデルを利用して、注釈付き誤字スパンの文を入力として取り、これらのスパンの修正テキストのみを出力する。
実験の結果,提案手法は英語と中国語のGECベンチマークにおいて従来のセク2seq手法と同等に動作し,推論に要するコストは50%以下であった。
論文 参考訳(メタデータ) (2020-10-07T08:29:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。