論文の概要: De-biasing Distantly Supervised Named Entity Recognition via Causal
Intervention
- arxiv url: http://arxiv.org/abs/2106.09233v1
- Date: Thu, 17 Jun 2021 04:01:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-19 04:45:24.487144
- Title: De-biasing Distantly Supervised Named Entity Recognition via Causal
Intervention
- Title(参考訳): 因果的介入による遠隔教師付き実体認識の非バイアス化
- Authors: Wenkai Zhang, Hongyu Lin, Xianpei Han, Le Sun
- Abstract要約: ディスタント監視は、辞書マッチングを通じてトレーニングインスタンスを自動的に生成することで、NERのデータボトルネックに取り組む。
残念なことに、DS-NERの学習は辞書バイアスが強く、急激な相関に悩まされている。
本稿では、構造因果モデル(SCM)を用いて辞書バイアスを説明し、そのバイアスを辞書内および辞書間バイアスに分類し、その原因を特定する。
- 参考スコア(独自算出の注目度): 29.597653221700696
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Distant supervision tackles the data bottleneck in NER by automatically
generating training instances via dictionary matching. Unfortunately, the
learning of DS-NER is severely dictionary-biased, which suffers from spurious
correlations and therefore undermines the effectiveness and the robustness of
the learned models. In this paper, we fundamentally explain the dictionary bias
via a Structural Causal Model (SCM), categorize the bias into intra-dictionary
and inter-dictionary biases, and identify their causes. Based on the SCM, we
learn de-biased DS-NER via causal interventions. For intra-dictionary bias, we
conduct backdoor adjustment to remove the spurious correlations introduced by
the dictionary confounder. For inter-dictionary bias, we propose a causal
invariance regularizer which will make DS-NER models more robust to the
perturbation of dictionaries. Experiments on four datasets and three DS-NER
models show that our method can significantly improve the performance of
DS-NER.
- Abstract(参考訳): 遠隔監視は、辞書マッチングを通じてトレーニングインスタンスを自動的に生成することで、NERのデータボトルネックに取り組む。
残念なことに、DS-NERの学習は辞書バイアスが強く、急激な相関に苦しむため、学習モデルの有効性と堅牢性を損なう。
本稿では,構造的因果モデル(scm)を用いて辞書バイアスを基礎的に説明し,そのバイアスを辞書内および辞書間バイアスに分類し,その原因を同定する。
SCMに基づいて,因果介入により非バイアスDS-NERを学習する。
辞書内バイアスについては,辞書共同設立者によるスプリアス相関を解消するためにバックドア調整を行う。
辞書間バイアスに対して、DS-NERモデルを辞書の摂動に対してより堅牢にする因果不変正則化器を提案する。
4つのデータセットと3つのDS-NERモデルによる実験により,本手法はDS-NERの性能を大幅に向上できることが示された。
関連論文リスト
- Towards Robust and Interpretable EMG-based Hand Gesture Recognition using Deep Metric Meta Learning [37.21211404608413]
本稿では,意味的かつ解釈可能な表現の作成を監督するために,EMG PRにおける深層メートル法メタラーニングへのシフトを提案する。
我々は、不正確な決定をよりよく拒否する頑健なクラス近接性に基づく信頼度推定器を導出する。
論文 参考訳(メタデータ) (2024-04-17T23:37:50Z) - ConNER: Consistency Training for Cross-lingual Named Entity Recognition [96.84391089120847]
言語間の名前付きエンティティ認識は、対象言語のデータの不足に悩まされる。
言語間NERのための新しい一貫性トレーニングフレームワークとしてConNERを提案する。
論文 参考訳(メタデータ) (2022-11-17T07:57:54Z) - D-BIAS: A Causality-Based Human-in-the-Loop System for Tackling
Algorithmic Bias [57.87117733071416]
D-BIASは、人間のループ内AIアプローチを具現化し、社会的バイアスを監査し軽減する視覚対話型ツールである。
ユーザは、因果ネットワークにおける不公平な因果関係を識別することにより、グループに対する偏見の存在を検出することができる。
それぞれのインタラクション、例えばバイアスのある因果縁の弱体化/削除は、新しい(偏りのある)データセットをシミュレートするために、新しい方法を用いている。
論文 参考訳(メタデータ) (2022-08-10T03:41:48Z) - Less Learn Shortcut: Analyzing and Mitigating Learning of Spurious
Feature-Label Correlation [44.319739489968164]
ディープニューラルネットワークは、タスクを理解するのではなく、意思決定をするためのショートカットとしてデータセットバイアスを取ることが多い。
本研究では,モデルがバイアスデータ分布から学習する単語特徴とラベルとの素早い相関に着目した。
本手法は, 偏りのある例と下級者の偏り度を定量的に評価する学習戦略である。
論文 参考訳(メタデータ) (2022-05-25T09:08:35Z) - Debiasing Convolutional Neural Networks via Meta Orthogonalization [12.198902034965442]
本研究では,このような場合において,畳み込みニューラルネットワーク(CNN)の偏りに対処する。
我々は、単語埋め込みとモデル解釈可能性のデバイアス化に関する既存の作業から構築する。
我々は,本手法がモデルバイアスを著しく軽減し,現在の逆行性脱バイアス法と競合することが実証された。
論文 参考訳(メタデータ) (2020-11-15T05:13:22Z) - Detecting Word Sense Disambiguation Biases in Machine Translation for
Model-Agnostic Adversarial Attacks [84.61578555312288]
本稿では,統計的データ特性に基づく曖昧な誤りの予測手法を提案する。
我々は,曖昧な誤りを生じさせるため,文の摂動を最小限に抑える,単純な敵攻撃戦略を開発する。
以上の結果から,曖昧さの堅牢性はドメイン間で大きく異なり,同一データ上でトレーニングされた異なるモデルが異なる攻撃に対して脆弱であることが示唆された。
論文 参考訳(メタデータ) (2020-11-03T17:01:44Z) - Improving Robustness by Augmenting Training Sentences with
Predicate-Argument Structures [62.562760228942054]
データセットバイアスに対するロバスト性を改善する既存のアプローチは、主にトレーニング目標の変更に焦点を当てている。
本稿では,学習データ中の入力文に対応する述語句構造を付加することを提案する。
特定のバイアスを対象とせずに、文の増大は、複数のバイアスに対してトランスフォーマーモデルの堅牢性を向上することを示す。
論文 参考訳(メタデータ) (2020-10-23T16:22:05Z) - ASTRAL: Adversarial Trained LSTM-CNN for Named Entity Recognition [16.43239147870092]
本稿では,モデル構造とトレーニングプロセスの両方から,現在のNER法を改善するためのLSTM-CNN(ASTRAL)システムを提案する。
提案システムは,CoNLL-03,OntoNotes 5.0,WNUT-17の3つのベンチマークで評価し,最先端の結果を得た。
論文 参考訳(メタデータ) (2020-09-02T13:15:25Z) - Towards Robustifying NLI Models Against Lexical Dataset Biases [94.79704960296108]
本稿では、語彙的データセットバイアスに対するモデル強化のための、データレベルとモデルレベルのデバイアス法の両方について検討する。
まず、データ拡張と拡張によってデータセットをデバイアスするが、この方法でモデルバイアスを完全に除去することはできないことを示す。
第2のアプローチでは、バーオブワードのサブモデルを使用して、バイアスを悪用する可能性のある機能をキャプチャし、元のモデルがこれらのバイアス付き機能を学ぶのを防ぐ。
論文 参考訳(メタデータ) (2020-05-10T17:56:10Z) - DMT: Dynamic Mutual Training for Semi-Supervised Learning [69.17919491907296]
自己学習法は通常、低信頼の擬似ラベルをフィルタリングするために単一のモデル予測の信頼性に依存する。
動的相互学習と呼ばれる動的に再重み付けされた損失関数を用いて、2つの異なるモデル間の相互学習を提案する。
実験の結果,DMTは画像分類とセマンティックセグメンテーションの両方において最先端の性能を実現することがわかった。
論文 参考訳(メタデータ) (2020-04-18T03:12:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。