論文の概要: HypoNLI: Exploring the Artificial Patterns of Hypothesis-only Bias in
Natural Language Inference
- arxiv url: http://arxiv.org/abs/2003.02756v2
- Date: Mon, 15 Mar 2021 02:47:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-26 06:15:41.035411
- Title: HypoNLI: Exploring the Artificial Patterns of Hypothesis-only Bias in
Natural Language Inference
- Title(参考訳): hypoNLI: 自然言語推論における仮説のみのバイアスの人工パターンの探索
- Authors: Tianyu Liu, Xin Zheng, Baobao Chang and Zhifang Sui
- Abstract要約: 仮説のみのバイアスの観点から、逆例を導出する。
このような仮説のみのバイアスを軽減するために、人工パターンモデリングを利用する2つのデバイアス手法について検討する。
- 参考スコア(独自算出の注目度): 38.14399396661415
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many recent studies have shown that for models trained on datasets for
natural language inference (NLI), it is possible to make correct predictions by
merely looking at the hypothesis while completely ignoring the premise. In this
work, we manage to derive adversarial examples in terms of the hypothesis-only
bias and explore eligible ways to mitigate such bias. Specifically, we extract
various phrases from the hypotheses (artificial patterns) in the training sets,
and show that they have been strong indicators to the specific labels. We then
figure out `hard' and `easy' instances from the original test sets whose labels
are opposite to or consistent with those indications. We also set up baselines
including both pretrained models (BERT, RoBERTa, XLNet) and competitive
non-pretrained models (InferSent, DAM, ESIM). Apart from the benchmark and
baselines, we also investigate two debiasing approaches which exploit the
artificial pattern modeling to mitigate such hypothesis-only bias:
down-sampling and adversarial training. We believe those methods can be treated
as competitive baselines in NLI debiasing tasks.
- Abstract(参考訳): 最近の多くの研究は、自然言語推論(NLI)のためのデータセットで訓練されたモデルに対して、仮説を単に見ながら前提を完全に無視することで正しい予測を行うことができることを示した。
本研究は,仮説のみのバイアスの観点から,敵対的事例を導出し,そのバイアスを緩和するための適格な方法を探索する。
具体的には、トレーニングセットの仮説(人工パターン)から様々なフレーズを抽出し、それらが特定のラベルに対して強い指標であることを示す。
次に、ラベルがそれらの表示と反対または一致している元のテストセットから、`hard' と `easy' のインスタンスを見つけます。
また,事前学習モデル (BERT, RoBERTa, XLNet) と非事前学習モデル (InferSent, DAM, ESIM) の両方を含むベースラインを設定した。
ベンチマークとベースラインとは別に,このような仮説のみのバイアスを緩和するために,人工パターンモデリングを利用する2つのデバイアスアプローチについても検討した。
我々は,これらの手法をNLI脱バイアスタスクの競争ベースラインとして扱うことができると考えている。
関連論文リスト
- Automatically Identifying Semantic Bias in Crowdsourced Natural Language
Inference Datasets [78.6856732729301]
NLIデータセットに仮説を組み込んだ学習空間に"バイアスクラスタ"を見つけるために,モデル駆動で教師なしの手法を導入する。
データセットの仮説分布のセマンティックバイアスを改善するために、介入と追加のラベリングを行うことができる。
論文 参考訳(メタデータ) (2021-12-16T22:49:01Z) - A Generative Approach for Mitigating Structural Biases in Natural
Language Inference [24.44419010439227]
本研究では、NLIタスクを生成タスクとして再構成し、モデルが入力とラベルのバイアス付きサブセットに条件付けされるようにする。
このアプローチは大量のバイアスに対して非常に堅牢であることを示す。
生成モデルは訓練が困難であり、識別ベースラインよりも一般的にはパフォーマンスが悪くなっている。
論文 参考訳(メタデータ) (2021-08-31T17:59:45Z) - Bayesian analysis of the prevalence bias: learning and predicting from
imbalanced data [10.659348599372944]
本稿では,モデル学習のための理論的および計算的枠組みと,有病率バイアスの存在下での予測について述べる。
原則的なトレーニング損失の代替として,要約曲線から操作点を選択することで,テスト時の手順を補完するものだ。
バックプロパゲーションを用いた(深い)学習の現在のパラダイムにシームレスに統合され、ベイズモデルと自然に結合する。
論文 参考訳(メタデータ) (2021-07-31T14:36:33Z) - Double Perturbation: On the Robustness of Robustness and Counterfactual
Bias Evaluation [109.06060143938052]
テストデータセットを超えたモデル弱点を明らかにするための"ダブル摂動"フレームワークを提案する。
この枠組みを,モデルの頑健さと英語における反事実バイアスの分析に使用される2つの摂動に基づくアプローチに応用する。
論文 参考訳(メタデータ) (2021-04-12T06:57:36Z) - Exploring Lexical Irregularities in Hypothesis-Only Models of Natural
Language Inference [5.283529004179579]
自然言語推論(NLI)またはテキスト関連認識(RTE)は、文のペア間の関係を予測するタスクです。
包含を理解するモデルは前提と仮説の両方をエンコードするべきである。
Poliakらによる実験。
仮説でのみ観察されたパターンに対するこれらのモデルの強い好みを明らかにした。
論文 参考訳(メタデータ) (2021-01-19T01:08:06Z) - Understanding Classifier Mistakes with Generative Models [88.20470690631372]
ディープニューラルネットワークは教師付き学習タスクに有効であるが、脆弱であることが示されている。
本稿では、生成モデルを利用して、分類器が一般化に失敗するインスタンスを特定し、特徴付ける。
我々のアプローチは、トレーニングセットのクラスラベルに依存しないため、半教師付きでトレーニングされたモデルに適用できる。
論文 参考訳(メタデータ) (2020-10-05T22:13:21Z) - L2R2: Leveraging Ranking for Abductive Reasoning [65.40375542988416]
学習システムの帰納的推論能力を評価するために,帰納的自然言語推論タスク(alpha$NLI)を提案する。
新たな$L2R2$アプローチは、Learning-to-rankフレームワークの下で提案されている。
ARTデータセットの実験は、公開リーダボードの最先端に到達します。
論文 参考訳(メタデータ) (2020-05-22T15:01:23Z) - Towards Robustifying NLI Models Against Lexical Dataset Biases [94.79704960296108]
本稿では、語彙的データセットバイアスに対するモデル強化のための、データレベルとモデルレベルのデバイアス法の両方について検討する。
まず、データ拡張と拡張によってデータセットをデバイアスするが、この方法でモデルバイアスを完全に除去することはできないことを示す。
第2のアプローチでは、バーオブワードのサブモデルを使用して、バイアスを悪用する可能性のある機能をキャプチャし、元のモデルがこれらのバイアス付き機能を学ぶのを防ぐ。
論文 参考訳(メタデータ) (2020-05-10T17:56:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。