論文の概要: Uninformative Input Features and Counterfactual Invariance: Two
Perspectives on Spurious Correlations in Natural Language
- arxiv url: http://arxiv.org/abs/2204.04487v1
- Date: Sat, 9 Apr 2022 14:46:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-12 14:34:48.079246
- Title: Uninformative Input Features and Counterfactual Invariance: Two
Perspectives on Spurious Correlations in Natural Language
- Title(参考訳): 非形式的入力特徴と対実的不変性:自然言語の純粋相関に関する2つの視点
- Authors: Jacob Eisenstein
- Abstract要約: Spurious correlations is a threat to the trustworthiness of natural language processing systems。
本稿では,PCFGにおける特徴ラベル相関を生じさせる3つの異なる条件を解析する。
入力特徴はラベルと非常に稀な状況において個別に相関するので、真の堅牢性を脅かす刺激的な相関を識別するためにドメイン知識を適用する必要がある。
- 参考スコア(独自算出の注目度): 19.416033815407804
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Spurious correlations are a threat to the trustworthiness of natural language
processing systems, motivating research into methods for identifying and
eliminating them. Gardner et al (2021) argue that the compositional nature of
language implies that \emph{all} correlations between labels and individual
input features are spurious. This paper analyzes this proposal in the context
of a toy example, demonstrating three distinct conditions that can give rise to
feature-label correlations in a simple PCFG. Linking the toy example to a
structured causal model shows that (1) feature-label correlations can arise
even when the label is invariant to interventions on the feature, and (2)
feature-label correlations may be absent even when the label is sensitive to
interventions on the feature. Because input features will be individually
correlated with labels in all but very rare circumstances, domain knowledge
must be applied to identify spurious correlations that pose genuine robustness
threats.
- Abstract(参考訳): スプリアス相関は自然言語処理システムの信頼性に対する脅威であり、それらを特定し排除する方法の研究の動機となっている。
gardner et al (2021) は、言語の構成的性質から、ラベルと個々の入力特徴の相関関係は散発的であると主張している。
本稿では,この提案をおもちゃの例の文脈で分析し,簡単なPCFGにおいて特徴ラベル相関を生じさせる3つの異なる条件を示す。
おもちゃの例を構造化因果モデルにリンクすると,(1)ラベルが特徴への介入に不変である場合でも特徴ラベル相関が生じることが示され,(2)ラベルが特徴への介入に敏感である場合でも特徴ラベル相関は欠落する可能性がある。
入力特徴はラベルと非常に稀な状況において個別に相関するので、真の堅牢性を脅かす刺激的な相関を識別するためにドメイン知識を適用する必要がある。
関連論文リスト
- Learning Robust Classifiers with Self-Guided Spurious Correlation Mitigation [26.544938760265136]
ディープニューラル分類器は、入力のスプリアス属性とターゲットの間のスプリアス相関に頼り、予測を行う。
本稿では,自己誘導型スプリアス相関緩和フレームワークを提案する。
予測行動の違いを識別するために分類器の訓練を行うことで,事前知識を必要とせず,素因関係への依存を軽減できることを示す。
論文 参考訳(メタデータ) (2024-05-06T17:12:21Z) - Estimating the Causal Effects of Natural Logic Features in Transformer-Based NLI Models [16.328341121232484]
文脈介入の効果を測定するために因果効果推定手法を適用した。
本研究はトランスフォーマーの無関係な変化に対する堅牢性と影響の高い変化に対する感受性について検討する。
論文 参考訳(メタデータ) (2024-04-03T10:22:35Z) - Understanding and Mitigating Spurious Correlations in Text
Classification with Neighborhood Analysis [69.07674653828565]
機械学習モデルは、トレーニングセットに存在するが一般的な状況では当てはまらない急激な相関を利用する傾向にある。
本稿では, 周辺分析と呼ばれる新しい視点から, 突発的相関がもたらす意味について考察する。
本稿では,テキスト分類における素早い相関を緩和する正規化手法であるNFL(doN't Forget your Language)を提案する。
論文 参考訳(メタデータ) (2023-05-23T03:55:50Z) - Are All Spurious Features in Natural Language Alike? An Analysis through
a Causal Lens [23.41097494945868]
NLPでは、望ましくない特徴-ラベル相関を非公式に表現するために「スプリアス相関」という用語が用いられてきた。
我々は、因果モデルと必要と十分性の確率を用いて、この区別を定式化する。
論文 参考訳(メタデータ) (2022-10-25T13:31:28Z) - Nuisances via Negativa: Adjusting for Spurious Correlations via Data Augmentation [32.66196135141696]
ラベルとの関係の異なる特徴はニュアンスである。
ニュアンスとラベルの関係を利用するモデルは、これらの関係が変化するとパフォーマンスが低下する。
我々は,意味論に関する知識をデータに悪用して利用するためのアプローチを開発する。
論文 参考訳(メタデータ) (2022-10-04T01:40:31Z) - Fairness and robustness in anti-causal prediction [73.693135253335]
分散シフトと公平性に対するロバストさは、機械学習モデルに必要な2つの重要なデシラタとして独立に現れている。
これら2つのデシダラタは関連しているように見えるが、実際にはその関連性はしばしば不明である。
この観点から見れば、共通フェアネス基準(分離)とロバストネスの共通概念との明確な関係を描いています。
論文 参考訳(メタデータ) (2022-09-20T02:41:17Z) - Context-LGM: Leveraging Object-Context Relation for Context-Aware Object
Recognition [48.5398871460388]
本稿では,オブジェクト・コンテキスト関係を階層的にモデル化する新しいコンテキスト潜在生成モデル(Contextual Latent Generative Model,Context-LGM)を提案する。
文脈的特徴を推定するために、変数自動エンコーダ(VAE)の目的関数を再構成し、対象物に対する後続条件付き分布として文脈的特徴を学習する。
本手法の有効性は,2つのコンテキスト認識オブジェクト認識タスクにおける最先端性能によって検証される。
論文 参考訳(メタデータ) (2021-10-08T11:31:58Z) - Label Distribution Amendment with Emotional Semantic Correlations for
Facial Expression Recognition [69.18918567657757]
意味空間における表現間の相関を利用して,各顔画像のラベル分布を補正する手法を提案する。
各画像のセマンティックグラフとタスククラス関連グラフを比較することにより、そのラベル分布の信頼性を評価する。
実験により,提案手法は最先端手法と比較した場合よりも有効であることが示された。
論文 参考訳(メタデータ) (2021-07-23T07:46:14Z) - Measuring Association Between Labels and Free-Text Rationales [60.58672852655487]
解釈可能なNLPでは、説明された例に対するモデルの意思決定プロセスを反映した忠実な理性が必要です。
情報抽出型タスクに対する忠実な抽出合理化のための既存のモデルであるパイプラインは、自由テキスト合理化を必要とするタスクに確実に拡張されないことを示す。
我々は、信頼が確立されていない自由文合理化のための、広く使われている高性能モデルのクラスである、共同予測と合理化のモデルに目を向ける。
論文 参考訳(メタデータ) (2020-10-24T03:40:56Z) - Learning to Decouple Relations: Few-Shot Relation Classification with
Entity-Guided Attention and Confusion-Aware Training [49.9995628166064]
本稿では,2つのメカニズムを備えたモデルであるCTEGを提案する。
一方、注意を誘導するEGA機構を導入し、混乱を引き起こす情報をフィルタリングする。
一方,コンフュージョン・アウェア・トレーニング(CAT)法は,関係の識別を明示的に学習するために提案されている。
論文 参考訳(メタデータ) (2020-10-21T11:07:53Z) - Identifying Spurious Correlations for Robust Text Classification [9.457737910527829]
そこで本研究では,テキスト分類におけるスプリアスと真の相関を区別する手法を提案する。
我々は、治療効果推定器から得られる特徴を用いて、突発的な相関を「遺伝子」と区別する。
4つのデータセットの実験は、このアプローチを使って特徴の選択を知らせることが、より堅牢な分類につながることを示唆している。
論文 参考訳(メタデータ) (2020-10-06T03:49:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。