論文の概要: Causal Estimation for Text Data with (Apparent) Overlap Violations
- arxiv url: http://arxiv.org/abs/2210.00079v1
- Date: Fri, 30 Sep 2022 20:33:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-04 13:57:19.110708
- Title: Causal Estimation for Text Data with (Apparent) Overlap Violations
- Title(参考訳): 重なり違反を伴うテキストデータの因果推定
- Authors: Lin Gui, Victor Veitch
- Abstract要約: 本稿では,明らかに重複する違反が存在する場合に,因果同定の扱い方と,因果推定の堅牢性を示す。
その考え方は、教師付き表現学習を使用して、情報を保存するデータ表現を作成することである。
- 参考スコア(独自算出の注目度): 16.94058221134916
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Consider the problem of estimating the causal effect of some attribute of a
text document; for example: what effect does writing a polite vs. rude email
have on response time? To estimate a causal effect from observational data, we
need to adjust for confounding aspects of the text that affect both the
treatment and outcome -- e.g., the topic or writing level of the text. These
confounding aspects are unknown a priori, so it seems natural to adjust for the
entirety of the text (e.g., using a transformer). However, causal
identification and estimation procedures rely on the assumption of overlap: for
all levels of the adjustment variables, there is randomness leftover so that
every unit could have (not) received treatment. Since the treatment here is
itself an attribute of the text, it is perfectly determined, and overlap is
apparently violated. The purpose of this paper is to show how to handle causal
identification and obtain robust causal estimation in the presence of apparent
overlap violations. In brief, the idea is to use supervised representation
learning to produce a data representation that preserves confounding
information while eliminating information that is only predictive of the
treatment. This representation then suffices for adjustment and can satisfy
overlap. Adapting results on non-parametric estimation, we find that this
procedure is robust to conditional outcome misestimation, yielding a low-bias
estimator with valid uncertainty quantification under weak conditions.
Empirical results show strong improvements in bias and uncertainty
quantification relative to the natural baseline.
- Abstract(参考訳): テキスト文書の属性の因果効果を推定する問題を考える:例えば: 丁寧なメールと無礼なメールを書くことは応答時間にどんな影響を及ぼすか?
観察データから因果効果を推定するには、処理と結果の両方に影響を及ぼすテキストの側面(例えば、テキストのトピックや書き込みレベル)を結合するために調整する必要があります。
これらの相違する側面は先入観として未知であるため、テキスト全体の調整(例えば、トランスフォーマー)は自然に行われるように思われる。
しかし、因果同定と推定手順は重なり合いの仮定に依存しており、調整変数の全てのレベルにおいて、全てのユニットが(受け取らない)治療を受けられるようにランダムな残差が存在する。
ここでの処理はそれ自体がテキストの属性であるため、完全に決定され、オーバーラップは明らかに違反している。
本研究の目的は,明らかに重複する違反が存在する場合に,因果同定の処理方法を示し,因果推定の堅牢性を示すことである。
簡単に言えば、教師付き表現学習を用いて、治療の予測のみ可能な情報を取り除きながら、相反する情報を保存するデータ表現を作成する。
この表現は調整のために十分であり、重複を満足することができる。
非パラメトリック推定に適応して、この手順は条件付き結果の誤推定に頑健であり、弱い条件下での妥当な不確実性定量化を伴う低バイアス推定器が得られる。
実験の結果,自然ベースラインに対するバイアスと不確かさの定量化が強く改善した。
関連論文リスト
- AMRFact: Enhancing Summarization Factuality Evaluation with AMR-Driven Negative Samples Generation [57.8363998797433]
抽象的意味表現(AMR)を用いた摂動要約を生成するフレームワークであるAMRFactを提案する。
提案手法は,AMRグラフに一貫した要約を解析し,制御された事実不整合を注入して負の例を生成し,一貫性のない事実不整合要約を高い誤差型カバレッジで生成する。
論文 参考訳(メタデータ) (2023-11-16T02:56:29Z) - Interpretable Automatic Fine-grained Inconsistency Detection in Text
Summarization [56.94741578760294]
本研究の目的は, 要約中の事実誤りの微粒化を予測し, 微粒化不整合検出の課題を提案することである。
要約における現実的不整合の検査方法に触発され,解析可能な微粒不整合検出モデルであるFinGrainFactを提案する。
論文 参考訳(メタデータ) (2023-05-23T22:11:47Z) - Improving Faithfulness of Abstractive Summarization by Controlling
Confounding Effect of Irrelevant Sentences [38.919090721583075]
事実整合性は、共同創設者として機能する入力テキストの無関係な部分によって引き起こされる可能性があることを示す。
そこで我々は,人間が記述した関連文を利用できる場合に利用することにより,そのような欠点を抑えるためのシンプルなマルチタスクモデルを設計する。
提案手法は,AnswerSumm citepfabbri 2021answersummデータセットの強いベースラインに対して,忠実度スコアを20%向上させる。
論文 参考訳(メタデータ) (2022-12-19T18:51:06Z) - Revisiting text decomposition methods for NLI-based factuality scoring
of summaries [9.044665059626958]
細粒度分解が必ずしも事実性スコアの勝利戦略であるとは限らないことを示す。
また,従来提案されていたエンテーメントに基づくスコアリング手法の小さな変更により,性能が向上することを示した。
論文 参考訳(メタデータ) (2022-11-30T09:54:37Z) - Neuro-Symbolic Entropy Regularization [78.16196949641079]
構造化予測では、目的は構造化されたオブジェクトをエンコードする多くの出力変数を共同で予測することである。
エントロピー正則化(Entropy regularization)という1つのアプローチは、決定境界が低確率領域にあるべきであることを示唆している。
我々は、モデルが有効対象を確実に予測することを奨励する損失、ニューロシンボリックエントロピー正規化を提案する。
論文 参考訳(メタデータ) (2022-01-25T06:23:10Z) - Counterfactual Invariance to Spurious Correlations: Why and How to Pass
Stress Tests [87.60900567941428]
素早い相関」とは、アナリストが重要とすべきでないと考える入力データのある側面に対するモデルの依存である。
機械学習では、これらにはノウ・イ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ」という特徴がある。
因果推論ツールを用いたストレステストについて検討した。
論文 参考訳(メタデータ) (2021-05-31T14:39:38Z) - Deconfounding Scores: Feature Representations for Causal Effect
Estimation with Weak Overlap [140.98628848491146]
推定対象の偏りを伴わずに高い重なりを生じさせる,デコンファウンディングスコアを導入する。
分離スコアは観測データで識別可能なゼロ共分散条件を満たすことを示す。
特に,この手法が標準正規化の魅力的な代替となることを示す。
論文 参考訳(メタデータ) (2021-04-12T18:50:11Z) - Double Perturbation: On the Robustness of Robustness and Counterfactual
Bias Evaluation [109.06060143938052]
テストデータセットを超えたモデル弱点を明らかにするための"ダブル摂動"フレームワークを提案する。
この枠組みを,モデルの頑健さと英語における反事実バイアスの分析に使用される2つの摂動に基づくアプローチに応用する。
論文 参考訳(メタデータ) (2021-04-12T06:57:36Z) - Statistically significant detection of semantic shifts using contextual
word embeddings [7.439525715543974]
文脈的単語埋め込みと順列に基づく統計的テストを組み合わせて意味的変化を推定する手法を提案する。
本手法の性能をシミュレーションで実証し,偽陽性を抑圧することにより,一貫して高精度に達成する。
また,SemEval-2020 Task 1 と Liverpool FC subreddit corpus の実際のデータも分析した。
論文 参考訳(メタデータ) (2021-04-08T13:58:54Z) - Causal Effects of Linguistic Properties [41.65859219291606]
観察データを用いて言語特性の因果効果を推定する問題を考察する。
言語特性の因果効果を推定するアルゴリズムであるTextCauseを紹介する。
提案手法は,Amazonのレビュー感情の効果を推定する際に,関連する手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-10-24T15:43:37Z) - Semantic Neighborhood-Aware Deep Facial Expression Recognition [14.219890078312536]
意味的摂動を定式化し,訓練中に信頼できないサンプルを選択する新しい手法を提案する。
実験の結果,提案手法の有効性が示され,その結果が得られた。
論文 参考訳(メタデータ) (2020-04-27T11:48:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。