論文の概要: Causal Effects of Linguistic Properties
- arxiv url: http://arxiv.org/abs/2010.12919v5
- Date: Mon, 14 Jun 2021 14:10:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-03 11:59:57.142952
- Title: Causal Effects of Linguistic Properties
- Title(参考訳): 言語特性の因果効果
- Authors: Reid Pryzant, Dallas Card, Dan Jurafsky, Victor Veitch, Dhanya Sridhar
- Abstract要約: 観察データを用いて言語特性の因果効果を推定する問題を考察する。
言語特性の因果効果を推定するアルゴリズムであるTextCauseを紹介する。
提案手法は,Amazonのレビュー感情の効果を推定する際に,関連する手法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 41.65859219291606
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider the problem of using observational data to estimate the causal
effects of linguistic properties. For example, does writing a complaint
politely lead to a faster response time? How much will a positive product
review increase sales? This paper addresses two technical challenges related to
the problem before developing a practical method. First, we formalize the
causal quantity of interest as the effect of a writer's intent, and establish
the assumptions necessary to identify this from observational data. Second, in
practice, we only have access to noisy proxies for the linguistic properties of
interest -- e.g., predictions from classifiers and lexicons. We propose an
estimator for this setting and prove that its bias is bounded when we perform
an adjustment for the text. Based on these results, we introduce TextCause, an
algorithm for estimating causal effects of linguistic properties. The method
leverages (1) distant supervision to improve the quality of noisy proxies, and
(2) a pre-trained language model (BERT) to adjust for the text. We show that
the proposed method outperforms related approaches when estimating the effect
of Amazon review sentiment on semi-simulated sales figures. Finally, we present
an applied case study investigating the effects of complaint politeness on
bureaucratic response times.
- Abstract(参考訳): 観察データを用いて言語特性の因果効果を推定する問題を考察する。
例えば、苦情を書くことが、丁寧に応答時間を短縮するのでしょうか?
積極的製品レビューで売上はどのくらい増加するのか?
本稿では,本手法の開発に先立つ2つの技術的課題について述べる。
まず,興味の因果量を著者の意図の効果として定式化し,観察データからそれを特定するために必要な仮定を確立する。
第二に、実際には興味のある言語特性、例えば分類器や語彙からの予測に対してのみノイズの多いプロキシにアクセスすることができる。
我々は,この設定に対する推定子を提案し,テキストの調整を行う際にそのバイアスが境界であることを示す。
これらの結果に基づいて,言語特性の因果効果を推定するアルゴリズムであるTextCauseを導入する。
本手法は,(1)ノイズプロキシの品質向上のための遠隔監視,(2)テキストの調整のための事前学習言語モデル(BERT)を活用する。
提案手法は,amazonのレビュー感情が半シミュレーションした販売数に与える影響を推定する上で,関連するアプローチに勝ることを示す。
最後に, 苦情の丁寧さが官僚的応答時間に及ぼす影響について検討した。
関連論文リスト
- Improving Sampling Methods for Fine-tuning SentenceBERT in Text Streams [49.3179290313959]
本研究では,選択的な微調整言語モデルの設計した7つのテキストサンプリング手法の有効性について検討した。
これらの手法がSBERTモデルの微調整に与える影響を, 4つの異なる損失関数を用いて正確に評価する。
その結果,テキストストリームの分類にはソフトマックスの損失とバッチ・オール・トリプレットの損失が特に有効であることが示唆された。
論文 参考訳(メタデータ) (2024-03-18T23:41:52Z) - Text-Transport: Toward Learning Causal Effects of Natural Language [46.75318356800048]
本研究では,任意のテキスト分布下での自然言語からの因果関係を推定するText-Transportを提案する。
我々は,テキスト・トランスポートを用いて,テキスト・ドメイン間で因果効果が著しく変化するソーシャルメディア上での現実的な発話を学習する。
論文 参考訳(メタデータ) (2023-10-31T17:56:51Z) - Automatic Counterfactual Augmentation for Robust Text Classification
Based on Word-Group Search [12.894936637198471]
一般に、ラベルと表面的関連を生じると、キーワードはショートカットと見なされ、結果として誤った予測となる。
キーワードの組み合わせの因果効果を捉え,予測に最も影響を与える組み合わせを注文する,新しいWord-Groupマイニング手法を提案する。
提案手法は,効率的なポストホック解析とビームサーチに基づいて,マイニング効果の確保と複雑さの低減を図っている。
論文 参考訳(メタデータ) (2023-07-01T02:26:34Z) - Explaining Hate Speech Classification with Model Agnostic Methods [0.9990687944474738]
本研究の目的は、ヘイトスピーチ予測と、その決定を支援するためにシステムによって生成された説明とのギャップを埋めることである。
これは、まずテキストの分類を予測し、その後、ポストホック、モデル非依存、代理的解釈可能性アプローチを提供することによって達成されている。
論文 参考訳(メタデータ) (2023-05-30T19:52:56Z) - Fairness-guided Few-shot Prompting for Large Language Models [93.05624064699965]
インコンテキスト学習は、トレーニング例、例えば順、プロンプトフォーマットのバリエーションによって、高い不安定性に悩まされる可能性がある。
ラベルや属性に対する固定的なプロンプトの予測バイアスを評価するための指標を導入する。
そこで本研究では,テキスト内学習の性能向上のための最寄りのプロンプトを特定するための,欲求探索に基づく新しい探索手法を提案する。
論文 参考訳(メタデータ) (2023-03-23T12:28:25Z) - Causal Estimation for Text Data with (Apparent) Overlap Violations [16.94058221134916]
本稿では,明らかに重複する違反が存在する場合に,因果同定の扱い方と,因果推定の堅牢性を示す。
その考え方は、教師付き表現学習を使用して、情報を保存するデータ表現を作成することである。
論文 参考訳(メタデータ) (2022-09-30T20:33:17Z) - Naturalistic Causal Probing for Morpho-Syntax [76.83735391276547]
スペインにおける実世界のデータに対する入力レベルの介入に対する自然主義的戦略を提案する。
提案手法を用いて,共同設立者から文章中の形態・症状の特徴を抽出する。
本研究では,事前学習したモデルから抽出した文脈化表現に対する性別と数字の因果効果を解析するために,本手法を適用した。
論文 参考訳(メタデータ) (2022-05-14T11:47:58Z) - Probing as Quantifying the Inductive Bias of Pre-trained Representations [99.93552997506438]
本稿では,特定のタスクに対する表現の帰納的バイアスを評価することを目的とした,探索のための新しいフレームワークを提案する。
トークン、アーク、文レベルの一連のタスクに我々のフレームワークを適用します。
論文 参考訳(メタデータ) (2021-10-15T22:01:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。