論文の概要: Conceptualizing Treatment Leakage in Text-based Causal Inference
- arxiv url: http://arxiv.org/abs/2205.00465v1
- Date: Sun, 1 May 2022 13:13:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-03 14:28:13.357856
- Title: Conceptualizing Treatment Leakage in Text-based Causal Inference
- Title(参考訳): テキストに基づく因果推論における治療漏れの概念化
- Authors: Adel Daoud and Connor T. Jerzak and Richard Johansson
- Abstract要約: 本稿では,治療指導問題について論じるとともに,それらが提起する評価課題についても論じる。
平均処理効果 (ATE) の推定値に, 処理漏れがどのようなバイアスをもたらすか, テキスト蒸留によってこのバイアスを緩和するかを示す。
- 参考スコア(独自算出の注目度): 0.1160208922584163
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Causal inference methods that control for text-based confounders are becoming
increasingly important in the social sciences and other disciplines where text
is readily available. However, these methods rely on a critical assumption that
there is no treatment leakage: that is, the text only contains information
about the confounder and no information about treatment assignment. When this
assumption does not hold, methods that control for text to adjust for
confounders face the problem of post-treatment (collider) bias. However, the
assumption that there is no treatment leakage may be unrealistic in real-world
situations involving text, as human language is rich and flexible. Language
appearing in a public policy document or health records may refer to the future
and the past simultaneously, and thereby reveal information about the treatment
assignment.
In this article, we define the treatment-leakage problem, and discuss the
identification as well as the estimation challenges it raises. Second, we
delineate the conditions under which leakage can be addressed by removing the
treatment-related signal from the text in a pre-processing step we define as
text distillation. Lastly, using simulation, we show how treatment leakage
introduces a bias in estimates of the average treatment effect (ATE) and how
text distillation can mitigate this bias.
- Abstract(参考訳): テキストベースの共同設立者を管理する因果推論手法は、テキストが容易に利用できる社会科学やその他の分野においてますます重要になっている。
しかし、これらの方法は治療の漏れがないという批判的な仮定に依存している:すなわち、テキストには共同設立者に関する情報のみが含まれ、治療の割り当てに関する情報は含まれない。
この仮定が成立しない場合、共同ファウンダーのためにテキストを調整するための制御を行う手法は、後処理(コライダー)バイアスの問題に直面します。
しかし、人間の言語が豊かで柔軟であるため、テキストを含む現実の状況では、治療漏れがないという仮定は非現実的かもしれない。
公的政策文書又は健康記録に現れる言語は、同時に未来と過去を指して、治療課題に関する情報を明らかにすることができる。
本稿では, 治療-リード・カウンセリング問題を定義し, 同一性, 推定課題について考察する。
第2に, テキストから処理関連信号を除去することにより, リークに対処できる条件を, テキスト蒸留として定義する前処理ステップで記述する。
最後に, シミュレーションを用いて, 平均治療効果 (ate) の推定における治療漏れのバイアスと, テキスト蒸留によるバイアス軽減効果を示す。
関連論文リスト
- Online Detecting LLM-Generated Texts via Sequential Hypothesis Testing by Betting [14.70496845511859]
我々は,ソースが大言語モデル(LLM)なのか人間なのかを迅速かつ正確に判定するアルゴリズムを開発した。
我々は、既存のオフライン検出技術に基づいて、ベッティングによるシーケンシャル仮説テストの手法を用いる。
提案手法の有効性を実証するために実験を行った。
論文 参考訳(メタデータ) (2024-10-29T17:55:14Z) - Causal Inference with Complex Treatments: A Survey [34.653398789722104]
因果推論は、統計学、マーケティング、医療、教育など様々な分野における説明分析と意思決定において重要な役割を果たしている。
本稿では,複雑な治療について言及し,それに対応する因果推論手法を体系的・包括的に検討する。
論文 参考訳(メタデータ) (2024-07-19T04:46:58Z) - Artificial Disfluency Detection, Uh No, Disfluency Generation for the
Masses [0.0]
本研究は,流布テキストから人工的不一致を自動的に生成する手法である LARD を提案する。
LARDは、reparandum/interregnumアノテーションスキームに基づいて、様々な種類の分散(繰り返し、置換、再起動)をシミュレートすることができる。
提案手法はフロートテキストのみを必要とするため,アノテートされた非フロートデータの要求を回避して,直接トレーニングに使用することができる。
論文 参考訳(メタデータ) (2022-11-16T22:00:02Z) - Causal Estimation for Text Data with (Apparent) Overlap Violations [16.94058221134916]
本稿では,明らかに重複する違反が存在する場合に,因果同定の扱い方と,因果推定の堅牢性を示す。
その考え方は、教師付き表現学習を使用して、情報を保存するデータ表現を作成することである。
論文 参考訳(メタデータ) (2022-09-30T20:33:17Z) - Robust and Agnostic Learning of Conditional Distributional Treatment
Effects [62.44901952244514]
条件平均治療効果(CATE)は、個々の因果効果の最適点予測である。
集約分析では、通常は分布処理効果(DTE)の測定によって対処される。
我々は,多種多様な問題に対して条件付きDTE(CDTE)を学習するための,新しい堅牢でモデルに依存しない手法を提供する。
論文 参考訳(メタデータ) (2022-05-23T17:40:31Z) - Analyzing Wrap-Up Effects through an Information-Theoretic Lens [96.02309964375983]
本研究は,ラップアップ効果と情報理論量との関係について検討する。
先行文脈における情報の分布は文末RTや節末RTで予測されることが多い。
論文 参考訳(メタデータ) (2022-03-31T17:41:03Z) - Treatment Effect Risk: Bounds and Inference [58.442274475425144]
平均的な治療効果は社会福祉の変化を測定するため、たとえ肯定的であっても、人口の約10%に悪影響を及ぼすリスクがある。
本稿では,ICT分布のリスク条件値(CVaR)として定式化されたこの重要なリスク尺度をどう評価するかを検討する。
いくつかの境界は、複素CATE関数を単一の計量に要約したものと解釈することもでき、有界であることとは無関係に興味を持つ。
論文 参考訳(メタデータ) (2022-01-15T17:21:26Z) - Medication Error Detection Using Contextual Language Models [12.100309608440103]
本稿では,BERTに基づく文脈言語モデルを用いて,テキストや音声の異常を検出する方法について述べる。
提案モデルは,患者データなどのコンテキスト情報に基づいて,テキスト依存のパターンを学習し,誤出力を予測する。
実験の結果、テキスト入力では96.63%、音声入力では79.55%の精度が得られた。
論文 参考訳(メタデータ) (2022-01-09T15:21:54Z) - A New Bandit Setting Balancing Information from State Evolution and
Corrupted Context [52.67844649650687]
本稿では,2つの確立されたオンライン学習問題と包括的フィードバックを組み合わせた,逐次的意思決定方式を提案する。
任意の瞬間にプレーする最適なアクションは、エージェントによって直接観察できない基礎となる変化状態に付随する。
本稿では,レフェリーを用いて,コンテキストブレイジットとマルチアームブレイジットのポリシーを動的に組み合わせるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-11-16T14:35:37Z) - Text Mining to Identify and Extract Novel Disease Treatments From
Unstructured Datasets [56.38623317907416]
Google Cloudを使って、NPRラジオ番組のポッドキャストのエピソードを書き起こします。
次に、テキストを体系的に前処理するためのパイプラインを構築します。
我々のモデルは、Omeprazoleが心臓熱傷の治療に役立てることに成功しました。
論文 参考訳(メタデータ) (2020-10-22T19:52:49Z) - Evaluating Factuality in Generation with Dependency-level Entailment [57.5316011554622]
本稿では,依存弧のレベルで分解するエンテーメントの新たな定式化を提案する。
このデータに基づいて訓練された依存関係弧包含モデルにより,文レベルの手法よりもパラフレーズ化や要約における現実的不整合を識別できることが示されている。
論文 参考訳(メタデータ) (2020-10-12T06:43:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。