Fugu-MT 論文翻訳(概要): Proximal Causal Inference With Text Data

論文の概要: Proximal Causal Inference With Text Data

arxiv url: http://arxiv.org/abs/2401.06687v3
Date: Tue, 29 Oct 2024 15:12:52 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:30.308036
Title: Proximal Causal Inference With Text Data
Title（参考訳）: テキストデータを用いた近因性推論
Authors: Jacob M. Chen, Rohit Bhattacharya, Katherine A. Keith,
Abstract要約: 本稿では,2つの前処理テキストデータを用いた因果推論手法を提案し,2つのゼロショットモデルを用いて2つのプロキシを推定し,それらのプロキシを近位g-形式に適用する。ゼロショット予測のためのMIMIC-IIIおよびオープン大言語モデルを用いた実世界の臨床ノートを用いて, 合成および半合成条件下での手法の評価を行った。
参考スコア（独自算出の注目度）: 5.796482272333648
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Recent text-based causal methods attempt to mitigate confounding bias by estimating proxies of confounding variables that are partially or imperfectly measured from unstructured text data. These approaches, however, assume analysts have supervised labels of the confounders given text for a subset of instances, a constraint that is sometimes infeasible due to data privacy or annotation costs. In this work, we address settings in which an important confounding variable is completely unobserved. We propose a new causal inference method that uses two instances of pre-treatment text data, infers two proxies using two zero-shot models on the separate instances, and applies these proxies in the proximal g-formula. We prove, under certain assumptions about the instances of text and accuracy of the zero-shot predictions, that our method of inferring text-based proxies satisfies identification conditions of the proximal g-formula while other seemingly reasonable proposals do not. To address untestable assumptions associated with our method and the proximal g-formula, we further propose an odds ratio falsification heuristic that flags when to proceed with downstream effect estimation using the inferred proxies. We evaluate our method in synthetic and semi-synthetic settings -- the latter with real-world clinical notes from MIMIC-III and open large language models for zero-shot prediction -- and find that our method produces estimates with low bias. We believe that this text-based design of proxies allows for the use of proximal causal inference in a wider range of scenarios, particularly those for which obtaining suitable proxies from structured data is difficult.
Abstract（参考訳）: 最近のテキストベースの因果的手法は、非構造化テキストデータから部分的にあるいは不完全に測定された共起変数のプロキシを推定することにより、共起バイアスを軽減しようとする。しかしこれらのアプローチは、データプライバシやアノテーションのコストのために時には不可能な制約であるインスタンスのサブセットについて、共同創設者のラベルを監督していると、アナリストは仮定している。本研究では,重要なコンバウンディング変数が完全にオブザーブドされていない設定に対処する。本稿では,2つの前処理テキストデータを用いた因果推論手法を提案し,2つのゼロショットモデルを用いて2つのプロキシを推定し,それらのプロキシを近位g-形式に適用する。ゼロショット予測のテキストの事例と精度について、ある仮定の下では、テキストベースのプロキシを推定する方法は、近点g-ホルマラの識別条件を満たすが、他の一見妥当な提案は満たさないことを証明している。さらに,本手法と近似g-形式に関する証明不可能な仮定に対処するために,推定プロキシを用いて下流効果推定を行う際にフラグを付けるオッズ比のファルシフィケーションヒューリスティックを提案する。提案手法は,MIMIC-IIIとゼロショット予測のためのオープン大言語モデルによる実世界の臨床記録と,合成および半合成条件で評価し,低バイアスで推定結果が得られた。このテキストベースのプロキシの設計により、より広い範囲のシナリオ、特に構造化データから適切なプロキシを取得することは困難である。

関連論文リスト

Density Ratio-based Proxy Causal Learning Without Density Ratios [26.49087216375106]
本稿では,隠れた共起の存在下で観測データから因果効果を推定することを目的とした,プロキシ因果学習(PCL)の設定に対処する。プロキシ変数の因果効果を推定する2つの手法が提案されている。本稿では, 比比の明示的推定を回避し, 連続・高次元処理に適した第2の手法の実用的, 効果的な実装を提案する。
論文参考訳（メタデータ） (2025-03-11T12:27:54Z)
Automating the Selection of Proxy Variables of Unmeasured Confounders [16.773841751009748]
既存のプロキシ変数推定器を拡張して、治療と結果の間に複数の未測定の共同創設者が存在するシナリオに対応する。本稿では、プロキシ変数の選択と因果効果の偏りのない推定のための2つのデータ駆動手法を提案する。
論文参考訳（メタデータ） (2024-05-25T08:53:49Z)
Onboard Out-of-Calibration Detection of Deep Learning Models using Conformal Prediction [4.856998175951948]
本研究では,共形予測アルゴリズムが深層学習モデルの不確かさと関係があることを示し,この関係が深層学習モデルが校正外であるかどうかを検出するのに有効であることを示す。モデル不確かさと共形予測セットの平均サイズに関連する校正外検出手順を示す。
論文参考訳（メタデータ） (2024-05-04T11:05:52Z)
Prototype-based Aleatoric Uncertainty Quantification for Cross-modal Retrieval [139.21955930418815]
クロスモーダル検索手法は、共通表現空間を共同学習することにより、視覚と言語モダリティの類似性関係を構築する。しかし、この予測は、低品質なデータ、例えば、腐敗した画像、速いペースの動画、詳細でないテキストによって引き起こされるアレタリック不確実性のために、しばしば信頼性が低い。本稿では, 原型に基づくAleatoric Uncertainity Quantification (PAU) フレームワークを提案する。
論文参考訳（メタデータ） (2023-09-29T09:41:19Z)
Interpretable Automatic Fine-grained Inconsistency Detection in Text Summarization [56.94741578760294]
本研究の目的は, 要約中の事実誤りの微粒化を予測し, 微粒化不整合検出の課題を提案することである。要約における現実的不整合の検査方法に触発され,解析可能な微粒不整合検出モデルであるFinGrainFactを提案する。
論文参考訳（メタデータ） (2023-05-23T22:11:47Z)
Simulation-based, Finite-sample Inference for Privatized Data [14.218697973204065]
本稿では,統計的に有効な信頼区間と仮説テストを生成するためのシミュレーションベースの"repro sample"手法を提案する。本手法は様々な個人推論問題に適用可能であることを示す。
論文参考訳（メタデータ） (2023-03-09T15:19:31Z)
Towards Fine-Grained Information: Identifying the Type and Location of Translation Errors [80.22825549235556]
既存のアプローチでは、エラーの位置と型を同期的に考慮することはできない。我々はtextbf の追加と textbfomission エラーを予測するために FG-TED モデルを構築した。実験により,本モデルではエラータイプと位置の同時同定が可能であり,最先端の結果が得られた。
論文参考訳（メタデータ） (2023-02-17T16:20:33Z)
ADDMU: Detection of Far-Boundary Adversarial Examples with Data and Model Uncertainty Estimation [125.52743832477404]
AED(Adversarial Examples Detection)は、敵攻撃に対する重要な防御技術である。本手法は, 正逆検出とFB逆検出の2種類の不確実性推定を組み合わせた新しい手法である textbfADDMU を提案する。提案手法は,各シナリオにおいて,従来の手法よりも3.6と6.0のEmphAUC点が優れていた。
論文参考訳（メタデータ） (2022-10-22T09:11:12Z)
A Unified Evaluation of Textual Backdoor Learning: Frameworks and Benchmarks [72.7373468905418]
我々は,テキストバックドア学習の実装と評価を促進するオープンソースツールキットOpenBackdoorを開発した。また,単純なクラスタリングに基づく防御ベースラインであるCUBEを提案する。
論文参考訳（メタデータ） (2022-06-17T02:29:23Z)
Approximate Conditional Coverage via Neural Model Approximations [0.030458514384586396]
実験的に信頼性の高い近似条件付きカバレッジを得るためのデータ駆動手法を解析する。我々は、限界範囲のカバレッジ保証を持つ分割型代替案で、実質的な(そして、そうでない)アンダーカバーの可能性を実証する。
論文参考訳（メタデータ） (2022-05-28T02:59:05Z)
Double Perturbation: On the Robustness of Robustness and Counterfactual Bias Evaluation [109.06060143938052]
テストデータセットを超えたモデル弱点を明らかにするための"ダブル摂動"フレームワークを提案する。この枠組みを,モデルの頑健さと英語における反事実バイアスの分析に使用される2つの摂動に基づくアプローチに応用する。
論文参考訳（メタデータ） (2021-04-12T06:57:36Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。