論文の概要: Batch-Adaptive Annotations for Causal Inference with Complex-Embedded Outcomes
- arxiv url: http://arxiv.org/abs/2502.10605v2
- Date: Fri, 13 Jun 2025 20:12:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-17 15:15:29.895849
- Title: Batch-Adaptive Annotations for Causal Inference with Complex-Embedded Outcomes
- Title(参考訳): 複雑な組込み出力を持つ因果推論のためのバッチ適応アノテーション
- Authors: Ezinne Nwankwo, Lauri Goldkind, Angela Zhou,
- Abstract要約: 結果に対する介入の因果効果を推定することは、政策と意思決定に不可欠である。
例えば、データアノテーションやフォローアップを通じて、地道的な結果情報をコストで明らかにすることができる。
本稿では,専門家のラベルとノイズが混ざり合ったラベルを2重に頑健な因果推定器に効果的に組み合わせる方法について述べる。
- 参考スコア(独自算出の注目度): 8.821030737167343
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Estimating the causal effects of an intervention on outcomes is crucial to policy and decision-making. But often, information about outcomes can be missing or subject to non-standard measurement error. It may be possible to reveal ground-truth outcome information at a cost, for example via data annotation or follow-up; but budget constraints entail that only a fraction of the dataset can be labeled. In this setting, we optimize which data points should be sampled for outcome information and, therefore, efficient average treatment effect estimation with missing data. We do so by allocating data annotation in batches. We extend to settings where outcomes may be recorded in unstructured data that can be annotated at a cost, such as text or images, for example, in healthcare or social services. Our motivating application is a collaboration with a street outreach provider with millions of case notes, where it is possible to expertly label some, but not all, ground-truth outcomes. We demonstrate how expert labels and noisy imputed labels can be combined efficiently and responsibly into a doubly robust causal estimator. We run experiments on simulated data and two real-world datasets, including one on street outreach interventions in homelessness services, to show the versatility of our proposed method.
- Abstract(参考訳): 結果に対する介入の因果効果を推定することは、政策と意思決定に不可欠である。
しかし、多くの場合、結果に関する情報が欠落したり、標準ではない測定エラーにさらされることがある。
例えば、データアノテーションやフォローアップを通じて、根本的な結果情報をコストで公開することは可能だが、予算制約により、データセットのごく一部にラベルを付けることができる。
この設定では、結果情報に対してどのデータポイントをサンプリングすべきかを最適化し、欠落データを用いた効率的な平均処理効果推定を行う。
データアノテーションをバッチでアロケートすることで、そうします。
医療やソーシャルサービスなどにおいて、テキストや画像などのコストでアノテートできる非構造化データに結果が記録されるような設定にまで拡張します。
当社のモチベーションアプリケーションは,数百万のケースノートを持つアウトリーチプロバイダとのコラボレーションです。
著者らは,専門家のラベルと騒々しい暗黙のラベルを,二重に頑健な因果推定器に効果的に結合し,責任を負うかを実証した。
我々は、シミュレーションデータと、2つの実世界のデータセットに関する実験を行い、そのうち1つはホームレスサービスにおけるアウトリーチによる介入であり、提案手法の汎用性を示す。
関連論文リスト
- A Unifying Framework for Robust and Efficient Inference with Unstructured Data [2.07180164747172]
本稿では,非構造化データから導出されるパラメータに対して,効率的かつロバストな推論を行うための一般的な枠組みを提案する。
このアプローチをMARS(Missing At Random Structured Data)で形式化します。
我々は、記述的および因果推定の両方のための堅牢で効率的な推定器を開発し、非構造化データからの集約的および変換的予測を用いた推論のような課題に対処する。
論文 参考訳(メタデータ) (2025-05-01T04:11:25Z) - Black Box Causal Inference: Effect Estimation via Meta Prediction [56.277798874118425]
因果推論はデータセットレベルの予測問題であり,アルゴリズム設計を学習プロセスにオフロードする。
我々は,ブラックボックス因果推論 (BBCI) と呼ばれる,サンプルデータセットと効果ペアの因果効果の予測を学習することにより,ブラックボックス方式で推定器を構築する。
我々は,いくつかの因果推論問題に対して,BBCIを用いた平均治療効果(ATE)と条件平均治療効果(CATE)を正確に推定した。
論文 参考訳(メタデータ) (2025-03-07T23:43:19Z) - AMRFact: Enhancing Summarization Factuality Evaluation with AMR-Driven Negative Samples Generation [57.8363998797433]
抽象的意味表現(AMR)を用いた摂動要約を生成するフレームワークであるAMRFactを提案する。
提案手法は,AMRグラフに一貫した要約を解析し,制御された事実不整合を注入して負の例を生成し,一貫性のない事実不整合要約を高い誤差型カバレッジで生成する。
論文 参考訳(メタデータ) (2023-11-16T02:56:29Z) - Data Augmentations for Improved (Large) Language Model Generalization [17.75815547057179]
本稿では,データの因果構造を知ることによって導かれる反ファクト的データ拡張を用いて,突発的特徴に対する介入をシミュレートすることを提案する。
この戦略は,ラベルが属性と突発的に相関しているような予測問題に適していることを示す。
論文 参考訳(メタデータ) (2023-10-19T14:59:25Z) - Active Learning for Abstractive Text Summarization [50.79416783266641]
本稿では,抽象テキスト要約におけるアクティブラーニングのための最初の効果的なクエリ戦略を提案する。
ALアノテーションにおける私たちの戦略は、ROUGEと一貫性スコアの点からモデル性能を向上させるのに役立ちます。
論文 参考訳(メタデータ) (2023-01-09T10:33:14Z) - Conditional Feature Importance for Mixed Data [1.6114012813668934]
ノックオフサンプリングを用いた条件付き予測インパクト(CPI)フレームワークを開発した。
提案するワークフローは,I型エラーを制御し,高い出力を達成し,他の条件FI測定結果と一致していることを示す。
本研究は,混合データに対して,統計的に適切な,専門的な手法を開発することの必要性を強調した。
論文 参考訳(メタデータ) (2022-10-06T16:52:38Z) - D-BIAS: A Causality-Based Human-in-the-Loop System for Tackling
Algorithmic Bias [57.87117733071416]
D-BIASは、人間のループ内AIアプローチを具現化し、社会的バイアスを監査し軽減する視覚対話型ツールである。
ユーザは、因果ネットワークにおける不公平な因果関係を識別することにより、グループに対する偏見の存在を検出することができる。
それぞれのインタラクション、例えばバイアスのある因果縁の弱体化/削除は、新しい(偏りのある)データセットをシミュレートするために、新しい方法を用いている。
論文 参考訳(メタデータ) (2022-08-10T03:41:48Z) - SAIS: Supervising and Augmenting Intermediate Steps for Document-Level
Relation Extraction [51.27558374091491]
本稿では,関係抽出のための中間ステップ(SAIS)を監督し,拡張することにより,関連コンテキストやエンティティタイプをキャプチャするモデルを明示的に教えることを提案する。
そこで本提案手法は,より効果的な管理を行うため,より優れた品質の関係を抽出するだけでなく,それに対応する証拠をより正確に抽出する。
論文 参考訳(メタデータ) (2021-09-24T17:37:35Z) - Truth Discovery in Sequence Labels from Crowds [12.181422057560201]
Amazon Mechanical Turk (AMT)のようなクラウドソーシングプラットフォームは、この目的のためにデプロイされている。
アノテーションアグリゲーションにおける既存の文献は、アノテーションは独立しており、シーケンシャルなラベルアグリゲーションタスクを扱う際の課題に直面していると仮定している。
逐次ラベリングタスクにおいて,作業者が提供するアノテーションを用いて,真理ラベルを推測する最適化手法を提案する。
論文 参考訳(メタデータ) (2021-09-09T19:12:13Z) - Competency Problems: On Finding and Removing Artifacts in Language Data [50.09608320112584]
複雑な言語理解タスクでは、すべての単純な特徴相関が突発的であると論じる。
人間バイアスを考慮したコンピテンシー問題に対するデータ作成の難しさを理論的に分析します。
論文 参考訳(メタデータ) (2021-04-17T21:34:10Z) - Provably Efficient Causal Reinforcement Learning with Confounded
Observational Data [135.64775986546505]
オフラインで収集されたデータセット(観測データ)を組み込んで、オンライン環境でのサンプル効率を改善する方法について検討する。
提案手法は,観測データを効率よく組み込んだ,分解された楽観的値反復 (DOVI) アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-22T14:49:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。