論文の概要: Proxy-Guided Measurement Calibration
- arxiv url: http://arxiv.org/abs/2603.09288v1
- Date: Tue, 10 Mar 2026 07:15:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-11 15:25:24.119804
- Title: Proxy-Guided Measurement Calibration
- Title(参考訳): Proxy-Guided Measurement Calibration
- Authors: Saketh Vishnubhatla, Shu Wan, Andre Harrison, Adrienne Raglin, Huan Liu,
- Abstract要約: 結果の誤校正の問題について検討し,提案手法をプロキシ変数で導いた,系統的な誤りを推定・修正するためのフレームワークを提案する。
因果グラフを用いてデータ生成過程をモデル化し,真の結果を誘導する潜時コンテンツ変数と系統的エラーを誘発する潜時バイアス変数とを分離する。
- 参考スコア(独自算出の注目度): 7.842603902533572
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Aggregate outcome variables collected through surveys and administrative records are often subject to systematic measurement error. For instance, in disaster loss databases, county-level losses reported may differ from the true damages due to variations in on-the-ground data collection capacity, reporting practices, and event characteristics. Such miscalibration complicates downstream analysis and decision-making. We study the problem of outcome miscalibration and propose a framework guided by proxy variables for estimating and correcting the systematic errors. We model the data-generating process using a causal graph that separates latent content variables driving the true outcome from the latent bias variables that induce systematic errors. The key insight is that proxy variables that depend on the true outcome but are independent of the bias mechanism provide identifying information for quantifying the bias. Leveraging this structure, we introduce a two-stage approach that utilizes variational autoencoders to disentangle content and bias latents, enabling us to estimate the effect of bias on the outcome of interest. We analyze the assumptions underlying our approach and evaluate it on synthetic data, semi-synthetic datasets derived from randomized trials, and a real-world case study of disaster loss reporting.
- Abstract(参考訳): 調査や管理記録を通じて収集された結果変数の集約は、しばしば体系的な測定誤差を被る。
例えば、災害被害データベースにおいて、報告された郡レベルの損失は、地上のデータ収集能力の変動、報告の慣行、イベントの特徴による真の損害と異なる可能性がある。
このような誤解は下流の分析と意思決定を複雑にする。
結果の誤校正の問題について検討し,提案手法をプロキシ変数で導いた,系統的な誤りを推定・修正するためのフレームワークを提案する。
因果グラフを用いてデータ生成過程をモデル化し,真の結果を誘導する潜時コンテンツ変数と系統的エラーを誘発する潜時バイアス変数とを分離する。
鍵となる洞察は、真の結果に依存するがバイアスメカニズムに依存しないプロキシ変数がバイアスを定量化するための識別情報を提供するということである。
この構造を利用して、変分オートエンコーダを用いた2段階のアプローチを導入し、コンテンツとバイアス潜在者をアンタングルし、バイアスが利害関係に与える影響を推定する。
提案手法の前提となる仮定を解析し, ランダム化試験から得られた半合成データセット, 災害報告の実例を用いて評価する。
関連論文リスト
- Data Fusion for Partial Identification of Causal Effects [62.56890808004615]
本稿では,研究者が重要な疑問に答えられるような,新しい部分的識別フレームワークを提案する。
因果効果は肯定的か否定的か?
本研究の枠組みをSTARプロジェクトに適用し,第3級の標準試験性能に対する教室規模の影響について検討する。
論文 参考訳(メタデータ) (2025-05-30T07:13:01Z) - Estimating Misreporting in the Presence of Genuine Modification: A Causal Perspective [11.438018798893113]
リソースの割り当てを知らせるためにMLモデルを使用する場合、エージェントは、より良い結果を得るために、戦略的に機能を変更するインセンティブを持つ可能性がある。
そこで本研究では, エージェントがどの程度の頻度で誤レポートしているかを, 真に変化した特徴を識別し, 定量化するための因果的動機付け手法を提案する。
論文 参考訳(メタデータ) (2025-05-29T19:06:30Z) - Local Learning for Covariate Selection in Nonparametric Causal Effect Estimation with Latent Variables [17.154150811381907]
非実験データから因果効果を推定することは、科学の多くの分野における根本的な問題である。
非パラメトリック因果効果推定における共変量選択のための新しい局所学習手法を提案する。
我々は、合成データと実世界のデータの両方に関する広範な実験を通じて、アルゴリズムを検証する。
論文 参考訳(メタデータ) (2024-11-25T12:08:54Z) - Interpretable Causal Inference for Analyzing Wearable, Sensor, and Distributional Data [62.56890808004615]
本研究では,信頼性とロバストな意思決定を確実にする,分散データ解析の解釈可能な手法を開発した。
ADD MALTSの有用性について,糖尿病リスク軽減のための連続グルコースモニターの有効性について検討した。
論文 参考訳(メタデータ) (2023-12-17T00:42:42Z) - Simultaneous Improvement of ML Model Fairness and Performance by
Identifying Bias in Data [1.76179873429447]
トレーニング前にデータセットから削除すべき特定の種類のバイアスを記述したインスタンスを検出できるデータ前処理手法を提案する。
特に、類似した特徴を持つインスタンスが存在するが、保護属性の変動に起因するラベルが異なる問題設定では、固有のバイアスがデータセット内で引き起こされる、と主張する。
論文 参考訳(メタデータ) (2022-10-24T13:04:07Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - On Disentangled Representations Learned From Correlated Data [59.41587388303554]
相関データに対する最も顕著な絡み合うアプローチの挙動を解析することにより、現実のシナリオにギャップを埋める。
本研究では,データセットの体系的相関が学習され,潜在表現に反映されていることを示す。
また、トレーニング中の弱い監督や、少数のラベルで事前訓練されたモデルを修正することで、これらの潜伏相関を解消する方法を実証する。
論文 参考訳(メタデータ) (2020-06-14T12:47:34Z) - Stable Prediction via Leveraging Seed Variable [73.9770220107874]
従来の機械学習手法は、非因果変数によって誘導されるトレーニングデータにおいて、微妙に刺激的な相関を利用して予測する。
本研究では, 条件付き独立性テストに基づくアルゴリズムを提案し, 種子変数を先行変数とする因果変数を分離し, 安定な予測に採用する。
我々のアルゴリズムは、安定した予測のための最先端の手法より優れている。
論文 参考訳(メタデータ) (2020-06-09T06:56:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。