論文の概要: Estimating Misreporting in the Presence of Genuine Modification: A Causal Perspective
- arxiv url: http://arxiv.org/abs/2505.23954v1
- Date: Thu, 29 May 2025 19:06:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-02 19:47:52.638606
- Title: Estimating Misreporting in the Presence of Genuine Modification: A Causal Perspective
- Title(参考訳): 遺伝子改変の有無を推定する:因果的視点
- Authors: Dylan Zapzalka, Trenton Chang, Lindsay Warrenburg, Sae-Hwan Park, Daniel K. Shenfeld, Ravi B. Parikh, Jenna Wiens, Maggie Makar,
- Abstract要約: リソースの割り当てを知らせるためにMLモデルを使用する場合、エージェントは、より良い結果を得るために、戦略的に機能を変更するインセンティブを持つ可能性がある。
そこで本研究では, エージェントがどの程度の頻度で誤レポートしているかを, 真に変化した特徴を識別し, 定量化するための因果的動機付け手法を提案する。
- 参考スコア(独自算出の注目度): 11.438018798893113
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In settings where ML models are used to inform the allocation of resources, agents affected by the allocation decisions might have an incentive to strategically change their features to secure better outcomes. While prior work has studied strategic responses broadly, disentangling misreporting from genuine modification remains a fundamental challenge. In this paper, we propose a causally-motivated approach to identify and quantify how much an agent misreports on average by distinguishing deceptive changes in their features from genuine modification. Our key insight is that, unlike genuine modification, misreported features do not causally affect downstream variables (i.e., causal descendants). We exploit this asymmetry by comparing the causal effect of misreported features on their causal descendants as derived from manipulated datasets against those from unmanipulated datasets. We formally prove identifiability of the misreporting rate and characterize the variance of our estimator. We empirically validate our theoretical results using a semi-synthetic and real Medicare dataset with misreported data, demonstrating that our approach can be employed to identify misreporting in real-world scenarios.
- Abstract(参考訳): リソースの割り当てを知らせるためにMLモデルを使用する場合、アロケーション決定に影響されたエージェントは、より良い結果を得るために、戦略的に機能を変更するインセンティブを持つ可能性がある。
以前の研究は戦略的な反応を広く研究してきたが、真の修正から誤った報告を遠ざけることは、依然として根本的な課題である。
そこで本稿では, エージェントがどの程度の頻度で誤レポートしているかを, 真に変化した特徴を識別し, 因果的動機づけによる定量化手法を提案する。
我々の重要な洞察は、真の修正とは異なり、誤報告された特徴は下流の変数(すなわち因果の子孫)に因果的に影響しないということである。
この非対称性を利用して、操作されたデータセットと操作されていないデータセットとの因果関係から得られた、誤報告された特徴の因果関係を比較検討した。
我々は、誤報率の正当性を正式に証明し、推定器のばらつきを特徴づける。
半合成および実メディケアのデータセットを誤レポートしたデータを用いて理論的結果を実証的に検証し,実世界のシナリオにおける誤レポートを特定するために,我々のアプローチが有効であることを実証した。
関連論文リスト
- Data Fusion for Partial Identification of Causal Effects [62.56890808004615]
本稿では,研究者が重要な疑問に答えられるような,新しい部分的識別フレームワークを提案する。
因果効果は肯定的か否定的か?
本研究の枠組みをSTARプロジェクトに適用し,第3級の標準試験性能に対する教室規模の影響について検討する。
論文 参考訳(メタデータ) (2025-05-30T07:13:01Z) - Do Finetti: On Causal Effects for Exchangeable Data [45.96632286841583]
データをi.i.d.に含まない環境での因果効果の推定について検討する。
我々は、独立因果関係の仮定を満たす交換可能なデータに焦点を当てる。
論文 参考訳(メタデータ) (2024-05-29T07:31:18Z) - Automating the Selection of Proxy Variables of Unmeasured Confounders [16.773841751009748]
既存のプロキシ変数推定器を拡張して、治療と結果の間に複数の未測定の共同創設者が存在するシナリオに対応する。
本稿では、プロキシ変数の選択と因果効果の偏りのない推定のための2つのデータ駆動手法を提案する。
論文 参考訳(メタデータ) (2024-05-25T08:53:49Z) - The Impact of Differential Feature Under-reporting on Algorithmic Fairness [86.275300739926]
解析的に抽出可能な差分特徴のアンダーレポーティングモデルを提案する。
そして、この種のデータバイアスがアルゴリズムの公正性に与える影響を特徴づける。
我々の結果は、実世界のデータ設定では、アンダーレポートが典型的に格差を増大させることを示している。
論文 参考訳(メタデータ) (2024-01-16T19:16:22Z) - Diagnosing and Rectifying Fake OOD Invariance: A Restructured Causal
Approach [51.012396632595554]
不変表現学習(IRL)は、不変因果的特徴から環境から切り離されたラベルへの予測を促進する。
最近の理論的結果は、IRLによって回復されたいくつかの因果的特徴は、訓練環境ではドメイン不変のふりをするが、目に見えない領域では失敗する。
本研究では,RS-SCMに関する条件付き相互情報に基づく手法を開発し,その効果を巧みに補正する。
論文 参考訳(メタデータ) (2023-12-15T12:58:05Z) - Decoding Susceptibility: Modeling Misbelief to Misinformation Through a Computational Approach [61.04606493712002]
誤報に対する感受性は、観測不可能な不検証の主張に対する信念の度合いを記述している。
既存の感受性研究は、自己報告された信念に大きく依存している。
本稿では,ユーザの潜在感受性レベルをモデル化するための計算手法を提案する。
論文 参考訳(メタデータ) (2023-11-16T07:22:56Z) - Bias in Evaluation Processes: An Optimization-Based Model [31.790546767744917]
本研究では,タスクに対する個人の実効性分布から観察された分布への変換として評価過程をモデル化する。
本研究では,本モデルから生じる分布を特徴付けるとともに,観測された分布に対するパラメータの影響について検討する。
実世界のデータセットを組み込むことで、我々のモデルを実証的に検証し、下流選択タスクにおける介入の効果を研究する。
論文 参考訳(メタデータ) (2023-10-26T15:45:01Z) - Simultaneous Improvement of ML Model Fairness and Performance by
Identifying Bias in Data [1.76179873429447]
トレーニング前にデータセットから削除すべき特定の種類のバイアスを記述したインスタンスを検出できるデータ前処理手法を提案する。
特に、類似した特徴を持つインスタンスが存在するが、保護属性の変動に起因するラベルが異なる問題設定では、固有のバイアスがデータセット内で引き起こされる、と主張する。
論文 参考訳(メタデータ) (2022-10-24T13:04:07Z) - Nonparametric Feature Impact and Importance [0.6123324869194193]
データ上で直接動作する部分依存曲線から導かれる特徴的影響と重要性の数学的定義を与える。
品質を評価するために、これらの定義によってランク付けされた特徴は、既存の特徴選択技術と競合することを示す。
論文 参考訳(メタデータ) (2020-06-08T17:07:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。