論文の概要: Testing Most Influential Sets
- arxiv url: http://arxiv.org/abs/2510.20372v1
- Date: Thu, 23 Oct 2025 09:12:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:17.722276
- Title: Testing Most Influential Sets
- Title(参考訳): 最もインフルエンシャルなセットをテストする
- Authors: Lucas Darius Konrad, Nikolas Kuschnig,
- Abstract要約: モデル結果に不均等な影響を与えるデータの小さなサブセットは、結論に劇的な影響を与える可能性がある。
我々は、最も影響力のある集合の統計的意義を評価するための原則的枠組みを開発する。
我々は、経済学、生物学、機械学習ベンチマークにまたがる応用を通して、我々のアプローチの実践的価値を実証する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Small subsets of data with disproportionate influence on model outcomes can have dramatic impacts on conclusions, with a few data points sometimes overturning key findings. While recent work has developed methods to identify these \emph{most influential sets}, no formal theory exists to determine when their influence reflects genuine problems rather than natural sampling variation. We address this gap by developing a principled framework for assessing the statistical significance of most influential sets. Our theoretical results characterize the extreme value distributions of maximal influence and enable rigorous hypothesis tests for excessive influence, replacing current ad-hoc sensitivity checks. We demonstrate the practical value of our approach through applications across economics, biology, and machine learning benchmarks.
- Abstract(参考訳): モデル結果に不均等な影響を持つデータの小さなサブセットは、いくつかのデータポイントが重要な発見を覆すため、結論に劇的な影響を及ぼす可能性がある。
近年の研究ではこれらの「最も影響力のある集合」を同定する手法が開発されているが、それらの影響が自然サンプリングの変動よりも真の問題を反映するかどうかを決定する公式な理論は存在しない。
このギャップに対処するために、最も影響力のある集合の統計的意義を評価するための原則的枠組みを開発する。
理論的には, 最大影響の極端値分布を特徴付けるとともに, 過度影響に対する厳密な仮説テストが可能であり, 現行のアドホック感度チェックを置き換えることができる。
我々は、経済学、生物学、機械学習ベンチマークにまたがる応用を通して、我々のアプローチの実践的価値を実証する。
関連論文リスト
- Causal Sensitivity Identification using Generative Learning [25.118222387224677]
我々は介入的・反事実的視点を用いて因果的影響分析を行う。
本手法は,条件付きオートエンコーダ(CVAE)を用いて因果的影響を同定し,生成予測器として機能する。
論文 参考訳(メタデータ) (2025-09-01T10:42:44Z) - How Quantization Shapes Bias in Large Language Models [61.40435736418359]
重みとアクティベーションの定量化戦略に焦点をあて、幅広いバイアスタイプにまたがる効果について検討する。
確率的および生成されたテキストベースのメトリクスを9つのベンチマークで使用し、アーキテクチャファミリや推論能力の異なるモデルを評価する。
論文 参考訳(メタデータ) (2025-08-25T14:48:26Z) - Data Fusion for Partial Identification of Causal Effects [62.56890808004615]
本稿では,研究者が重要な疑問に答えられるような,新しい部分的識別フレームワークを提案する。
因果効果は肯定的か否定的か?
本研究の枠組みをSTARプロジェクトに適用し,第3級の標準試験性能に対する教室規模の影響について検討する。
論文 参考訳(メタデータ) (2025-05-30T07:13:01Z) - Most Influential Subset Selection: Challenges, Promises, and Beyond [9.479235005673683]
我々は,最も集団的影響の大きいトレーニングサンプルのサブセットを特定することを目的とした,MISS(Most Influential Subset Selection)問題について検討する。
我々は、MISにおける一般的なアプローチを包括的に分析し、その強みと弱点を解明する。
本稿では,これらを反復的に適用した適応バージョンが,試料間の相互作用を効果的に捕捉できることを実証する。
論文 参考訳(メタデータ) (2024-09-25T20:00:23Z) - Advancing Counterfactual Inference through Nonlinear Quantile Regression [77.28323341329461]
ニューラルネットワークで実装された効率的かつ効果的な対実的推論のためのフレームワークを提案する。
提案手法は、推定された反事実結果から見つからないデータまでを一般化する能力を高める。
複数のデータセットで実施した実証実験の結果は、我々の理論的な主張に対する説得力のある支持を提供する。
論文 参考訳(メタデータ) (2023-06-09T08:30:51Z) - Systematic Evaluation of Predictive Fairness [60.0947291284978]
バイアス付きデータセットのトレーニングにおけるバイアスの緩和は、重要なオープンな問題である。
複数のタスクにまたがる様々なデバイアス化手法の性能について検討する。
データ条件が相対モデルの性能に強い影響を与えることがわかった。
論文 参考訳(メタデータ) (2022-10-17T05:40:13Z) - Counterfactual Reasoning for Out-of-distribution Multimodal Sentiment
Analysis [56.84237932819403]
本稿では,OODの高次一般化に対するテキストモダリティの悪影響を推定・緩和することを目的とする。
そこで本研究では,マルチモーダル感情分析のためのモデルに依存しない反現実的フレームワークを考案した。
論文 参考訳(メタデータ) (2022-07-24T03:57:40Z) - Causal Ordering Without Effect Estimation: A Framework for Using Proxies in Treatment Prioritization [3.0509197593879844]
予測プロキシを推論する決定中心のフレームワークを開発する。
プロキシが処理効果の優越的なモデレーターを反映した場合に保持する正しい効果順序をプロキシが回復する条件を同定する。
これらの条件が、個別選択設定において有用な近似としてどのように現れるかを示し、介入なしに行動する確率が説得を緩やかにすることを示す。
論文 参考訳(メタデータ) (2022-06-25T02:15:22Z) - Revisiting Methods for Finding Influential Examples [2.094022863940315]
テスト時間決定に有効なトレーニング例を見つける方法が提案されている。
本稿では,これらの手法がすべて不安定であることを示す。
本稿では, 毒素攻撃を検知する能力によって, このような説明を評価することを提案する。
論文 参考訳(メタデータ) (2021-11-08T18:00:06Z) - Influence Functions in Deep Learning Are Fragile [52.31375893260445]
影響関数は、テスト時間予測におけるサンプルの効果を近似する。
影響評価は浅いネットワークでは かなり正確です
ヘッセン正則化は、高品質な影響推定を得るために重要である。
論文 参考訳(メタデータ) (2020-06-25T18:25:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。