Fugu-MT 論文翻訳(概要): Statistical and Computational Guarantees for Influence Diagnostics

論文の概要: Statistical and Computational Guarantees for Influence Diagnostics

arxiv url: http://arxiv.org/abs/2212.04014v2
Date: Tue, 19 Sep 2023 23:55:46 GMT
ステータス: 翻訳完了
システム内更新日: 2023-09-22 00:35:57.967437
Title: Statistical and Computational Guarantees for Influence Diagnostics
Title（参考訳）: 影響診断のための統計的・計算的保証
Authors: Jillian Fisher, Lang Liu, Krishna Pillutla, Yejin Choi, Zaid Harchaoui
Abstract要約: 影響診断は、影響のあるデータポイントまたはデータポイントのサブセットを特定する強力な統計ツールである。我々は、影響関数と近似最大影響摂動に対して、有限サンプル統計境界と計算複雑性境界を確立する。
参考スコア（独自算出の注目度）: 44.66763278782308
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Influence diagnostics such as influence functions and approximate maximum influence perturbations are popular in machine learning and in AI domain applications. Influence diagnostics are powerful statistical tools to identify influential datapoints or subsets of datapoints. We establish finite-sample statistical bounds, as well as computational complexity bounds, for influence functions and approximate maximum influence perturbations using efficient inverse-Hessian-vector product implementations. We illustrate our results with generalized linear models and large attention based models on synthetic and real data.
Abstract（参考訳）: 影響関数や近似最大影響摂動などの影響診断は、機械学習やAIドメインアプリケーションで人気がある。影響診断は、影響のあるデータポイントまたはデータポイントのサブセットを特定する強力な統計ツールである。我々は、効率的な逆複素ベクトル積実装を用いた影響関数と近似最大影響摂動に対して、有限サンプル統計境界と計算複雑性境界を確立する。本稿では,合成データと実データに基づく一般化線形モデルと注目モデルを用いて,この結果について述べる。

関連論文リスト

Do-PFN: In-Context Learning for Causal Effect Estimation [75.62771416172109]
予備データ適合ネットワーク(PFN)は, 合成データに基づいて事前学習を行い, 結果を予測する。提案手法により,基礎となる因果グラフの知識を必要とせず,因果効果の正確な推定が可能となる。
論文参考訳（メタデータ） (2025-06-06T12:43:57Z)
Detecting Instruction Fine-tuning Attack on Language Models with Influence Function [6.760293300577228]
インストラクションの微調整攻撃は、モデルアライメントを損なうとともに、現実のデプロイメントにおいてセキュリティリスクを引き起こす。本稿では,影響関数を用いて攻撃を検知・緩和する,シンプルで効果的な手法を提案する。我々は,大規模データセットに対する言語モデル命令の微調整攻撃を検出するための影響関数を初めて適用した。
論文参考訳（メタデータ） (2025-04-12T00:50:28Z)
Efficient Multi-Agent System Training with Data Influence-Oriented Tree Search [59.75749613951193]
木探索とデータ選択の両方をガイドするデータインフルエンス指向木探索(DITS)を提案する。インフルエンススコアを活用することで、システム改善のための最も影響力のあるデータを効果的に特定する。非微分不可能な指標に適した影響スコア推定法を導出する。
論文参考訳（メタデータ） (2025-02-02T23:20:16Z)
A Versatile Influence Function for Data Attribution with Non-Decomposable Loss [3.1615846013409925]
本稿では,非分解不能な損失を学習した機械学習モデルに対して,直接適用可能なVersatile Influence Function (VIF)を提案する。 VIFはデータ属性の大幅な進歩を表しており、幅広い機械学習パラダイムにまたがる効率的な影響関数ベースの属性を可能にする。
論文参考訳（メタデータ） (2024-12-02T09:59:01Z)
Influence Functions for Scalable Data Attribution in Diffusion Models [52.92223039302037]
拡散モデルは、生成的モデリングに大きな進歩をもたらした。しかし、彼らの普及はデータ属性と解釈可能性に関する課題を引き起こす。本稿では,テキスト・インフルエンス・ファンクション・フレームワークを開発することにより,このような課題に対処することを目的とする。
論文参考訳（メタデータ） (2024-10-17T17:59:02Z)
The role of data embedding in quantum autoencoders for improved anomaly detection [0.0]
異常検出タスクにおける量子オートエンコーダ(QAE)の性能は、データ埋め込みとアンザッツ設計の選択に大きく依存する。本研究では,3つのデータ埋め込み技術,データ再ロード,並列埋め込み,代替埋め込みが異常検出におけるQAEの表現性および有効性に与える影響について検討した。
論文参考訳（メタデータ） (2024-09-06T18:00:01Z)
Revisit, Extend, and Enhance Hessian-Free Influence Functions [26.105554752277648]
影響関数は、モデルの解釈、サブセットのトレーニングセットの選択などにおけるサンプルの影響を評価する重要なツールとして機能する。本稿では,Trac として知られる特定の有効近似法を再検討する。この方法は、ヘッセン行列の逆を恒等行列で置き換える。
論文参考訳（メタデータ） (2024-05-25T03:43:36Z)
C-XGBoost: A tree boosting model for causal effect estimation [8.246161706153805]
因果効果推定は、平均処理効果と、治療の条件平均処理効果を、利用可能なデータから得られる結果に推定することを目的としている。本稿では,C-XGBoost という新たな因果推論モデルを提案する。
論文参考訳（メタデータ） (2024-03-31T17:43:37Z)
Statistical inference using machine learning and classical techniques based on accumulated local effects (ALE) [0.0]
Accumulated Local Effects (ALE) は、機械学習アルゴリズムのグローバルな説明のためのモデルに依存しないアプローチである。 ALEに基づく統計的推論を行うには,少なくとも3つの課題がある。 ALEを用いた統計的推論のための革新的なツールと技術を紹介する。
論文参考訳（メタデータ） (2023-10-15T16:17:21Z)
Measuring Causal Effects of Data Statistics on Language Model's `Factual' Predictions [59.284907093349425]
大量のトレーニングデータが、最先端のNLPモデルの高性能化の大きな理由の1つである。トレーニングデータがどのように予測に影響を及ぼすかを記述するための言語を,因果的フレームワークを通じて提供する。我々のフレームワークは、高価なモデルの再訓練の必要性を回避し、観測データのみに基づいて因果効果を推定することができる。
論文参考訳（メタデータ） (2022-07-28T17:36:24Z)
On Understanding the Influence of Controllable Factors with a Feature Attribution Algorithm: a Medical Case Study [7.331240833902455]
既存の特徴属性アルゴリズムは、データセット内のすべての特徴を均質に扱う。本稿では、制御可能な特徴の相対的重要性を計算するために、制御可能なfActor特徴属性(CAFA)アプローチを提案する。
論文参考訳（メタデータ） (2022-03-23T19:49:45Z)
Learning Neural Causal Models with Active Interventions [83.44636110899742]
本稿では,データ生成プロセスの根底にある因果構造を素早く識別する能動的介入ターゲット機構を提案する。本手法は,ランダムな介入ターゲティングと比較して,要求される対話回数を大幅に削減する。シミュレーションデータから実世界のデータまで,複数のベンチマークにおいて優れた性能を示す。
論文参考訳（メタデータ） (2021-09-06T13:10:37Z)
Estimating Structural Target Functions using Machine Learning and Influence Functions [103.47897241856603]
統計モデルから特定可能な関数として生じる対象関数の統計的機械学習のための新しい枠組みを提案する。このフレームワークは問題とモデルに依存しないものであり、応用統計学における幅広い対象パラメータを推定するのに使用できる。我々は、部分的に観測されていない情報を持つランダム/二重ロバストな問題において、いわゆる粗大化に特に焦点をあてた。
論文参考訳（メタデータ） (2020-08-14T16:48:29Z)
Influence Functions in Deep Learning Are Fragile [52.31375893260445]
影響関数は、テスト時間予測におけるサンプルの効果を近似する。影響評価は浅いネットワークではかなり正確ですヘッセン正則化は、高品質な影響推定を得るために重要である。
論文参考訳（メタデータ） (2020-06-25T18:25:59Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。