論文の概要: Quantifying Correlations of Machine Learning Models
- arxiv url: http://arxiv.org/abs/2502.03937v1
- Date: Thu, 06 Feb 2025 10:19:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-07 14:29:23.866684
- Title: Quantifying Correlations of Machine Learning Models
- Title(参考訳): 機械学習モデルの相関の定量化
- Authors: Yuanyuan Li, Neeraj Sarna, Yang Lin,
- Abstract要約: 本稿では,複数のモデル間の誤差相関が生じる3つのシナリオについて考察する。
特に、モデルが類似したアルゴリズムを共有したり、データセットをトレーニングしたり、基礎的なモデルを共有したりする場合です。
全体として、モデル間の相関は広範に存在し、基礎モデルや広く使われている公開データセットへの依存度が高まるにつれて強化される可能性が高い。
- 参考スコア(独自算出の注目度): 8.834929420051534
- License:
- Abstract: Machine Learning models are being extensively used in safety critical applications where errors from these models could cause harm to the user. Such risks are amplified when multiple machine learning models, which are deployed concurrently, interact and make errors simultaneously. This paper explores three scenarios where error correlations between multiple models arise, resulting in such aggregated risks. Using real-world data, we simulate these scenarios and quantify the correlations in errors of different models. Our findings indicate that aggregated risks are substantial, particularly when models share similar algorithms, training datasets, or foundational models. Overall, we observe that correlations across models are pervasive and likely to intensify with increased reliance on foundational models and widely used public datasets, highlighting the need for effective mitigation strategies to address these challenges.
- Abstract(参考訳): 機械学習モデルは、これらのモデルからのエラーがユーザを傷つける可能性のある安全クリティカルなアプリケーションで広く利用されている。
このようなリスクは、複数の機械学習モデルが同時にデプロイされ、対話し、同時にエラーを発生させることによって増幅される。
本稿では,複数のモデル間の誤差相関が生じる3つのシナリオについて考察する。
実世界のデータを用いて、これらのシナリオをシミュレートし、異なるモデルのエラーの相関関係を定量化する。
特に、モデルが類似したアルゴリズムを共有したり、データセットをトレーニングしたり、基礎的なモデルを共有したりする場合です。
全体として、モデル間の相関は広範に存在し、基礎モデルや広く使われているパブリックデータセットへの依存度が増大する傾向にあり、これらの課題に対処するための効果的な緩和戦略の必要性が強調されている。
関連論文リスト
- Assessing Robustness of Machine Learning Models using Covariate Perturbations [0.6749750044497732]
本稿では,機械学習モデルの堅牢性を評価するための包括的フレームワークを提案する。
本研究では、ロバスト性の評価とモデル予測への影響を検討するために、様々な摂動戦略を検討する。
モデル間のロバスト性の比較、モデルの不安定性同定、モデルのロバスト性向上におけるアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2024-08-02T14:41:36Z) - Reinforcing Pre-trained Models Using Counterfactual Images [54.26310919385808]
本稿では,言語誘導型生成対実画像を用いた分類モデル強化のための新しいフレームワークを提案する。
逆ファクト画像データセットを用いてモデルをテストすることにより、モデルの弱点を同定する。
我々は、分類モデルを微調整し強化するために、デファクトイメージを拡張データセットとして採用する。
論文 参考訳(メタデータ) (2024-06-19T08:07:14Z) - Learning Divergence Fields for Shift-Robust Graph Representations [73.11818515795761]
本研究では,相互依存データに対する問題に対して,学習可能な分散場を持つ幾何学的拡散モデルを提案する。
因果推論によって新たな学習目標が導出され、ドメイン間で無神経な相互依存の一般化可能なパターンを学習するためのモデルが導出される。
論文 参考訳(メタデータ) (2024-06-07T14:29:21Z) - Identifying and Mitigating Model Failures through Few-shot CLIP-aided
Diffusion Generation [65.268245109828]
本稿では,突発的相関に付随する障害モードのテキスト記述を生成するためのエンドツーエンドフレームワークを提案する。
これらの記述は拡散モデルのような生成モデルを用いて合成データを生成するのに使うことができる。
本実験では, ハードサブポピュレーションの精度(sim textbf21%$)が著しく向上した。
論文 参考訳(メタデータ) (2023-12-09T04:43:49Z) - Generative Machine Learning for Multivariate Equity Returns [0.0]
本研究では,条件付き重み付きオートエンコーダと条件付き正規化フローの有効性について検討した。
私たちが取り組んだ主な問題は、S&P 500の全てのメンバーの関節分布をモデル化すること、すなわち500次元の関節分布を学習することである。
この生成モデルは、現実的な合成データの生成、ボラティリティと相関推定、リスク分析、ポートフォリオ最適化など、金融に幅広い応用があることが示される。
論文 参考訳(メタデータ) (2023-11-21T18:41:48Z) - Correlation inference attacks against machine learning models [6.805105137455252]
モデルが入力変数間の相関関係に関する情報を漏らすかどうか, 相関推論攻撃について検討する。
私たちの結果は、モデルが何をし、トレーニングセットから覚えるべきかについて、根本的な疑問を投げかけます。
論文 参考訳(メタデータ) (2021-12-16T11:42:45Z) - A Framework for Machine Learning of Model Error in Dynamical Systems [7.384376731453594]
データから動的システムを特定するために,機械的アプローチと機械学習アプローチを混在させる統一フレームワークを提案する。
モデルエラーがメモリレスであり、大きなメモリを持つ問題に対して、連続時間と離散時間の両方で問題を提起した。
ハイブリッド手法は、データ飢餓、モデルの複雑さの要求、全体的な予測性能において、データ駆動アプローチよりも大幅に優れています。
論文 参考訳(メタデータ) (2021-07-14T12:47:48Z) - Explainable Adversarial Attacks in Deep Neural Networks Using Activation
Profiles [69.9674326582747]
本稿では,敵対的事例に基づくニューラルネットワークモデルを検討するためのビジュアルフレームワークを提案する。
これらの要素を観察することで、モデル内の悪用領域を素早く特定できることを示す。
論文 参考訳(メタデータ) (2021-03-18T13:04:21Z) - Improving the Reconstruction of Disentangled Representation Learners via Multi-Stage Modeling [54.94763543386523]
現在の自己エンコーダに基づく非絡み合い表現学習法は、(集合体)後部をペナルティ化し、潜伏因子の統計的独立を促進することで、非絡み合いを実現する。
本稿では,不整合因子をペナルティに基づく不整合表現学習法を用いて学習する,新しい多段階モデリング手法を提案する。
次に、低品質な再構成を、欠落した関連潜伏変数をモデル化するために訓練された別の深層生成モデルで改善する。
論文 参考訳(メタデータ) (2020-10-25T18:51:15Z) - Relating by Contrasting: A Data-efficient Framework for Multimodal
Generative Models [86.9292779620645]
生成モデル学習のための対照的なフレームワークを開発し、モダリティ間の共通性だけでなく、「関連」と「関連しない」マルチモーダルデータの区別によってモデルを訓練することができる。
提案手法では, 生成モデルを用いて, 関係のないサンプルから関連サンプルを正確に識別し, ラベルのない多モードデータの利用が可能となる。
論文 参考訳(メタデータ) (2020-07-02T15:08:11Z) - Debiasing Skin Lesion Datasets and Models? Not So Fast [17.668005682385175]
データリスク学習のバイアスから学んだモデルは、同じデータから。
モデルが現実世界の状況では見つからない急激な相関関係を学習すると、医療上の決定などの重要なタスクへの展開は破滅的なものになる。
将来有望な研究を示唆する興味深い結果にもかかわらず、現在の脱バイアス法は、スキン・レジオンモデルのバイアス問題を解決する準備ができていないことが判明した。
論文 参考訳(メタデータ) (2020-04-23T21:07:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。