論文の概要: Data as a Lever: A Neighbouring Datasets Perspective on Predictive Multiplicity
- arxiv url: http://arxiv.org/abs/2510.21303v1
- Date: Fri, 24 Oct 2025 10:01:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 06:57:23.410271
- Title: Data as a Lever: A Neighbouring Datasets Perspective on Predictive Multiplicity
- Title(参考訳): レバとしてのデータ: 予測的多重性に関する近隣データセットの展望
- Authors: Prakhar Ganesh, Hsiang Hsu, Golnoosh Farnadi,
- Abstract要約: 隣接データセットフレームワークを導入し、単一データポイント差が乗算性に与える影響について検討する。
クラス間分布の重なりが大きい近傍のデータセットは、多重度が低いことを示す。
当社のフレームワークは、アクティブラーニングとデータ計算という2つの実践領域に拡張しています。
- 参考スコア(独自算出の注目度): 22.974916197190584
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multiplicity -- the existence of distinct models with comparable performance -- has received growing attention in recent years. While prior work has largely emphasized modelling choices, the critical role of data in shaping multiplicity has been comparatively overlooked. In this work, we introduce a neighbouring datasets framework to examine the most granular case: the impact of a single-data-point difference on multiplicity. Our analysis yields a seemingly counterintuitive finding: neighbouring datasets with greater inter-class distribution overlap exhibit lower multiplicity. This reversal of conventional expectations arises from a shared Rashomon parameter, and we substantiate it with rigorous proofs. Building on this foundation, we extend our framework to two practical domains: active learning and data imputation. For each, we establish natural extensions of the neighbouring datasets perspective, conduct the first systematic study of multiplicity in existing algorithms, and finally, propose novel multiplicity-aware methods, namely, multiplicity-aware data acquisition strategies for active learning and multiplicity-aware data imputation techniques.
- Abstract(参考訳): 同等のパフォーマンスを持つ異なるモデルが存在するマルチプライオリティは、近年注目を集めている。
これまでの作業では、モデリングの選択に重点を置いていたが、マルチプライオリティを形成する上でのデータの重要な役割は、比較的見過ごされてきた。
本研究では,マルチプリシティに単一データポイント差が与える影響について,最も粒度の細かいケースを調べるために,近隣のデータセットフレームワークを導入する。
クラス間分布の重なりが大きい近傍のデータセットは、多重度が低いことを示す。
このような従来の期待の逆転は共有の羅生門パラメータから生じ、厳密な証明でそれを裏付ける。
この基盤の上に構築された私たちのフレームワークは、アクティブラーニングとデータ計算という2つの実践的な領域に拡張されます。
それぞれについて、近隣のデータセットの観点の自然な拡張を確立し、既存のアルゴリズムにおける多重性に関する最初の体系的な研究を行い、最後に、アクティブな学習のための多重性対応データ取得戦略と多重性対応データ計算技術について、新しい多重性対応手法を提案する。
関連論文リスト
- Beyond DAGs: A Latent Partial Causal Model for Multimodal Learning [80.44084021062105]
本稿では,非方向エッジで連結された2つの潜在結合変数を特徴とする,多モーダルデータに対する新しい潜在部分因果モデルを提案する。
特定の統計的仮定の下では、多モーダル・コントラッシブ・ラーニングによって学習された表現が、自明な変換までの潜在結合変数に対応することを示す。
事前トレーニングされたCLIPモデルの実験は、非絡み合った表現を具現化し、数ショットの学習を可能にし、さまざまな現実世界のデータセットにわたるドメインの一般化を改善する。
論文 参考訳(メタデータ) (2024-02-09T07:18:06Z) - Multi-View Class Incremental Learning [57.14644913531313]
マルチビュー学習(MVL)は、下流タスクのパフォーマンスを改善するためにデータセットの複数の視点から情報を統合することで大きな成功を収めている。
本稿では,複数視点クラスインクリメンタルラーニング(MVCIL)と呼ばれる新しいパラダイムについて考察する。
論文 参考訳(メタデータ) (2023-06-16T08:13:41Z) - One-step Multi-view Clustering with Diverse Representation [47.41455937479201]
本稿では,多視点学習と$k$-meansを統合フレームワークに組み込んだ一段階のマルチビュークラスタリングを提案する。
そこで本研究では,効率の良い最適化アルゴリズムを開発し,その解法について述べる。
論文 参考訳(メタデータ) (2023-06-08T02:52:24Z) - Quantifying & Modeling Multimodal Interactions: An Information
Decomposition Framework [89.8609061423685]
本稿では,入力モーダル性と出力タスクを関連付けた冗長性,特異性,シナジーの度合いを定量化する情報理論手法を提案する。
PID推定を検証するために、PIDが知られている合成データセットと大規模マルチモーダルベンチマークの両方で広範な実験を行う。
本研究では,(1)マルチモーダルデータセット内の相互作用の定量化,(2)マルチモーダルモデルで捉えた相互作用の定量化,(3)モデル選択の原理的アプローチ,(4)実世界のケーススタディの3つにその有用性を示す。
論文 参考訳(メタデータ) (2023-02-23T18:59:05Z) - Unified Multi-View Orthonormal Non-Negative Graph Based Clustering
Framework [74.25493157757943]
我々は,非負の特徴特性を活用し,多視点情報を統合された共同学習フレームワークに組み込む,新しいクラスタリングモデルを定式化する。
また、深層機能に基づいたクラスタリングデータに対するマルチモデル非負グラフベースのアプローチを初めて検討する。
論文 参考訳(メタデータ) (2022-11-03T08:18:27Z) - Learning Sequential Latent Variable Models from Multimodal Time Series
Data [6.107812768939553]
マルチモーダルデータの確率的潜在状態表現を協調的に学習するための自己教師付き生成モデリングフレームワークを提案する。
提案手法が予測品質と表現品質を大幅に向上させることを示す。
論文 参考訳(メタデータ) (2022-04-21T21:59:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。