論文の概要: Heterogeneous Data Game: Characterizing the Model Competition Across Multiple Data Sources
- arxiv url: http://arxiv.org/abs/2505.07688v1
- Date: Mon, 12 May 2025 15:51:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-13 20:21:49.466415
- Title: Heterogeneous Data Game: Characterizing the Model Competition Across Multiple Data Sources
- Title(参考訳): 異種データゲーム:複数のデータソース間のモデル競合を特徴付ける
- Authors: Renzhe Xu, Kang Wang, Bo Li,
- Abstract要約: 異種データソースと競合するプロバイダを分析するための,ゲーム理論フレームワークであるヘテロジニアスデータゲームを提案する。
得られた純粋なナッシュ平衡 (PNE) について検討し、それらが存在しない、均一な(全てのプロバイダが同じモデルに収束する)、あるいは不均一であることを示す。
我々の分析は、データソース選択モデルの「温度」や、特定のデータソースの優位性などの要因が均衡結果をどのように形成するかを考察し、単極性、双極性、より一般的な市場にわたっている。
- 参考スコア(独自算出の注目度): 21.485166995182226
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data heterogeneity across multiple sources is common in real-world machine learning (ML) settings. Although many methods focus on enabling a single model to handle diverse data, real-world markets often comprise multiple competing ML providers. In this paper, we propose a game-theoretic framework -- the Heterogeneous Data Game -- to analyze how such providers compete across heterogeneous data sources. We investigate the resulting pure Nash equilibria (PNE), showing that they can be non-existent, homogeneous (all providers converge on the same model), or heterogeneous (providers specialize in distinct data sources). Our analysis spans monopolistic, duopolistic, and more general markets, illustrating how factors such as the "temperature" of data-source choice models and the dominance of certain data sources shape equilibrium outcomes. We offer theoretical insights into both homogeneous and heterogeneous PNEs, guiding regulatory policies and practical strategies for competitive ML marketplaces.
- Abstract(参考訳): 複数のソースにわたるデータの異質性は、実世界の機械学習(ML)設定で一般的である。
多くの手法が単一のモデルで多様なデータを扱えるようにすることに重点を置いているが、現実の市場は複数の競合するMLプロバイダで構成されていることが多い。
本稿では,不均質なデータソースをまたいで,そのようなプロバイダがどのように競合するかを分析するためのゲーム理論フレームワークであるヘテロジニアス・データ・ゲームを提案する。
得られた純粋なナッシュ均衡 (PNE) について検討し、それらが存在しない、均一な(全てのプロバイダが同じモデルに収束する)、あるいは異種(異なるデータソースに特化している)であることを示す。
我々の分析は、データソース選択モデルの「温度」や、特定のデータソースの優位性などの要因が均衡結果をどのように形成するかを考察し、単極性、双極性、より一般的な市場にわたっている。
我々は、同種PNEと異種PNEの両方に関する理論的洞察を提供し、規制政策の指針と競合するMLマーケットプレースのための実践戦略を提供する。
関連論文リスト
- FLASH: Federated Learning Across Simultaneous Heterogeneities [54.80435317208111]
FLASH (Federated Learning Across Simultaneous Heterogeneities) は軽量かつ柔軟なクライアント選択アルゴリズムである。
ヘテロジニティの幅広い情報源の下で、最先端のFLフレームワークよりも優れています。
最先端のベースラインよりも大幅に、一貫性のある改善を実現している。
論文 参考訳(メタデータ) (2024-02-13T20:04:39Z) - Interpretable Multi-Source Data Fusion Through Latent Variable Gaussian Process [8.207427766052044]
提案手法は,2つの数学的および2つの材料科学ケーススタディを用いて実証および解析を行った。
シングルソースおよびソースを意識しない機械学習モデルと比較して、提案したマルチソースデータ融合フレームワークはスパースデータ問題に対してより良い予測を提供することができる。
論文 参考訳(メタデータ) (2024-02-06T16:54:59Z) - UnitedHuman: Harnessing Multi-Source Data for High-Resolution Human
Generation [59.77275587857252]
総合的な人間のデータセットは、必然的に、局所的な部分についての不十分で低解像度な情報を持っている。
本稿では,高解像度な人為的生成モデルを共同で学習するために,様々な解像度画像を用いたマルチソースデータセットを提案する。
論文 参考訳(メタデータ) (2023-09-25T17:58:46Z) - Rethinking Data Heterogeneity in Federated Learning: Introducing a New
Notion and Standard Benchmarks [65.34113135080105]
我々は、現在のセットアップにおけるデータ不均一性の問題が必ずしも問題であるだけでなく、FL参加者にとって有益であることを示す。
私たちの観察は直感的である。
私たちのコードはhttps://github.com/MMorafah/FL-SC-NIIDで利用可能です。
論文 参考訳(メタデータ) (2022-09-30T17:15:19Z) - DRFLM: Distributionally Robust Federated Learning with Inter-client
Noise via Local Mixup [58.894901088797376]
連合学習は、生データをリークすることなく、複数の組織のデータを使用してグローバルモデルをトレーニングするための有望なアプローチとして登場した。
上記の2つの課題を同時に解決するための一般的な枠組みを提案する。
我々は、ロバストネス解析、収束解析、一般化能力を含む包括的理論的解析を提供する。
論文 参考訳(メタデータ) (2022-04-16T08:08:29Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - Variational Selective Autoencoder: Learning from Partially-Observed
Heterogeneous Data [45.23338389559936]
本研究では,部分観測された異種データから表現を学習するための変分選択型オートエンコーダ(VSAE)を提案する。
vsaeは、観測データ、観測されていないデータ、およびインプテーションマスクの合同分布をモデル化することで、異種データの潜在依存関係を学習する。
その結果、データ生成や計算を含むさまざまな下流タスクの統一モデルが実現される。
論文 参考訳(メタデータ) (2021-02-25T04:39:13Z) - FedH2L: Federated Learning with Model and Statistical Heterogeneity [75.61234545520611]
フェデレートラーニング(FL)は、分散参加者が個々のデータのプライバシを犠牲にすることなく、強力なグローバルモデルを集合的に学習することを可能にする。
我々はFedH2Lを導入し、これはモデルアーキテクチャに非依存であり、参加者間で異なるデータ分散に対して堅牢である。
パラメータや勾配を共有するアプローチとは対照的に、FedH2Lは相互蒸留に依存し、参加者間で共有シードセットの後方のみを分散的に交換する。
論文 参考訳(メタデータ) (2021-01-27T10:10:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。