論文の概要: Collaboratively Learning Linear Models with Structured Missing Data
- arxiv url: http://arxiv.org/abs/2307.11947v1
- Date: Sat, 22 Jul 2023 00:07:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-25 18:59:29.473258
- Title: Collaboratively Learning Linear Models with Structured Missing Data
- Title(参考訳): 構造的欠落データを用いた線形モデルの協調学習
- Authors: Chen Cheng, Gary Cheng, John Duchi
- Abstract要約: 我々は、$magentsの最小二乗推定問題について検討する。
我々のゴールは、各エージェントに最適な推定器を生成するために、学習中のエージェントを協調させる方法を決定することである。
- 参考スコア(独自算出の注目度): 3.4376560669160394
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the problem of collaboratively learning least squares estimates for
$m$ agents. Each agent observes a different subset of the
features$\unicode{x2013}$e.g., containing data collected from sensors of
varying resolution. Our goal is to determine how to coordinate the agents in
order to produce the best estimator for each agent. We propose a distributed,
semi-supervised algorithm Collab, consisting of three steps: local training,
aggregation, and distribution. Our procedure does not require communicating the
labeled data, making it communication efficient and useful in settings where
the labeled data is inaccessible. Despite this handicap, our procedure is
nearly asymptotically local minimax optimal$\unicode{x2013}$even among
estimators allowed to communicate the labeled data such as imputation methods.
We test our method on real and synthetic data.
- Abstract(参考訳): エージェントの最小二乗推定を協調的に学習する問題について検討する。
各エージェントは、様々な解像度のセンサーから収集されたデータを含む機能$\unicode{x2013}$の異なるサブセットを観察します。
私たちの目標は、エージェントごとに最適な推定器を生成するためにエージェントの調整方法を決定することです。
本研究では,局所学習,集約,分散の3つのステップからなる,半教師付き分散アルゴリズムcollabを提案する。
当社の手順ではラベル付きデータを通信する必要はなく,ラベル付きデータがアクセス不能な設定で効率的かつ有用な通信を行う。
このハンディキャップにもかかわらず、我々の手順はほぼ漸近的に局所的なミニマックス最適$\unicode{x2013}$evenである。
我々はこの手法を実データと合成データでテストする。
関連論文リスト
- Inverse Entropic Optimal Transport Solves Semi-supervised Learning via Data Likelihood Maximization [65.8915778873691]
条件分布は機械学習の中心的な問題です
ペアデータとペアデータの両方を統合する新しい学習パラダイムを提案する。
我々のアプローチはまた、興味深いことに逆エントロピー最適輸送(OT)と結びついている。
論文 参考訳(メタデータ) (2024-10-03T16:12:59Z) - Data Sharing for Mean Estimation Among Heterogeneous Strategic Agents [11.371461065112422]
通常の分布からサンプルを収集することにより,$m$エージェントがベクトル$muinmathbbRd$を推定する協調学習問題について検討する。
独自の作業を行う代わりに、エージェントはコストの安いデータを収集し、それと引き換えに他のデータと共有することができる。
論文 参考訳(メタデータ) (2024-07-20T17:45:40Z) - Numerical Data Imputation for Multimodal Data Sets: A Probabilistic
Nearest-Neighbor Kernel Density Approach [2.750124853532831]
近辺推定(k$NN)と密度推定をガウスカーネル(KDE)で組み合わせたデータ計算手法を提案する。
提案手法は, 複雑なデータ構造に対処し, より低いデータ計算誤差を発生し, 確率的推定を現在の手法よりも高い確率で行うことができることを示す。
論文 参考訳(メタデータ) (2023-06-29T12:55:58Z) - Bi-level Alignment for Cross-Domain Crowd Counting [113.78303285148041]
現在の手法は、補助的なタスクを訓練したり、高価な粗大な見積もりを適用したりするための外部データに依存している。
そこで我々は, 簡易かつ効率的に適用可能な, 逆学習に基づく新しい手法を開発した。
実世界の5つのクラウドカウントベンチマークに対するアプローチを評価し、既存のアプローチを大きなマージンで上回ります。
論文 参考訳(メタデータ) (2022-05-12T02:23:25Z) - Leveraging Ensembles and Self-Supervised Learning for Fully-Unsupervised
Person Re-Identification and Text Authorship Attribution [77.85461690214551]
完全ラベル付きデータからの学習は、Person Re-IdentificationやText Authorship Attributionなどのマルチメディアフォレスト問題において困難である。
近年の自己教師型学習法は,基礎となるクラスに意味的差異が有る場合に,完全ラベル付きデータを扱う際に有効であることが示されている。
本研究では,異なるクラスからのサンプルが顕著に多様性を持っていない場合でも,ラベルのないデータから学習できるようにすることにより,個人再認識とテキストオーサシップの属性に対処する戦略を提案する。
論文 参考訳(メタデータ) (2022-02-07T13:08:11Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Dealing with Distribution Mismatch in Semi-supervised Deep Learning for
Covid-19 Detection Using Chest X-ray Images: A Novel Approach Using Feature
Densities [0.6882042556551609]
半教師付きディープラーニングは、大きなラベル付きデータセットの魅力的な代替手段である。
実世界の使用状況設定では、ラベル付きデータセットとは異なる分布を示す可能性がある。
これにより、ラベル付きデータセットとラベル付きデータセットの分散ミスマッチが発生します。
論文 参考訳(メタデータ) (2021-08-17T00:35:43Z) - Achieving differential privacy for $k$-nearest neighbors based outlier
detection by data partitioning [0.3437656066916039]
我々は、$k$-NNに基づく外乱検出のための差分プライベート(epsilon$-DP)アプローチを開発した。
提案手法は,提案手法を参照不整合データに対する適合ステップに分離し,新しいデータに適用することで,$k$-NNに基づく外れ値検出を行う手法である。
提案手法は,$k$-NNの非プライベートバージョンと比較して,次元の異なる実世界のデータに対して,ほぼ最適な性能が得られる。
論文 参考訳(メタデータ) (2021-04-16T07:35:26Z) - How to distribute data across tasks for meta-learning? [59.608652082495624]
タスクごとのデータポイントの最適な数は予算に依存しますが、それは大きな予算のためのユニークな一定の値に収束します。
この結果から,データ収集の簡便かつ効率的な手順が示唆された。
論文 参考訳(メタデータ) (2021-03-15T15:38:47Z) - Learning while Respecting Privacy and Robustness to Distributional
Uncertainties and Adversarial Data [66.78671826743884]
分散ロバストな最適化フレームワークはパラメトリックモデルのトレーニングのために検討されている。
目的は、逆操作された入力データに対して頑健なトレーニングモデルを提供することである。
提案されたアルゴリズムは、オーバーヘッドがほとんどない堅牢性を提供する。
論文 参考訳(メタデータ) (2020-07-07T18:25:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。