論文の概要: Data Games: A Game-Theoretic Approach to Swarm Robotic Data Collection
- arxiv url: http://arxiv.org/abs/2303.03602v1
- Date: Tue, 7 Mar 2023 02:40:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-08 16:46:01.925489
- Title: Data Games: A Game-Theoretic Approach to Swarm Robotic Data Collection
- Title(参考訳): データゲーム:swarmロボットデータ収集へのゲーム理論的アプローチ
- Authors: Oguzhan Akcin, Po-han Li, Shubhankar Agarwal, Sandeep Chinchali
- Abstract要約: 本研究では、地理的に分散した自動運転車が協調してクラウド上の多様な機械学習データセットを収集する、協調的なデータサンプリング戦略を提案する。
当社の戦略は最小限の情報を用いて,全AVに関する完全な情報を備えた一元的なオラクル政策に収束することを示します。
提案手法は, 4つの知覚データセットに対して, 標準ベンチマークを最大21.9%上回る性能を実証した。
- 参考スコア(独自算出の注目度): 1.2599533416395765
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fleets of networked autonomous vehicles (AVs) collect terabytes of sensory
data, which is often transmitted to central servers (the ''cloud'') for
training machine learning (ML) models. Ideally, these fleets should upload all
their data, especially from rare operating contexts, in order to train robust
ML models. However, this is infeasible due to prohibitive network bandwidth and
data labeling costs. Instead, we propose a cooperative data sampling strategy
where geo-distributed AVs collaborate to collect a diverse ML training dataset
in the cloud. Since the AVs have a shared objective but minimal information
about each other's local data distribution and perception model, we can
naturally cast cooperative data collection as an $N$-player mathematical game.
We show that our cooperative sampling strategy uses minimal information to
converge to a centralized oracle policy with complete information about all
AVs. Moreover, we theoretically characterize the performance benefits of our
game-theoretic strategy compared to greedy sampling. Finally, we experimentally
demonstrate that our method outperforms standard benchmarks by up to $21.9\%$
on 4 perception datasets, including for autonomous driving in adverse weather
conditions. Crucially, our experimental results on real-world datasets closely
align with our theoretical guarantees.
- Abstract(参考訳): ネットワーク化された自動運転車(AV)のフリートはテラバイト単位の知覚データを収集し、機械学習(ML)モデルをトレーニングするために中央サーバー('クラウド')に送信されることが多い。
理想的には、これらのフリートは、堅牢なMLモデルをトレーニングするために、特に稀な運用状況から、すべてのデータをアップロードする必要がある。
しかし、ネットワーク帯域幅の禁止とデータラベリングコストのため、これは実現不可能である。
代わりに,地理的分布型avが協調して多様なmlトレーニングデータセットをクラウドに収集する協調的データサンプリング戦略を提案する。
avsは共通の目的を持つが、互いのローカルなデータ分布と知覚モデルに関する情報は最小限であるので、自然にn$-player mathematical gameとして協調データ収集をキャストすることができる。
当社の協力的サンプリング戦略は,すべてのavに関する完全な情報を備えた集中型oracleポリシに収束するために,最小限の情報を使用します。
さらに,ゲーム理論的な戦略の性能上の利点を,欲望的なサンプリングと比較して理論的に特徴づける。
最後に, 気象条件下での自律運転を含む4つの知覚データセットに対して, 標準ベンチマークを最大21.9 %以上上回る性能を示した。
重要なことは、実世界のデータセットに関する実験結果は、我々の理論的保証と密接に一致している。
関連論文リスト
- Federated Learning for Misbehaviour Detection with Variational Autoencoders and Gaussian Mixture Models [0.2999888908665658]
Federated Learning (FL)は、機械学習(ML)モデルを協調的にトレーニングするための魅力的なアプローチになっている。
本研究は、車載環境における潜在的な不適切な行動を特定するための、新しい教師なしFLアプローチを提案する。
当社は、モデルアグリゲーションの目的のために、パブリッククラウドサービスのコンピューティング能力を活用しています。
論文 参考訳(メタデータ) (2024-05-16T08:49:50Z) - How to Train Data-Efficient LLMs [56.41105687693619]
事前学習言語モデル(LLM)に対するデータ効率のアプローチについて検討する。
Ask-LLMと密度サンプリングがそれぞれのカテゴリで最適であることがわかった。
何百もの評価タスクと事前学習作業を含む19個のサンプルを比較したところ,Ask-LLMと密度がそれぞれのカテゴリで最適な方法であることが判明した。
論文 参考訳(メタデータ) (2024-02-15T02:27:57Z) - Task-customized Masked AutoEncoder via Mixture of Cluster-conditional
Experts [104.9871176044644]
Masked Autoencoder (MAE) は,モデル事前学習において有望な結果が得られる自己教師型学習手法である。
我々は、新しいMAEベースの事前学習パラダイム、Mixture of Cluster-conditional Experts (MoCE)を提案する。
MoCEは、クラスタ条件ゲートを使用して、各専門家にセマンティックなイメージのみをトレーニングする。
論文 参考訳(メタデータ) (2024-02-08T03:46:32Z) - Robot Fleet Learning via Policy Merging [58.5086287737653]
我々はFLEET-MERGEを提案し、艦隊設定における政策を効率的にマージする。
本稿では,FLEET-MERGEがメタワールド環境における50のタスクで訓練されたポリシーの行動を統合することを示す。
合成・接触に富んだロボット操作タスクにおけるフリートポリシー学習のための新しいロボットツール用ベンチマークであるFLEET-TOOLSを導入する。
論文 参考訳(メタデータ) (2023-10-02T17:23:51Z) - Exploring One-shot Semi-supervised Federated Learning with A Pre-trained Diffusion Model [40.83058938096914]
我々は,フェデレート拡散にインスパイアされた半教師付き協調学習法であるFedDISCを提案する。
まず、ラベル付きサーバデータのプロトタイプを抽出し、これらのプロトタイプを用いてクライアントデータの擬似ラベルを予測する。
各カテゴリについて、クラスタセントロイドとドメイン固有の表現を計算し、それらの分布のセマンティックおよびスタイリスティックな情報を表す。
これらの表現はサーバに送信され、事前にトレーニングされたデータを使用して、クライアントの分布に応じて合成データセットを生成し、その上でグローバルモデルをトレーニングする。
論文 参考訳(メタデータ) (2023-05-06T14:22:33Z) - Benchmarking FedAvg and FedCurv for Image Classification Tasks [1.376408511310322]
本稿では,同じフェデレーションネットワークにおけるデータの統計的不均一性の問題に焦点をあてる。
FedAvg、FedProx、Federated Curvature(FedCurv)など、いくつかのフェデレートラーニングアルゴリズムがすでに提案されている。
この研究の副産物として、FLコミュニティからのさらなる比較を容易にするために使用したデータセットの非IIDバージョンをリリースします。
論文 参考訳(メタデータ) (2023-03-31T10:13:01Z) - Scalable Collaborative Learning via Representation Sharing [53.047460465980144]
フェデレートラーニング(FL)とスプリットラーニング(SL)は、データを(デバイス上で)プライベートにしながら協調学習を可能にする2つのフレームワークである。
FLでは、各データ保持者がモデルをローカルにトレーニングし、集約のために中央サーバにリリースする。
SLでは、クライアントは個々のカット層アクティベーション(スマッシュされたデータ)をサーバにリリースし、そのレスポンス(推論とバックの伝搬の両方)を待つ必要があります。
本研究では, クライアントがオンライン知識蒸留を通じて, 対照的な損失を生かして協調する, プライバシ保護機械学習の新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-11-20T10:49:22Z) - DYNAFED: Tackling Client Data Heterogeneity with Global Dynamics [60.60173139258481]
非イド分散データに対する局所訓練は、偏向局所最適化をもたらす。
自然な解決策は、サーバがデータ分散全体のグローバルなビューを持つように、すべてのクライアントデータをサーバに収集することです。
本稿では,データプライバシを損なうことなく,サーバ上でのグローバルな知識の収集と活用を図る。
論文 参考訳(メタデータ) (2022-11-20T06:13:06Z) - Few-Shot Non-Parametric Learning with Deep Latent Variable Model [50.746273235463754]
遅延変数を用いた圧縮による非パラメトリック学習(NPC-LV)を提案する。
NPC-LVは、ラベルなしデータが多いがラベル付きデータはほとんどないデータセットの学習フレームワークである。
我々は,NPC-LVが低データ構造における画像分類における3つのデータセットの教師あり手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-06-23T09:35:03Z) - MLReal: Bridging the gap between training on synthetic data and real
data applications in machine learning [1.9852463786440129]
本稿では,実際のデータ特徴を持つ合成データの教師付きトレーニングを強化するための新しいアプローチについて述べる。
トレーニング段階では、入力データは合成ドメインから、自動相関データは実ドメインからである。
推論/アプリケーション段階では、入力データは実サブセットドメインからであり、自己相関区間の平均は合成データサブセットドメインからである。
論文 参考訳(メタデータ) (2021-09-11T14:43:34Z) - Federated Visual Classification with Real-World Data Distribution [9.564468846277366]
我々は,FedAvg(Federated Averaging)アルゴリズムのベンチマークを用いて,実世界のデータ分布が分散学習に与える影響を特徴付ける。
種別とランドマーク分類のための2つの新しい大規模データセットを導入し,ユーザ毎のデータ分割を現実的に行う。
また、2つの新しいアルゴリズム(FedVC、FedIR)も開発しています。
論文 参考訳(メタデータ) (2020-03-18T07:55:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。