Fugu-MT 論文翻訳(概要): Cooperative Online Learning

論文の概要: Cooperative Online Learning

arxiv url: http://arxiv.org/abs/2106.04982v1
Date: Wed, 9 Jun 2021 11:01:55 GMT
ステータス: 翻訳完了
システム内更新日: 2021-06-11 00:09:05.606105
Title: Cooperative Online Learning
Title（参考訳）: 協調型オンライン学習
Authors: Tommaso R. Cesari, Riccardo Della Vecchia
Abstract要約: エージェントネットワークを用いたオンライン学習環境について検討する。完全, 包括的, 半包括的フィードバックの事例を考察する。本研究は, 単エージェント学習の遅れを軽減し, 包括的フィードバックケースと包括的フィードバックケースの両方に適用する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In this preliminary (and unpolished) version of the paper, we study an asynchronous online learning setting with a network of agents. At each time step, some of the agents are activated, requested to make a prediction, and pay the corresponding loss. Some feedback is then revealed to these agents and is later propagated through the network. We consider the case of full, bandit, and semi-bandit feedback. In particular, we construct a reduction to delayed single-agent learning that applies to both the full and the bandit feedback case and allows to obtain regret guarantees for both settings. We complement these results with a near-matching lower bound.
Abstract（参考訳）: 本論文の予備的(かつ精査されていない)版では,エージェントのネットワークを用いた非同期オンライン学習環境について検討する。それぞれの時間ステップで、エージェントのいくつかがアクティベートされ、予測を要求され、対応する損失を支払う。いくつかのフィードバックがこれらのエージェントに公開され、後にネットワークを通じて伝達される。完全, 包括的, 半包括的フィードバックの事例を考察する。特に,フルとバンディットの両方のフィードバックケースに適用可能な遅延単一エージェント学習の削減を行い,両方の設定に対して後悔の保証を得ることを可能にした。これらの結果をほぼ一致する下限で補完する。

関連論文リスト

Sentiment Analysis in Learning Management Systems Understanding Student Feedback at Scale [0.0]
非言語コミュニケーションの欠如は、教育経験の有効性を低下させる言葉によるフィードバックへの依存につながった。本稿では,学生と教師のギャップを埋めるために,感情分析を学習管理システム(LMS)に統合することを検討する。
論文参考訳（メタデータ） (2025-06-05T18:13:07Z)
Playpen: An Environment for Exploring Learning Through Conversational Interaction [81.67330926729015]
本研究は,対話ゲームが学習のフィードバック信号の源として機能するかどうかを考察する。本稿では,対話ゲームによるオフラインおよびオンライン学習環境であるPlaypenを紹介する。 SFTによる模倣学習は、目に見えないインスタンスのパフォーマンスを向上させるが、他のスキルに悪影響を及ぼす。
論文参考訳（メタデータ） (2025-04-11T14:49:33Z)
Exploiting Structure in Offline Multi-Agent RL: The Benefits of Low Interaction Rank [52.831993899183416]
相互作用ランクという構造的仮定を導入し、相互作用ランクの低い関数が一般的なものよりも分布シフトに対して著しく堅牢であることを示す。我々は,非正規化と非正規化学習と組み合わせることで,オフラインMARLにおける分散的,計算的,統計的に効率的な学習が可能であることを実証した。
論文参考訳（メタデータ） (2024-10-01T22:16:22Z)
On Discprecncies between Perturbation Evaluations of Graph Neural Network Attributions [49.8110352174327]
我々は、グラフ領域で以前に検討されていない視点から帰属法を評価する:再学習。中心となる考え方は、属性によって識別される重要な(あるいは重要でない)関係でネットワークを再訓練することである。我々は4つの最先端GNN属性法と5つの合成および実世界のグラフ分類データセットについて分析を行った。
論文参考訳（メタデータ） (2024-01-01T02:03:35Z)
Gossiped and Quantized Online Multi-Kernel Learning [39.057968279167966]
ネットワーク内の各ノードが通信できる限り、分散およびオンラインマルチカーネル学習がサブ線形後悔をもたらすことを示す。このレターは、これらの結果を非完全連結グラフに拡張するが、これは無線センサーネットワークでよく見られる。本稿では,ゴシップアルゴリズムを提案し,それがサブ線形後悔を達成できることを示す。
論文参考訳（メタデータ） (2023-01-24T07:12:40Z)
Modality Competition: What Makes Joint Training of Multi-modal Network Fail in Deep Learning? (Provably) [75.38159612828362]
最高のユニモーダルネットワークは、共同で訓練されたマルチモーダルネットワークよりも優れていることが観察されている。この研究は、ニューラルネットワークにおけるそのようなパフォーマンスギャップの出現に関する理論的な説明を提供する。
論文参考訳（メタデータ） (2022-03-23T06:21:53Z)
Finite-Time Consensus Learning for Decentralized Optimization with Nonlinear Gossiping [77.53019031244908]
本稿では,非線形ゴシップ(NGO)に基づく分散学習フレームワークを提案する。コミュニケーション遅延とランダム化チャットが学習にどう影響するかを解析することで,実践的なバリエーションの導出が可能となる。
論文参考訳（メタデータ） (2021-11-04T15:36:25Z)
Asynchronous Upper Confidence Bound Algorithms for Federated Linear Bandits [35.47147821038291]
本稿では,同種クライアントと異種クライアントの集合に対する非同期モデル更新と通信を行う汎用フレームワークを提案する。この分散学習フレームワークにおける後悔とコミュニケーションのコストに関する厳密な理論的分析が提供される。
論文参考訳（メタデータ） (2021-10-04T14:01:32Z)
On In-network learning. A Comparative Study with Federated and Split Learning [14.924672048447338]
本稿では,無線ネットワークにおいて,分散抽出機能を用いて推論を行う問題について考察する。本稿では,提案するアーキテクチャを「ネットワーク内学習」と呼び,適切な損失関数を提供し,ニューラルネットワークを用いた最適化について考察する。
論文参考訳（メタデータ） (2021-04-30T11:50:11Z)
NetReAct: Interactive Learning for Network Summarization [60.18513812680714]
本論文では,テキストコーポラによる感覚生成のネットワーク可視化を支援する,新しいインタラクティブネットワーク要約アルゴリズムであるNetReActを提案する。 netreactが、他の非自明なベースラインよりも、隠れたパターンを明らかにする高品質な要約や視覚化の生成に成功していることを示す。
論文参考訳（メタデータ） (2020-12-22T03:56:26Z)
Robust Asynchronous and Network-Independent Cooperative Learning [1.712689361909955]
エージェントのネットワークが仮説に共同で同意しようとする分散非ベイズ学習による協調学習のモデルを考える。提案した学習力学は,ネットワーク内のすべてのエージェントが,誤った仮説に対する信念を指数関数的に崩壊させることを保証している。
論文参考訳（メタデータ） (2020-10-20T03:54:20Z)
Learning Connectivity of Neural Networks from a Topological Perspective [80.35103711638548]
本稿では,ネットワークを解析のための完全なグラフに表現するためのトポロジ的視点を提案する。接続の規模を反映したエッジに学習可能なパラメータを割り当てることにより、学習プロセスを異なる方法で行うことができる。この学習プロセスは既存のネットワークと互換性があり、より大きな検索空間と異なるタスクへの適応性を持っている。
論文参考訳（メタデータ） (2020-08-19T04:53:31Z)
Social Network Analytics for Churn Prediction in Telco: Model Building, Evaluation and Network Architecture [8.592714155264613]
ソーシャルネットワークのアナリティクスは、通信業界で顧客の混乱を予測するために使われており、大きな成功を収めている。我々は,8つのコール・ディテール・レコード・データセットに適用することにより,関係学習者を構築するための様々な戦略をベンチマークする。本稿では,通信業界におけるソーシャルネットワーク分析の適用方法に関するガイドラインを最適に提示する。
論文参考訳（メタデータ） (2020-01-18T17:09:22Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。