Fugu-MT 論文翻訳(概要): A decision-theoretic model for a principal-agent collaborative learning problem

論文の概要: A decision-theoretic model for a principal-agent collaborative learning problem

arxiv url: http://arxiv.org/abs/2409.16068v1
Date: Tue, 24 Sep 2024 13:08:51 GMT
ステータス: 翻訳完了
システム内更新日: 2024-09-26 05:46:35.958661
Title: A decision-theoretic model for a principal-agent collaborative learning problem
Title（参考訳）: 主エージェント協調学習問題に対する意思決定理論モデル
Authors: Getachew K Befekadu,
Abstract要約: 本稿では,主成分が適切な凝集係数の集合を決定する主成分設定を伴う協調学習フレームワークについて考察する。提案したフレームワークは安定性と一般化の点でいくつかの利点があるが、主役とエージェントは必ずしもサンプル分布や互いのデータセットの品質を知る必要はない。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In this technical note, we consider a collaborative learning framework with principal-agent setting, in which the principal at each time-step determines a set of appropriate aggregation coefficients based on how the current parameter estimates from a group of $K$ agents effectively performed in connection with a separate test dataset, which is not part of the agents' training model datasets. Whereas, the agents, who act together as a team, then update their parameter estimates using a discrete-time version of Langevin dynamics with mean-field-like interaction term, but guided by their respective different training model datasets. Here, we propose a decision-theoretic framework that explicitly describes how the principal progressively determines a set of nonnegative and sum to one aggregation coefficients used by the agents in their mean-field-like interaction term, that eventually leading them to reach a consensus optimal parameter estimate. Interestingly, due to the inherent feedbacks and cooperative behavior among the agents, the proposed framework offers some advantages in terms of stability and generalization, despite that both the principal and the agents do not necessarily need to have any knowledge of the sample distributions or the quality of each others' datasets.
Abstract（参考訳）: 本稿では,各時点の主役が,エージェントのトレーニングモデルデータセットの一部ではない個別のテストデータセットと連動して実行された$K$エージェント群から,現在のパラメータを効果的に推定する方法に基づいて,適切なアグリゲーション係数のセットを決定する,プリンシパルエージェント設定による協調学習フレームワークについて考察する。一方、チームとして一緒に行動するエージェントは、平均フィールドのような相互作用項を持つランゲヴィンダイナミクスの離散時間バージョンを使用してパラメータ推定を更新するが、それぞれ異なるトレーニングモデルデータセットによってガイドされる。本稿では, エージェントが平均場的相互作用項で使用する1つの集約係数に対して, 主成分が非負および和の集合を段階的に決定し, 最終的にコンセンサス最適パラメータ推定に到達させる決定理論の枠組みを提案する。興味深いことに、エージェント間の固有のフィードバックと協調行動のため、提案フレームワークは安定性と一般化の面でいくつかの利点を提供するが、プリンシパルとエージェントの両方がサンプル分布やデータセットの品質について必ずしも知識を持っていなくてもよい。

関連論文リスト

STARec: An Efficient Agent Framework for Recommender Systems via Autonomous Deliberate Reasoning [54.28691219536054]
我々は、自律的な熟考的推論機能を備えたレコメンデータシステムを支援する、ゆっくり考えられた拡張エージェントフレームワークSTARecを紹介する。我々は,先進的推論モデルと嗜好整合型報酬形成から構造化知識の蒸留を組み合わせた2段階のパラダイムであるアンカー強化訓練を開発する。 MovieLens 1MとAmazon CDsベンチマークの実験では、STARecは最先端のベースラインと比較して、大幅なパフォーマンス向上を実現している。
論文参考訳（メタデータ） (2025-08-26T08:47:58Z)
An active learning framework for multi-group mean estimation [11.799152724436999]
未知のデータ分布を持つ複数のグループを対象とした基礎学習問題について検討する。本稿では, 分散推定値に拘束される上限値に基づいて群を逐次選択するアルゴリズム, Variance-UCBを提案する。
論文参考訳（メタデータ） (2025-05-20T20:13:04Z)
Collaborative Value Function Estimation Under Model Mismatch: A Federated Temporal Difference Analysis [55.13545823385091]
フェデレーション強化学習(FedRL)は、エージェント間のデータ交換を防止し、データのプライバシを維持しながら協調学習を可能にする。現実世界のアプリケーションでは、各エージェントは若干異なる遷移ダイナミクスを経験し、固有のモデルミスマッチを引き起こす。我々は、中程度のレベルの情報共有でも、環境固有のエラーを著しく軽減できることを示した。
論文参考訳（メタデータ） (2025-03-21T18:06:28Z)
Self-Interested Agents in Collaborative Machine Learning: An Incentivized Adaptive Data-Centric Framework [34.19393519060549]
本稿では,データ中心型協調機械学習のためのフレームワークを提案する。アービターはエージェントからデータのバッチを収集し、機械学習モデルをトレーニングし、各エージェントにデータコントリビューションを反映する独自のモデルを提供する。この設定は、共有データ影響モデルの更新を行うフィードバックループを確立し、結果のモデルが将来のデータ共有ポリシーをガイドする。
論文参考訳（メタデータ） (2024-12-09T15:47:36Z)
Who Walks With You Matters: Perceiving Social Interactions with Groups for Pedestrian Trajectory Prediction [14.009392073139441]
本稿では,GrouP ConCeption(GPCC)モデルを提案する。 GPCCモデルでは、軌道予測精度が大幅に向上し、社会的・個人的ダイナミクスをモデル化する上での有効性が検証された。
論文参考訳（メタデータ） (2024-12-03T11:47:33Z)
Causal Influence in Federated Edge Inference [34.487472866247586]
本稿では、未ラベルのストリーミングデータを用いて、接続性のある異種エージェントが推論を行う環境について考察する。不確実性を克服するために、エージェントは、融合センターを通じてローカルな推論を交換することで互いに協力する。エージェントの関与パターンや核融合センターの方針を反映した様々なシナリオを考察した。
論文参考訳（メタデータ） (2024-05-02T13:06:50Z)
Using representation balancing to learn conditional-average dose responses from clustered data [5.633848204699653]
関連する用量による介入に対する単位の反応を推定することは、様々な領域において関係している。本稿では,クラスタ化データによるモデル性能への影響を示すとともに,推定器であるCBRNetを提案する。
論文参考訳（メタデータ） (2023-09-07T14:17:44Z)
Building a Winning Team: Selecting Source Model Ensembles using a Submodular Transferability Estimation Approach [20.86345962679122]
公開されている事前訓練されたモデルの目標タスクへの転送可能性の推定は、伝達学習タスクにとって重要な場所となっている。本稿では, モデルアンサンブルの下流タスクへの転送可能性を評価するために, 最適なtranSportベースのsuBmOdular tRaNsferability Metrics(OSBORN)を提案する。
論文参考訳（メタデータ） (2023-09-05T17:57:31Z)
Rethinking Trajectory Prediction via "Team Game" [118.59480535826094]
本稿では,対話型グループコンセンサスの概念を明示的に導入した,マルチエージェント軌道予測の新しい定式化について述べる。チームスポーツと歩行者の2つのマルチエージェント設定において,提案手法は既存手法と比較して常に優れた性能を達成している。
論文参考訳（メタデータ） (2022-10-17T07:16:44Z)
Multi-Agent Imitation Learning with Copulas [102.27052968901894]
マルチエージェント模倣学習は、観察と行動のマッピングを学習することで、デモからタスクを実行するために複数のエージェントを訓練することを目的としている。本稿では,確率変数間の依存を捉える強力な統計ツールである copula を用いて,マルチエージェントシステムにおける相関関係と協調関係を明示的にモデル化する。提案モデルでは,各エージェントの局所的行動パターンと,エージェント間の依存構造のみをフルにキャプチャするコプラ関数を別々に学習することができる。
論文参考訳（メタデータ） (2021-07-10T03:49:41Z)
Test-time Collective Prediction [73.74982509510961]
マシンラーニングの複数のパーティは、将来のテストポイントを共同で予測したいと考えています。エージェントは、すべてのエージェントの集合の集合的な専門知識の恩恵を受けることを望んでいるが、データやモデルパラメータを解放する意思はないかもしれない。我々は、各エージェントの事前学習モデルを利用して、テスト時に集合的な予測を行う分散型メカニズムを探索する。
論文参考訳（メタデータ） (2021-06-22T18:29:58Z)
A General Framework for Distributed Inference with Uncertain Models [14.8884251609335]
異種エージェントのネットワークを用いた分散分類の問題について検討する。我々は、エージェントの不確実性を可能性に組み込む不確実性モデルの概念に基づいて構築する。
論文参考訳（メタデータ） (2020-11-20T22:17:12Z)
Combining Task Predictors via Enhancing Joint Predictability [53.46348489300652]
そこで本研究では,目標予測能力に基づいて参照の関連性を測定し,その関連性を高めるための新しい予測器組合せアルゴリズムを提案する。提案アルゴリズムはベイズフレームワークを用いて,すべての参照の関連性について共同で評価する。視覚属性ランキングとマルチクラス分類シナリオから得られた実世界の7つのデータセットの実験に基づいて,本アルゴリズムが性能向上に寄与し,既存の予測器の組み合わせアプローチの適用範囲を広くすることを示した。
論文参考訳（メタデータ） (2020-07-15T21:58:39Z)
Randomized Entity-wise Factorization for Multi-Agent Reinforcement Learning [59.62721526353915]
実世界のマルチエージェント設定は、エージェントや非エージェントエンティティのタイプや量が異なるタスクを伴うことが多い。我々の方法は、これらの共通点を活用することを目的としており、「観察対象のランダムに選択されたサブグループのみを考えるとき、各エージェントが期待する効用は何か?」という問いを投げかける。
論文参考訳（メタデータ） (2020-06-07T18:28:41Z)
Dynamic Federated Learning [57.14673504239551]
フェデレートラーニング(Federated Learning)は、マルチエージェント環境における集中的なコーディネーション戦略の包括的用語として登場した。我々は、各イテレーションにおいて、利用可能なエージェントのランダムなサブセットがそのデータに基づいてローカル更新を実行する、フェデレートされた学習モデルを考える。集約最適化問題に対する真の最小化器上の非定常ランダムウォークモデルの下で、アーキテクチャの性能は、各エージェントにおけるデータ変動率、各エージェントにおけるモデル変動率、アルゴリズムの学習率に逆比例する追跡項の3つの要因によって決定されることを示す。
論文参考訳（メタデータ） (2020-02-20T15:00:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。