Fugu-MT 論文翻訳(概要): Sequential Cooperative Bayesian Inference

論文の概要: Sequential Cooperative Bayesian Inference

arxiv url: http://arxiv.org/abs/2002.05706v3
Date: Wed, 1 Jul 2020 13:25:21 GMT
ステータス: 翻訳完了
システム内更新日: 2023-01-01 13:04:18.543758
Title: Sequential Cooperative Bayesian Inference
Title（参考訳）: 連続的協調ベイズ推定
Authors: Junqi Wang, Pei Wang, Patrick Shafto
Abstract要約: 協調とは、データを選択するエージェントとデータから学習するエージェントが同じ目標を持ち、学習者が意図した仮説を推測することを意味する。近年の人間と機械学習のモデルが協調の可能性を実証している。
参考スコア（独自算出の注目度）: 16.538512182336827
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Cooperation is often implicitly assumed when learning from other agents. Cooperation implies that the agent selecting the data, and the agent learning from the data, have the same goal, that the learner infer the intended hypothesis. Recent models in human and machine learning have demonstrated the possibility of cooperation. We seek foundational theoretical results for cooperative inference by Bayesian agents through sequential data. We develop novel approaches analyzing consistency, rate of convergence and stability of Sequential Cooperative Bayesian Inference (SCBI). Our analysis of the effectiveness, sample efficiency and robustness show that cooperation is not only possible in specific instances but theoretically well-founded in general. We discuss implications for human-human and human-machine cooperation.
Abstract（参考訳）: 他のエージェントから学ぶとき、しばしば協力は暗黙的に仮定される。協調とは、データを選択するエージェントとデータから学習するエージェントが同じ目標を持ち、学習者が意図した仮説を推測することを意味する。近年の人間と機械学習のモデルは協調の可能性を示している。我々はシーケンシャルデータを通じてベイズエージェントによる協調推論のための基礎的理論的結果を求める。逐次協調ベイズ推論(SCBI)の一貫性,収束率,安定性を解析する新しい手法を開発した。有効性, サンプル効率, 堅牢性の分析から, 協調は特定の事例だけでなく, 理論上は十分に確立されていることが示唆された。我々は,人間と機械の協調の意義について論じる。

関連論文リスト

Collaborative Value Function Estimation Under Model Mismatch: A Federated Temporal Difference Analysis [55.13545823385091]
フェデレーション強化学習(FedRL)は、エージェント間のデータ交換を防止し、データのプライバシを維持しながら協調学習を可能にする。現実世界のアプリケーションでは、各エージェントは若干異なる遷移ダイナミクスを経験し、固有のモデルミスマッチを引き起こす。我々は、中程度のレベルの情報共有でも、環境固有のエラーを著しく軽減できることを示した。
論文参考訳（メタデータ） (2025-03-21T18:06:28Z)
When Trust Collides: Decoding Human-LLM Cooperation Dynamics through the Prisoner's Dilemma [10.143277649817096]
本研究では,大規模言語モデル(LLM)エージェントに対する人間の協調的態度と行動について検討する。その結果, エージェントアイデンティティがほとんどの協調行動に有意な影響を及ぼすことが明らかとなった。これらの知見は,自律エージェントとの競争におけるヒト適応の理解に寄与する。
論文参考訳（メタデータ） (2025-03-10T13:37:36Z)
Collaborative Gym: A Framework for Enabling and Evaluating Human-Agent Collaboration [51.452664740963066]
Collaborative Gymは、エージェント、人間、タスク環境間の非同期で三分割的なインタラクションを可能にするフレームワークである。シミュレーション条件と実環境条件の両方において,Co-Gymを3つの代表的なタスクでインスタンス化する。その結果、協調作業員はタスクパフォーマンスにおいて、完全に自律的なエージェントよりも一貫して優れていたことが判明した。
論文参考訳（メタデータ） (2024-12-20T09:21:15Z)
Multi-agent cooperation through learning-aware policy gradients [53.63948041506278]
利己的な個人はしばしば協力に失敗し、マルチエージェント学習の根本的な課題を提起する。本稿では,学習型強化学習のための,偏見のない高導出性ポリシー勾配アルゴリズムを提案する。我々は, 受刑者のジレンマから, 自己関心のある学習エージェントの間でどのように, いつ, 協力関係が生じるかの新たな説明を得た。
論文参考訳（メタデータ） (2024-10-24T10:48:42Z)
Balancing Similarity and Complementarity for Federated Learning [91.65503655796603]
フェデレートラーニング(FL)は、モバイルとIoTシステムにおいてますます重要になっている。 FLの重要な課題の1つは、非i.d.データのような統計的不均一性を管理することである。 FL協調における類似性と相補性のバランスをとる新しいフレームワークである texttFedSaC を導入する。
論文参考訳（メタデータ） (2024-05-16T08:16:19Z)
Decentralized and Lifelong-Adaptive Multi-Agent Collaborative Learning [57.652899266553035]
分散型および生涯適応型多エージェント協調学習は、中央サーバを使わずに複数のエージェント間のコラボレーションを強化することを目的としている。動的協調グラフを用いた分散マルチエージェント生涯協調学習アルゴリズムであるDeLAMAを提案する。
論文参考訳（メタデータ） (2024-03-11T09:21:11Z)
Multi-Agent Dynamic Relational Reasoning for Social Robot Navigation [50.01551945190676]
社会ロボットナビゲーションは、日常生活の様々な状況において有用であるが、安全な人間とロボットの相互作用と効率的な軌道計画が必要である。本稿では, 動的に進化する関係構造を明示的に推論した系統的関係推論手法を提案する。マルチエージェント軌道予測とソーシャルロボットナビゲーションの有効性を実証する。
論文参考訳（メタデータ） (2024-01-22T18:58:22Z)
QUEST: Query Stream for Practical Cooperative Perception [5.750142092931156]
本稿では,解釈可能なインスタンスレベルのフレキシブルな機能インタラクションを実現するためのクエリ協調の概念を提案する。クロスエージェントクエリは、共同認識インスタンスの融合と、個々の未認識インスタンスの補完を通じて対話される。
論文参考訳（メタデータ） (2023-08-03T15:06:23Z)
Tackling Cooperative Incompatibility for Zero-Shot Human-AI Coordination [36.33334853998621]
協調的オープンエンド・ラーニング(COLE)フレームワークを導入し,学習における協調的非互換性を解決する。 COLEは、グラフ理論の観点を用いて、2人のプレイヤーと協調ゲームにおけるオープンエンド目標を定式化し、各戦略の協調能力を評価し、特定する。我々は,COLEが理論的および経験的分析から協調的不整合性を効果的に克服できることを示した。
論文参考訳（メタデータ） (2023-06-05T16:51:38Z)
Intuitive and Efficient Human-robot Collaboration via Real-time Approximate Bayesian Inference [4.310882094628194]
コラボレーションロボットとエンドツーエンドAIは、工場や倉庫における人間のタスクの柔軟な自動化を約束する。人間とコボットは互いに協力します。これらのコラボレーションが効果的で安全であるためには、ロボットは人間の意図をモデル化し、予測し、活用する必要がある。
論文参考訳（メタデータ） (2022-05-17T23:04:44Z)
Human-Algorithm Collaboration: Achieving Complementarity and Avoiding Unfairness [92.26039686430204]
慎重に設計されたシステムであっても、補完的な性能はあり得ないことを示す。まず,簡単な人間アルゴリズムをモデル化するための理論的枠組みを提案する。次に、このモデルを用いて相補性が不可能な条件を証明する。
論文参考訳（メタデータ） (2022-02-17T18:44:41Z)
Multi-Agent Imitation Learning with Copulas [102.27052968901894]
マルチエージェント模倣学習は、観察と行動のマッピングを学習することで、デモからタスクを実行するために複数のエージェントを訓練することを目的としている。本稿では,確率変数間の依存を捉える強力な統計ツールである copula を用いて,マルチエージェントシステムにおける相関関係と協調関係を明示的にモデル化する。提案モデルでは,各エージェントの局所的行動パターンと,エージェント間の依存構造のみをフルにキャプチャするコプラ関数を別々に学習することができる。
論文参考訳（メタデータ） (2021-07-10T03:49:41Z)
A mechanism of Individualistic Indirect Reciprocity with internal and external dynamics [0.0]
本研究は,エージェントの態度に着目した Nowak モデルと Sigmund モデルの新しい変種を提案する。エージェントベースモデルとデータサイエンス手法を用いて,エージェントの識別的スタンスがほとんどの場合優位であることを示す。また, 他者の評判が不明な場合には, 不均一性が高く, 協力需要が高い場合には, 異種社会が得られることも示唆した。
論文参考訳（メタデータ） (2021-05-28T23:28:50Z)
Distributed Bayesian Online Learning for Cooperative Manipulation [9.582645137247667]
ベイズ原理を用いた協調操作の模範的タスクのための新しい分散学習フレームワークを提案する。各エージェントは、局所状態情報のみを使用して、オブジェクトダイナミクスの推定を取得し、キネマティクスを把握する。対象のダイナミクスと把持キネマティックスの各々の推定には不確実性の尺度が伴うため、高い確率で有界な予測誤差を保証できる。
論文参考訳（メタデータ） (2021-04-09T13:03:09Z)
Double Robust Representation Learning for Counterfactual Prediction [68.78210173955001]
そこで本稿では, 対実予測のための2次ロバスト表現を学習するための, スケーラブルな新しい手法を提案する。我々は、個々の治療効果と平均的な治療効果の両方に対して、堅牢で効率的な対実的予測を行う。このアルゴリズムは,実世界の最先端技術と合成データとの競合性能を示す。
論文参考訳（メタデータ） (2020-10-15T16:39:26Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。