Fugu-MT 論文翻訳(概要): Federated Learning of Socially Appropriate Agent Behaviours in Simulated Home Environments

論文の概要: Federated Learning of Socially Appropriate Agent Behaviours in Simulated Home Environments

arxiv url: http://arxiv.org/abs/2403.07586v1
Date: Tue, 12 Mar 2024 12:16:40 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-13 21:31:55.900680
Title: Federated Learning of Socially Appropriate Agent Behaviours in Simulated Home Environments
Title（参考訳）: 模擬家庭環境における社会的に適切なエージェント行動のフェデレーション学習
Authors: Saksham Checker and Nikhil Churamani and Hatice Gunes
Abstract要約: 社会ロボットは日々の生活にますます統合され、彼らの行動が社会的規範と整合することを保証することが不可欠である。個々のロボットが独自の環境について学ぶことのできるフェデレートラーニング(FL)設定を探求することが重要である。本稿では,複数ラベルの回帰目標を用いて,異なる戦略を評価する新しいFLベンチマークを提案する。
参考スコア（独自算出の注目度）: 6.284099600214928
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: As social robots become increasingly integrated into daily life, ensuring their behaviours align with social norms is crucial. For their widespread open-world application, it is important to explore Federated Learning (FL) settings where individual robots can learn about their unique environments while also learning from each others' experiences. In this paper, we present a novel FL benchmark that evaluates different strategies, using multi-label regression objectives, where each client individually learns to predict the social appropriateness of different robot actions while also sharing their learning with others. Furthermore, splitting the training data by different contexts such that each client incrementally learns across contexts, we present a novel Federated Continual Learning (FCL) benchmark that adapts FL-based methods to use state-of-the-art Continual Learning (CL) methods to continually learn socially appropriate agent behaviours under different contextual settings. Federated Averaging (FedAvg) of weights emerges as a robust FL strategy while rehearsal-based FCL enables incrementally learning the social appropriateness of robot actions, across contextual splits.
Abstract（参考訳）: ソーシャルロボットが日々の生活に統合されるにつれ、彼らの行動が社会的規範に合致することを保証することが重要である。広く普及しているオープンワールドアプリケーションでは、個々のロボットが独自の環境について学びながら、お互いの経験から学ぶことができるフェデレーション学習(fl)の設定を探求することが重要である。本稿では,各クライアントが個別に学習し,異なるロボット行動の社会的適切性を予測し,学習を他人と共有する,多ラベル回帰目標を用いて,異なる戦略を評価する新しいFLベンチマークを提案する。さらに、各クライアントが状況に応じて漸進的に学習するような異なるコンテキストでトレーニングデータを分割し、FLベースの手法を用いて、状況に応じて社会的に適切なエージェント動作を継続的に学習するFCL(Federated Continual Learning)ベンチマークを提案する。重みのフェデレーション(FedAvg)は強靭なFL戦略として現れ、リハーサルベースのFCLはコンテキスト分割を通じてロボット行動の社会的適切性を漸進的に学習する。

関連論文リスト

RLSLM: A Hybrid Reinforcement Learning Framework Aligning Rule-Based Social Locomotion Model with Human Social Norms [1.5561226067871505]
不快を生じさせることなく、人口の多い環境をナビゲートすることは、社会的に認識されるエージェントにとって重要な能力である。本稿では,ルールに基づくソーシャルロコモーションモデルを強化学習フレームワークに統合したハイブリッド強化学習フレームワーク RLSLM を提案する。
論文参考訳（メタデータ） (2025-11-14T13:59:40Z)
Consistently Simulating Human Personas with Multi-Turn Reinforcement Learning [52.07170679746533]
大規模言語モデル(LLM)は、セラピー、教育、社会的役割プレイといったインタラクティブな環境において、人間のユーザをシミュレートするためにますます使われています。 LLM生成対話におけるペルソナの一貫性の評価と改善のための統一的なフレームワークを提案する。我々は3つの自動メトリクス、即行一貫性、行間一貫性、Q&A一貫性を定義し、異なるタイプのペルソナドリフトをキャプチャし、それぞれが人間のアノテーションに対して検証する。
論文参考訳（メタデータ） (2025-10-31T19:40:41Z)
PersLLM: A Personified Training Approach for Large Language Models [66.16513246245401]
社会実践, 一貫性, 動的発達という, 心理学に根ざした個性の原則を統合したPersLLMを提案する。モデルパラメータに直接パーソナリティ特性を組み込み、誘導に対するモデルの抵抗性を高め、一貫性を高め、パーソナリティの動的進化を支援する。
論文参考訳（メタデータ） (2024-07-17T08:13:22Z)
Feature Aggregation with Latent Generative Replay for Federated Continual Learning of Socially Appropriate Robot Behaviours [6.456043270889434]
本研究は,ロボットが行動の社会的適切さを学習する必要がある,シミュレーションされたリビングルーム環境を探索する。クライアント間で特徴学習を阻害する新しい重み集約戦略であるFederated Root(FedRoot)を提案する。本稿では,多様な社会的構成の異なるロボット行動の社会的適切性を学習するための新しいFLベンチマークを提案する。
論文参考訳（メタデータ） (2024-03-16T07:34:33Z)
Evaluating and Improving Continual Learning in Spoken Language Understanding [58.723320551761525]
本研究では,連続学習における安定性,可塑性,一般化性に関する統一的な評価手法を提案する。提案手法を用いることで,SLUモデルのこれらの3つの特性の異なる側面を,様々な知識蒸留の導入によってどのように改善するかを実証する。
論文参考訳（メタデータ） (2024-02-16T03:30:27Z)
Robot Fleet Learning via Policy Merging [58.5086287737653]
我々はFLEET-MERGEを提案し、艦隊設定における政策を効率的にマージする。本稿では,FLEET-MERGEがメタワールド環境における50のタスクで訓練されたポリシーの行動を統合することを示す。合成・接触に富んだロボット操作タスクにおけるフリートポリシー学習のための新しいロボットツール用ベンチマークであるFLEET-TOOLSを導入する。
論文参考訳（メタデータ） (2023-10-02T17:23:51Z)
Training Socially Aligned Language Models on Simulated Social Interactions [99.39979111807388]
AIシステムにおける社会的アライメントは、確立された社会的価値に応じてこれらのモデルが振舞うことを保証することを目的としている。現在の言語モデル(LM)は、トレーニングコーパスを独立して厳格に複製するように訓練されている。本研究は,シミュレートされた社会的相互作用からLMを学習することのできる,新しい学習パラダイムを提案する。
論文参考訳（メタデータ） (2023-05-26T14:17:36Z)
Social learning spontaneously emerges by searching optimal heuristics with deep reinforcement learning [0.0]
多次元ランドスケープにおける協調ゲームにおけるエージェントの社会的学習戦略を最適化するために、深層強化学習モデルを用いる。エージェントは、コピー、頻繁で良好な隣人への焦点、自己比較、個人と社会学習のバランスの重要性など、社会的学習の様々な概念を自発的に学習する。本研究では,時間的に変化する環境や実際のソーシャルネットワークなど,各種環境における強化学習エージェントの優れた性能を示す。
論文参考訳（メタデータ） (2022-04-26T15:10:27Z)
Learning from Heterogeneous Data Based on Social Interactions over Graphs [58.34060409467834]
本研究では,個別のエージェントが異なる次元のストリーミング特徴を観察しながら分類問題の解決を目指す分散アーキテクチャを提案する。私たちはそれを示します。戦略により、エージェントはこの高度に異質な環境下で一貫して学習することができる。私たちはそれを示します。戦略により、エージェントはこの高度に異質な環境下で一貫して学習することができる。
論文参考訳（メタデータ） (2021-12-17T12:47:18Z)
Emerging Trends in Federated Learning: From Model Fusion to Federated X Learning [65.06445195580622]
フェデレートラーニング(Federated Learning)は、データ収集とモデルトレーニングを、マルチパーティの計算とモデルアグリゲーションを通じて分離する新しいパラダイムである。我々は、他の学習アルゴリズムとともに、フェデレーション学習の焦点を絞った調査を行う。
論文参考訳（メタデータ） (2021-02-25T15:18:13Z)
Connections between Relational Event Model and Inverse Reinforcement Learning for Characterizing Group Interaction Sequences [0.18275108630751835]
我々は、リレーショナルイベントモデル(REM)と逆強化学習(IRL)の未同定接続について検討する。 REM はそのような問題に対処する従来の手法であるが、IRL の応用は未完成の手法である。実験により,集団の社会的相互作用を特徴付けるためのIRLの特殊効果を実証した。
論文参考訳（メタデータ） (2020-10-19T19:40:29Z)
Importance Weighted Policy Learning and Adaptation [89.46467771037054]
政治外学習の最近の進歩の上に構築された,概念的にシンプルで,汎用的で,モジュール的な補完的アプローチについて検討する。このフレームワークは確率論的推論文学のアイデアにインスパイアされ、堅牢な非政治学習と事前の行動を組み合わせる。提案手法は,メタ強化学習ベースラインと比較して,ホールドアウトタスクにおける競合適応性能を実現し,複雑なスパース・リワードシナリオにスケールすることができる。
論文参考訳（メタデータ） (2020-09-10T14:16:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。