Fugu-MT 論文翻訳(概要): Incorporating Rivalry in Reinforcement Learning for a Competitive Game

論文の概要: Incorporating Rivalry in Reinforcement Learning for a Competitive Game

arxiv url: http://arxiv.org/abs/2208.10327v1
Date: Mon, 22 Aug 2022 14:06:06 GMT
ステータス: 翻訳完了
システム内更新日: 2022-08-23 13:11:36.669276
Title: Incorporating Rivalry in Reinforcement Learning for a Competitive Game
Title（参考訳）: コンペティションゲームにおける強化学習におけるコンペティタリーの活用
Authors: Pablo Barros, Ozge Nilay Yalc{\i}n, Ana Tanevska, Alessandra Sciutti
Abstract要約: 本研究は,競争行動の社会的影響に基づく新しい強化学習機構を提案する。提案モデルでは, 人工エージェントの学習を調節するための競合スコアを導出するために, 客観的, 社会的認知的メカニズムを集約する。
参考スコア（独自算出の注目度）: 65.2200847818153
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Recent advances in reinforcement learning with social agents have allowed such models to achieve human-level performance on specific interaction tasks. However, most interactive scenarios do not have a version alone as an end goal; instead, the social impact of these agents when interacting with humans is as important and largely unexplored. In this regard, this work proposes a novel reinforcement learning mechanism based on the social impact of rivalry behavior. Our proposed model aggregates objective and social perception mechanisms to derive a rivalry score that is used to modulate the learning of artificial agents. To investigate our proposed model, we design an interactive game scenario, using the Chef's Hat Card Game, and examine how the rivalry modulation changes the agent's playing style, and how this impacts the experience of human players in the game. Our results show that humans can detect specific social characteristics when playing against rival agents when compared to common agents, which directly affects the performance of the human players in subsequent games. We conclude our work by discussing how the different social and objective features that compose the artificial rivalry score contribute to our results.
Abstract（参考訳）: 近年のソーシャルエージェントによる強化学習の進歩により、特定のインタラクションタスクにおいて人間レベルのパフォーマンスを達成することが可能になった。しかしながら、ほとんどの対話的なシナリオは最終目標としてバージョンのみを持っておらず、その代わりに、人間と対話する際のこれらのエージェントの社会的影響は重要であり、ほとんど解明されていない。そこで本研究では,競争行動の社会的影響に基づく新しい強化学習機構を提案する。提案モデルでは, 人工エージェントの学習を調節するための競合スコアを導出するために, 客観的, 社会的認知的メカニズムを集約する。提案モデルについて検討するために,Chef's Hat Card Gameを用いた対話型ゲームシナリオを設計し,エージェントのプレイスタイルの変化と,ゲームにおける人間のプレイ体験に与える影響について検討する。以上の結果から,人間は,他のエージェントと対戦する際に特定の社会的特徴を検知できることが明らかとなった。我々は, 人為的競争スコアを構成する異なる社会的特徴と客観的特徴が, 結果にどのように寄与するかについて議論し, 本研究を締めくくった。

関連論文リスト

Reciprocal Reward Influence Encourages Cooperation From Self-Interested Agents [2.1301560294088318]
自己関心の個人間の協力は、自然界で広く見られる現象であるが、人工的な知的エージェント間の相互作用においては、いまだ解明されていない。そこで,本研究では,リターンに対する相手の行動の影響を再現するために,本質的に動機づけられた強化学習エージェントであるReciprocatorを紹介する。本研究では,同時学習において,時間的に拡張された社会的ジレンマにおける協調を促進するために,共用者が利用できることを示す。
論文参考訳（メタデータ） (2024-06-03T06:07:27Z)
SocialBench: Sociality Evaluation of Role-Playing Conversational Agents [85.6641890712617]
大規模言語モデル(LLM)は、様々なAI対話エージェントの開発を進めてきた。 SocialBenchは、ロールプレイングの会話エージェントの社会的性を個人レベルとグループレベルで評価するために設計された最初のベンチマークである。個人レベルで優れたエージェントは,集団レベルでの熟練度を示唆しない。
論文参考訳（メタデータ） (2024-03-20T15:38:36Z)
SOTOPIA: Interactive Evaluation for Social Intelligence in Language Agents [107.4138224020773]
人工エージェントと人間との複雑な社会的相互作用をシミュレートするオープンエンド環境であるSOTOPIAを提案する。エージェントは、複雑な社会的目標を達成するために協調し、協力し、交換し、互いに競い合う。 GPT-4は,人間よりも目標達成率が著しく低く,社会的常識的推論や戦略的コミュニケーション能力の発揮に苦慮していることがわかった。
論文参考訳（メタデータ） (2023-10-18T02:27:01Z)
Aligning to Social Norms and Values in Interactive Narratives [89.82264844526333]
我々は、インタラクティブな物語やテキストベースのゲームにおいて、社会的に有益な規範や価値観に沿って行動するエージェントを作成することに注力する。我々は、特別な訓練を受けた言語モデルに存在する社会的コモンセンス知識を用いて、社会的に有益な値に整合した行動にのみ、その行動空間を文脈的に制限するGAALADエージェントを紹介した。
論文参考訳（メタデータ） (2022-05-04T09:54:33Z)
Warmth and competence in human-agent cooperation [0.7237068561453082]
近年の研究では、深層強化学習で訓練されたAIエージェントが人間と協調できることが示されている。われわれは2人プレイのソーシャルジレンマであるCoinsで深層強化学習エージェントを訓練している。参加者の温かさと能力に対する認識は、異なるエージェントに対する表現された嗜好を予測する。
論文参考訳（メタデータ） (2022-01-31T18:57:08Z)
Incorporating Rivalry in Reinforcement Learning for a Competitive Game [65.2200847818153]
本研究は、競合する社会的影響に基づく新しい学習メカニズムの提供に焦点を当てる。本研究は,競争競合の概念に基づいて,これらのエージェントの評価を人的視点から変えられるかを検討することを目的とする。
論文参考訳（メタデータ） (2020-11-02T21:54:18Z)
Moody Learners -- Explaining Competitive Behaviour of Reinforcement Learning Agents [65.2200847818153]
競合シナリオでは、エージェントは動的環境を持つだけでなく、相手の行動に直接影響される。エージェントのQ値の観察は通常、その振る舞いを説明する方法であるが、選択されたアクション間の時間的関係は示さない。
論文参考訳（メタデータ） (2020-07-30T11:30:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。