Fugu-MT 論文翻訳(概要): Incorporating Rivalry in Reinforcement Learning for a Competitive Game

論文の概要: Incorporating Rivalry in Reinforcement Learning for a Competitive Game

arxiv url: http://arxiv.org/abs/2011.01337v1
Date: Mon, 2 Nov 2020 21:54:18 GMT
ステータス: 翻訳完了
システム内更新日: 2022-09-30 11:13:37.203190
Title: Incorporating Rivalry in Reinforcement Learning for a Competitive Game
Title（参考訳）: コンペティションゲームにおける強化学習におけるコンペティタリーの活用
Authors: Pablo Barros, Ana Tanevska, Ozge Yalcin, Alessandra Sciutti
Abstract要約: 本研究は、競合する社会的影響に基づく新しい学習メカニズムの提供に焦点を当てる。本研究は,競争競合の概念に基づいて,これらのエージェントの評価を人的視点から変えられるかを検討することを目的とする。
参考スコア（独自算出の注目度）: 65.2200847818153
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Recent advances in reinforcement learning with social agents have allowed us to achieve human-level performance on some interaction tasks. However, most interactive scenarios do not have as end-goal performance alone; instead, the social impact of these agents when interacting with humans is as important and, in most cases, never explored properly. This preregistration study focuses on providing a novel learning mechanism based on a rivalry social impact. Our scenario explored different reinforcement learning-based agents playing a competitive card game against human players. Based on the concept of competitive rivalry, our analysis aims to investigate if we can change the assessment of these agents from a human perspective.
Abstract（参考訳）: 近年,ソーシャルエージェントによる強化学習の進歩により,対話作業における人間レベルのパフォーマンス向上が図られている。しかしながら、ほとんどの対話的なシナリオは、エンドゴールのパフォーマンスだけでは無く、代わりに、人間と対話する際のこれらのエージェントの社会的影響は重要である。この事前登録研究は、競合する社会的影響に基づく新しい学習メカニズムの提供に焦点を当てている。本シナリオでは,人間プレイヤーと競合するカードゲームを行う強化学習型エージェントについて検討した。本研究は,競争競合の概念に基づいて,これらのエージェントの評価を人間の視点から変えられるかを検討することを目的とする。

関連論文リスト

Reciprocal Reward Influence Encourages Cooperation From Self-Interested Agents [2.1301560294088318]
自己関心の個人間の協力は、自然界で広く見られる現象であるが、人工的な知的エージェント間の相互作用においては、いまだ解明されていない。そこで,本研究では,リターンに対する相手の行動の影響を再現するために,本質的に動機づけられた強化学習エージェントであるReciprocatorを紹介する。本研究では,同時学習において,時間的に拡張された社会的ジレンマにおける協調を促進するために,共用者が利用できることを示す。
論文参考訳（メタデータ） (2024-06-03T06:07:27Z)
Sharing the Cost of Success: A Game for Evaluating and Learning Collaborative Multi-Agent Instruction Giving and Following Policies [19.82683688911297]
本稿では、2人のプレイヤーが視覚と言語の観察を協調する必要がある、挑戦的な対話型参照ゲームを提案する。本稿では,PPO(Proximal Policy Optimization)の標準設定が,パートナー行動のブートストラップによって高い成功率を達成することを示す。神経パートナーのペアリングは、繰り返し演奏する際の測定された関節の労力を減少させる。
論文参考訳（メタデータ） (2024-03-26T08:58:28Z)
SOTOPIA: Interactive Evaluation for Social Intelligence in Language Agents [107.4138224020773]
人工エージェントと人間との複雑な社会的相互作用をシミュレートするオープンエンド環境であるSOTOPIAを提案する。エージェントは、複雑な社会的目標を達成するために協調し、協力し、交換し、互いに競い合う。 GPT-4は,人間よりも目標達成率が著しく低く,社会的常識的推論や戦略的コミュニケーション能力の発揮に苦慮していることがわかった。
論文参考訳（メタデータ） (2023-10-18T02:27:01Z)
Incorporating Rivalry in Reinforcement Learning for a Competitive Game [65.2200847818153]
本研究は,競争行動の社会的影響に基づく新しい強化学習機構を提案する。提案モデルでは, 人工エージェントの学習を調節するための競合スコアを導出するために, 客観的, 社会的認知的メカニズムを集約する。
論文参考訳（メタデータ） (2022-08-22T14:06:06Z)
Warmth and competence in human-agent cooperation [0.7237068561453082]
近年の研究では、深層強化学習で訓練されたAIエージェントが人間と協調できることが示されている。われわれは2人プレイのソーシャルジレンマであるCoinsで深層強化学習エージェントを訓練している。参加者の温かさと能力に対する認識は、異なるエージェントに対する表現された嗜好を予測する。
論文参考訳（メタデータ） (2022-01-31T18:57:08Z)
Hidden Agenda: a Social Deduction Game with Diverse Learned Equilibria [57.74495091445414]
社会的推論ゲームは、個人が他人に関する潜在的に信頼できない情報を合成する方法を学ぶための道を提供する。本研究では,未知のチームアライメントのシナリオにおいて,学習エージェントを研究するための2D環境を提供する2チームソーシャル推論ゲームであるHidden Agendaを紹介する。 Hidden Agendaで訓練された強化学習エージェントは、自然言語でのコミュニケーションを必要とせずに、協力や投票など、さまざまな行動を学ぶことができることを示した。
論文参考訳（メタデータ） (2022-01-05T20:54:10Z)
Moody Learners -- Explaining Competitive Behaviour of Reinforcement Learning Agents [65.2200847818153]
競合シナリオでは、エージェントは動的環境を持つだけでなく、相手の行動に直接影響される。エージェントのQ値の観察は通常、その振る舞いを説明する方法であるが、選択されたアクション間の時間的関係は示さない。
論文参考訳（メタデータ） (2020-07-30T11:30:42Z)
Learning from Learners: Adapting Reinforcement Learning Agents to be Competitive in a Card Game [71.24825724518847]
本稿では,競争力のあるマルチプレイヤーカードゲームの現実的な実装を学習・プレイするために,一般的な強化学習アルゴリズムをどのように適用できるかについて検討する。本研究は,学習エージェントに対して,エージェントが競争力を持つことの学習方法を評価するための特定のトレーニングと検証ルーチンを提案し,それらが相互の演奏スタイルにどのように適応するかを説明する。
論文参考訳（メタデータ） (2020-04-08T14:11:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。