論文の概要: Teach Me What You Want to Play: Learning Variants of Connect Four
through Human-Robot Interaction
- arxiv url: http://arxiv.org/abs/2001.01004v4
- Date: Wed, 13 Jan 2021 06:51:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-14 17:54:08.080945
- Title: Teach Me What You Want to Play: Learning Variants of Connect Four
through Human-Robot Interaction
- Title(参考訳): 遊びたいことを教える:人間とロボットのインタラクションを通じて4つの接続を学習する
- Authors: Ali Ayub and Alan R. Wagner
- Abstract要約: 本稿では,コネクテッド・フォーのようなインタラクティブなゲームを表現し,学習するためのゲーム理論的表現の活用について検討する。
実演による学習の側面、活発な学習、ゲーム理論を組み合わせることで、ロボットがゲームの発達する表現を活用することができる。
- 参考スコア(独自算出の注目度): 22.387008072671005
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper investigates the use of game theoretic representations to
represent and learn how to play interactive games such as Connect Four. We
combine aspects of learning by demonstration, active learning, and game theory
allowing a robot to leverage its developing representation of the game to
conduct question/answer sessions with a person, thus filling in gaps in its
knowledge. The paper demonstrates a method for teaching a robot the win
conditions of the game Connect Four and its variants using a single
demonstration and a few trial examples with a question and answer session led
by the robot. Our results show that the robot can learn arbitrary win
conditions for the game with little prior knowledge of the win conditions and
then play the game with a human utilizing the learned win conditions. Our
experiments also show that some questions are more important for learning the
game's win conditions. We believe that this method could be broadly applied to
a variety of interactive learning scenarios.
- Abstract(参考訳): 本稿では,connect 4 のようなインタラクティブなゲームを表現し,学習するためのゲーム理論表現の利用について検討する。
実演、アクティブラーニング、ゲーム理論による学習の側面を組み合わせることで、ロボットがその発展するゲーム表現を利用して、人との質問/回答セッションを行い、知識のギャップを埋めることができる。
本論文は,ロボットに1つの実演と,ロボットが指導する質問・回答セッションによるいくつかの試行例を用いて,ゲーム「コネクテッド・フォー」とその変種の勝利条件を教える方法を示す。
その結果,ロボットは勝条件の事前知識をほとんど持たずに任意の勝条件を学習し,学習した勝条件を利用して人間とゲームをすることができることがわかった。
我々の実験は、ゲームの勝利条件を学習する上で、いくつかの質問がより重要であることも示している。
この手法はさまざまなインタラクティブな学習シナリオに広く適用できると考えています。
関連論文リスト
- Learning to Play Video Games with Intuitive Physics Priors [2.1548132286330453]
我々は、多数のビデオゲームでよく一般化されたオブジェクトベースの入力表現を設計する。
これらの表現を用いて,幼児に類似したゲームを学ぶエージェントの能力を評価する。
以上の結果から,人間のようなオブジェクトインタラクションのセットアップが,複数のビデオゲームを遊べるように学習できることが示唆された。
論文 参考訳(メタデータ) (2024-09-20T20:30:27Z) - Affordances from Human Videos as a Versatile Representation for Robotics [31.248842798600606]
我々は、人間がどこでどのように対話するかを推定する視覚的余裕モデルを訓練する。
これらの行動割当の構造は、ロボットが多くの複雑なタスクを直接実行できるようにする。
私たちは、VRBと呼ばれる4つの現実世界環境、10以上のタスクと2つのロボットプラットフォームにおいて、私たちのアプローチの有効性を示します。
論文 参考訳(メタデータ) (2023-04-17T17:59:34Z) - Learning Reward Functions for Robotic Manipulation by Observing Humans [92.30657414416527]
我々は、ロボット操作ポリシーのタスク非依存報酬関数を学習するために、幅広い操作タスクを解く人間のラベル付きビデオを使用する。
学習された報酬は、タイムコントラストの目的を用いて学習した埋め込み空間におけるゴールまでの距離に基づいている。
論文 参考訳(メタデータ) (2022-11-16T16:26:48Z) - Learning Preferences for Interactive Autonomy [1.90365714903665]
この論文は、他のより信頼性の高いデータモダリティを用いて、人間のユーザーから報酬関数を学習する試みである。
まず、まず、ペアワイズ比較、ベスト・オブ・マンティ選択、ランキング、スケールされた比較など、さまざまな形態の比較フィードバックを提案し、ロボットがこれらの形態の人間のフィードバックを使って報酬関数を推測する方法を説明する。
論文 参考訳(メタデータ) (2022-10-19T21:34:51Z) - Playful Interactions for Representation Learning [82.59215739257104]
本稿では,下流タスクの視覚的表現を学習するために,遊び心のあるインタラクションを自己指導的に利用することを提案する。
19の多様な環境で2時間の遊び心のあるデータを収集し、自己予測学習を用いて視覚的表現を抽出する。
我々の表現は、標準的な行動クローニングよりも一般化され、必要なデモの半数しか必要とせず、同様の性能を達成できる。
論文 参考訳(メタデータ) (2021-07-19T17:54:48Z) - Teach me to play, gamer! Imitative learning in computer games via
linguistic description of complex phenomena and decision tree [55.41644538483948]
本稿では,複雑な現象の言語記述に基づく模倣による新しい機械学習モデルを提案する。
この手法は,ゲーム開発における知的エージェントの動作を設計し,実装するための優れた代替手段となる。
論文 参考訳(メタデータ) (2021-01-06T21:14:10Z) - Hierarchical Affordance Discovery using Intrinsic Motivation [69.9674326582747]
本研究では,移動ロボットの価格学習を支援するために,本質的なモチベーションを用いたアルゴリズムを提案する。
このアルゴリズムは、事前にプログラムされたアクションなしで、相互に関連のある価格を自律的に発見し、学習し、適応することができる。
一度学習すると、これらの余裕はアルゴリズムによって様々な困難を伴うタスクを実行するために一連のアクションを計画するために使われる。
論文 参考訳(メタデータ) (2020-09-23T07:18:21Z) - Learning to Play Sequential Games versus Unknown Opponents [93.8672371143881]
学習者が最初にプレーするゲームと、選択した行動に反応する相手との連続的なゲームについて考察する。
対戦相手の対戦相手列と対戦する際,学習者に対して新しいアルゴリズムを提案する。
我々の結果には、相手の反応の正則性に依存するアルゴリズムの後悔の保証が含まれている。
論文 参考訳(メタデータ) (2020-07-10T09:33:05Z) - Learning to Play by Imitating Humans [8.209859328381269]
遠隔操作型プレイデータ上での自己監督制御により,多様なスキルの獲得が可能であることを示す。
比較的少量の人間の遊びに対して行動的クローン化ポリシーを訓練することにより、我々は大量のクローン化プレイデータを自律的に生成する。
この拡張データセットでトレーニングされた汎用目標条件ポリシーは、本来の人的データでトレーニングされた政策よりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2020-06-11T23:28:54Z) - Benchmarking End-to-End Behavioural Cloning on Video Games [5.863352129133669]
我々は,2010年以降の6ゲームを含む12のビデオゲームにおける行動クローンの一般適用性について検討した。
以上の結果から,これらのエージェントは生演奏では人間と一致しないが,基本力学やルールを学習できることがわかった。
また、データの質や、人間からのデータの記録が、人間の反射によって、状態-作用ミスマッチの対象になっていることを実証する。
論文 参考訳(メタデータ) (2020-04-02T13:31:51Z) - Exploration Based Language Learning for Text-Based Games [72.30525050367216]
本研究は,テキストベースのコンピュータゲームにおいて,最先端の性能を発揮できる探索・模倣学習型エージェントを提案する。
テキストベースのコンピュータゲームは、自然言語でプレイヤーの世界を記述し、プレイヤーがテキストを使ってゲームと対話することを期待する。
これらのゲームは、言語理解、問題解決、および人工エージェントによる言語生成のためのテストベッドと見なすことができるため、興味がある。
論文 参考訳(メタデータ) (2020-01-24T03:03:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。