論文の概要: An Analysis of Deep Reinforcement Learning Agents for Text-based Games
- arxiv url: http://arxiv.org/abs/2209.04105v1
- Date: Fri, 9 Sep 2022 03:36:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-12 12:34:00.780968
- Title: An Analysis of Deep Reinforcement Learning Agents for Text-based Games
- Title(参考訳): テキストベースゲームのための深層強化学習エージェントの解析
- Authors: Chen Chen, Yue Dai, Josiah Poon, Caren Han
- Abstract要約: テキストベースのゲームのための目標指向のコンピュータエージェントを構築するのは難しい。
本稿では,テキストベースゲーム分野に適用されたディープラーニング手法の解析を行う。
- 参考スコア(独自算出の注目度): 4.9702715037812055
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Text-based games(TBG) are complex environments which allow users or computer
agents to make textual interactions and achieve game goals. It is challenging
to build goal-oriented computer agents for text-based games, especially when we
use step-wise feedback as the only text input for the model. Moreover, it is
hard for agents to provide replies with flexible length and form by valuing
from a much larger text input space. In this paper, we provide an extensive
analysis of deep learning methods applied to the Text-Based Games field.
- Abstract(参考訳): テキストベースのゲーム(TBG)は、ユーザまたはコンピュータエージェントがテキストインタラクションを行い、ゲーム目標を達成する複雑な環境である。
特に、ステップワイズフィードバックをモデルのための唯一のテキスト入力として使用する場合、テキストベースのゲームのための目標指向コンピュータエージェントを構築するのは難しい。
さらに、より大きなテキスト入力空間から評価することで、エージェントが柔軟な長さと形状の応答を提供するのは難しい。
本稿では,テキストベースのゲーム分野に適用する深層学習手法の広範な分析を行う。
関連論文リスト
- Toward Optimal LLM Alignments Using Two-Player Games [86.39338084862324]
本稿では,対戦相手と防御エージェントの反復的相互作用を含む2エージェントゲームのレンズによるアライメントについて検討する。
この反復的強化学習最適化がエージェントによって誘導されるゲームに対するナッシュ平衡に収束することを理論的に実証する。
安全シナリオにおける実験結果から、このような競争環境下での学習は、完全に訓練するエージェントだけでなく、敵エージェントと防御エージェントの両方に対する一般化能力の向上したポリシーにつながることが示されている。
論文 参考訳(メタデータ) (2024-06-16T15:24:50Z) - Teamwork Dimensions Classification Using BERT [0.8566457170664924]
学生のオンラインチャットにおけるチームワークの次元を特定するために,自然言語の自動処理手法が開発された。
自然言語処理と人工知能の分野での発展により、高度な深層移動学習アプローチがもたらされた。
このモデルは、チームワークの評価とフィードバックのための強化された学習分析ツールに貢献する。
論文 参考訳(メタデータ) (2023-12-09T07:18:41Z) - JoTR: A Joint Transformer and Reinforcement Learning Framework for
Dialog Policy Learning [53.83063435640911]
対話政策学習(DPL)は対話モデリングの重要な構成要素である。
フレキシブルな対話行動を生成するための新しいフレームワークであるJoTRを導入する。
従来の方法とは異なり、JoTRはよりダイナミックで適応可能な対話アクション生成を可能にするワードレベルのポリシーを定式化している。
論文 参考訳(メタデータ) (2023-09-01T03:19:53Z) - A Reinforcement Learning-assisted Genetic Programming Algorithm for Team
Formation Problem Considering Person-Job Matching [70.28786574064694]
解の質を高めるために強化学習支援遺伝的プログラミングアルゴリズム(RL-GP)を提案する。
効率的な学習を通じて得られる超ヒューリスティックなルールは、プロジェクトチームを形成する際の意思決定支援として利用することができる。
論文 参考訳(メタデータ) (2023-04-08T14:32:12Z) - A Framework for Understanding and Visualizing Strategies of RL Agents [0.0]
本稿では,時間論理式を用いてエージェント戦略を特徴付ける逐次決定タスクの理解可能なモデル学習フレームワークを提案する。
我々は,手工芸の専門家政策と訓練された強化学習エージェントの痕跡を用いて,StarCraft II (SC2) の戦闘シナリオに関する枠組みを評価した。
論文 参考訳(メタデータ) (2022-08-17T21:58:19Z) - Meta-Referential Games to Learn Compositional Learning Behaviours [0.20482269513546458]
構成学習行動(CLB)の学習における中心的な問題は、結合問題(BP)の解決である。
本稿では,BPのドメインに依存しないバージョンを解くことにより,CLBを提示するエージェントの能力を調べるベンチマークを提案する。
我々は、我々のベンチマークが魅力的な課題であることを示すベースラインの結果とエラー分析を提供し、研究コミュニティがより有能な人工エージェントを開発するよう促すことを願っている。
論文 参考訳(メタデータ) (2022-07-16T20:37:46Z) - Realistic simulation of users for IT systems in cyber ranges [63.20765930558542]
ユーザアクティビティを生成するために,外部エージェントを用いて各マシンを計測する。
このエージェントは、決定論的および深層学習に基づく手法を組み合わせて、異なる環境に適応する。
また,会話や文書の作成を容易にする条件付きテキスト生成モデルを提案する。
論文 参考訳(メタデータ) (2021-11-23T10:53:29Z) - Generalization in Text-based Games via Hierarchical Reinforcement
Learning [42.70991837415775]
本稿では,知識グラフに基づくRLエージェントを基盤とした階層型フレームワークを提案する。
高いレベルでは、メタポリシーが実行され、ゲーム全体をテキストゴールによって指定されたサブタスクのセットに分解する。
低レベルにおいては、目標条件付き強化学習を行うためにサブ政治が実行される。
論文 参考訳(メタデータ) (2021-09-21T05:27:33Z) - DAGA: Data Augmentation with a Generation Approach for Low-resource
Tagging Tasks [88.62288327934499]
線形化ラベル付き文に基づいて訓練された言語モデルを用いた新しい拡張手法を提案する。
本手法は, 教師付き設定と半教師付き設定の両方に適用可能である。
論文 参考訳(メタデータ) (2020-11-03T07:49:15Z) - Deep Reinforcement Learning with Stacked Hierarchical Attention for
Text-based Games [64.11746320061965]
自然言語の文脈におけるインタラクティブなシミュレーションであるテキストベースゲームの強化学習について検討する。
エージェントの動作が解釈可能な推論手順によって生成され、支援されるように、意思決定のための知識グラフを用いた明示的な推論を行うことを目指している。
提案手法を多数の人為的ベンチマークゲームで広範囲に評価し,本手法が既存のテキストベースエージェントよりも優れていることを示す実験結果を得た。
論文 参考訳(メタデータ) (2020-10-22T12:40:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。