論文の概要: An Analysis of Deep Reinforcement Learning Agents for Text-based Games
- arxiv url: http://arxiv.org/abs/2209.04105v2
- Date: Mon, 12 Sep 2022 12:40:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-13 10:36:25.929538
- Title: An Analysis of Deep Reinforcement Learning Agents for Text-based Games
- Title(参考訳): テキストベースゲームのための深層強化学習エージェントの解析
- Authors: Chen Chen, Yue Dai, Josiah Poon, Caren Han
- Abstract要約: テキストベースのゲーム(TBG)は、ユーザまたはコンピュータエージェントがテキストインタラクションを行い、ゲーム目標を達成する複雑な環境である。
TBGエージェントを標準化した環境での深層学習モジュールの性能を確認し,その性能を異なる評価タイプで検証することが,TBGエージェント研究においても重要である。
我々は,手作りルールのない標準化されたTBGエージェントを構築し,TBG評価タイプを正式に分類し,我々の環境における選択手法を解析した。
- 参考スコア(独自算出の注目度): 4.9702715037812055
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Text-based games(TBG) are complex environments which allow users or computer
agents to make textual interactions and achieve game goals.In TBG agent design
and training process, balancing the efficiency and performance of the agent
models is a major challenge. Finding TBG agent deep learning modules'
performance in standardized environments, and testing their performance among
different evaluation types is also important for TBG agent research. We
constructed a standardized TBG agent with no hand-crafted rules, formally
categorized TBG evaluation types, and analyzed selected methods in our
environment.
- Abstract(参考訳): テキストベースゲーム(TBG)は、ユーザやコンピュータエージェントがテキストインタラクションを行い、ゲーム目標を達成する複雑な環境であり、TBGエージェント設計およびトレーニングプロセスにおいては、エージェントモデルの効率と性能のバランスをとることが大きな課題である。
TBGエージェントを標準化した環境での深層学習モジュールの性能を確認し,その性能を異なる評価タイプで検証することが,TBGエージェント研究においても重要である。
我々は,手作りルールのない標準化されたTBGエージェントを構築し,TBG評価タイプを正式に分類し,我々の環境における選択手法を解析した。
関連論文リスト
- Toward Optimal LLM Alignments Using Two-Player Games [86.39338084862324]
本稿では,対戦相手と防御エージェントの反復的相互作用を含む2エージェントゲームのレンズによるアライメントについて検討する。
この反復的強化学習最適化がエージェントによって誘導されるゲームに対するナッシュ平衡に収束することを理論的に実証する。
安全シナリオにおける実験結果から、このような競争環境下での学習は、完全に訓練するエージェントだけでなく、敵エージェントと防御エージェントの両方に対する一般化能力の向上したポリシーにつながることが示されている。
論文 参考訳(メタデータ) (2024-06-16T15:24:50Z) - Teamwork Dimensions Classification Using BERT [0.8566457170664924]
学生のオンラインチャットにおけるチームワークの次元を特定するために,自然言語の自動処理手法が開発された。
自然言語処理と人工知能の分野での発展により、高度な深層移動学習アプローチがもたらされた。
このモデルは、チームワークの評価とフィードバックのための強化された学習分析ツールに貢献する。
論文 参考訳(メタデータ) (2023-12-09T07:18:41Z) - JoTR: A Joint Transformer and Reinforcement Learning Framework for
Dialog Policy Learning [53.83063435640911]
対話政策学習(DPL)は対話モデリングの重要な構成要素である。
フレキシブルな対話行動を生成するための新しいフレームワークであるJoTRを導入する。
従来の方法とは異なり、JoTRはよりダイナミックで適応可能な対話アクション生成を可能にするワードレベルのポリシーを定式化している。
論文 参考訳(メタデータ) (2023-09-01T03:19:53Z) - A Reinforcement Learning-assisted Genetic Programming Algorithm for Team
Formation Problem Considering Person-Job Matching [70.28786574064694]
解の質を高めるために強化学習支援遺伝的プログラミングアルゴリズム(RL-GP)を提案する。
効率的な学習を通じて得られる超ヒューリスティックなルールは、プロジェクトチームを形成する際の意思決定支援として利用することができる。
論文 参考訳(メタデータ) (2023-04-08T14:32:12Z) - A Framework for Understanding and Visualizing Strategies of RL Agents [0.0]
本稿では,時間論理式を用いてエージェント戦略を特徴付ける逐次決定タスクの理解可能なモデル学習フレームワークを提案する。
我々は,手工芸の専門家政策と訓練された強化学習エージェントの痕跡を用いて,StarCraft II (SC2) の戦闘シナリオに関する枠組みを評価した。
論文 参考訳(メタデータ) (2022-08-17T21:58:19Z) - Meta-Referential Games to Learn Compositional Learning Behaviours [0.20482269513546458]
構成学習行動(CLB)の学習における中心的な問題は、結合問題(BP)の解決である。
本稿では,BPのドメインに依存しないバージョンを解くことにより,CLBを提示するエージェントの能力を調べるベンチマークを提案する。
我々は、我々のベンチマークが魅力的な課題であることを示すベースラインの結果とエラー分析を提供し、研究コミュニティがより有能な人工エージェントを開発するよう促すことを願っている。
論文 参考訳(メタデータ) (2022-07-16T20:37:46Z) - Realistic simulation of users for IT systems in cyber ranges [63.20765930558542]
ユーザアクティビティを生成するために,外部エージェントを用いて各マシンを計測する。
このエージェントは、決定論的および深層学習に基づく手法を組み合わせて、異なる環境に適応する。
また,会話や文書の作成を容易にする条件付きテキスト生成モデルを提案する。
論文 参考訳(メタデータ) (2021-11-23T10:53:29Z) - Generalization in Text-based Games via Hierarchical Reinforcement
Learning [42.70991837415775]
本稿では,知識グラフに基づくRLエージェントを基盤とした階層型フレームワークを提案する。
高いレベルでは、メタポリシーが実行され、ゲーム全体をテキストゴールによって指定されたサブタスクのセットに分解する。
低レベルにおいては、目標条件付き強化学習を行うためにサブ政治が実行される。
論文 参考訳(メタデータ) (2021-09-21T05:27:33Z) - DAGA: Data Augmentation with a Generation Approach for Low-resource
Tagging Tasks [88.62288327934499]
線形化ラベル付き文に基づいて訓練された言語モデルを用いた新しい拡張手法を提案する。
本手法は, 教師付き設定と半教師付き設定の両方に適用可能である。
論文 参考訳(メタデータ) (2020-11-03T07:49:15Z) - Deep Reinforcement Learning with Stacked Hierarchical Attention for
Text-based Games [64.11746320061965]
自然言語の文脈におけるインタラクティブなシミュレーションであるテキストベースゲームの強化学習について検討する。
エージェントの動作が解釈可能な推論手順によって生成され、支援されるように、意思決定のための知識グラフを用いた明示的な推論を行うことを目指している。
提案手法を多数の人為的ベンチマークゲームで広範囲に評価し,本手法が既存のテキストベースエージェントよりも優れていることを示す実験結果を得た。
論文 参考訳(メタデータ) (2020-10-22T12:40:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。