Fugu-MT 論文翻訳(概要): Hierarchical Expert Prompt for Large-Language-Model: An Approach Defeat Elite AI in TextStarCraft II for the First Time

論文の概要: Hierarchical Expert Prompt for Large-Language-Model: An Approach Defeat Elite AI in TextStarCraft II for the First Time

arxiv url: http://arxiv.org/abs/2502.11122v1
Date: Sun, 16 Feb 2025 13:36:31 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-18 20:34:44.858658
Title: Hierarchical Expert Prompt for Large-Language-Model: An Approach Defeat Elite AI in TextStarCraft II for the First Time
Title（参考訳）: 大規模言語モデルのための階層的エキスパートプロンプト:TextStarCraft IIのエリートAIを初めて定義するアプローチ
Authors: Zongyuan Li, Chang Lu, Xiaojie Xu, Runnan Qi, Yanan Ni, Lumin Jiang, Xiangbei Liu, Xuebo Zhang, Yongchun Fang, Kuihua Huang, Xian Guo,
Abstract要約: 大規模言語モデル(LLM)のための階層的エキスパート・プロンプトを提案する。本手法は,専門家レベルの戦術知識を用いて,ゲーム状況の理解を改善する。実験の結果,提案手法は複雑な意思決定課題に対処するための実用的な解法であることが示唆された。
参考スコア（独自算出の注目度）: 13.068341157323987
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Since the emergence of the Large Language Model (LLM), LLM has been widely used in fields such as writing, translating, and searching. However, there is still great potential for LLM-based methods in handling complex tasks such as decision-making in the StarCraft II environment. To address problems such as lack of relevant knowledge and poor control over subtasks of varying importance, we propose a Hierarchical Expert Prompt (HEP) for LLM. Our method improves the understanding of game situations through expert-level tactical knowledge, improving the processing quality of tasks of varying importance through a hierarchical framework. Our approach defeated the highest level (Elite) standard built-in agent in TextStarCraft II for the first time and consistently outperformed the baseline method in other difficulties. Our experiments suggest that the proposed method is a practical solution for tackling complex decision-making challenges. The replay video can be viewed on https://www.bilibili.com/video/BV1uz42187EF and https://youtu.be/dO3PshWLV5M, and our codes have been open-sourced on https://github.com/luchang1113/HEP-LLM-play-StarCraftII.
Abstract（参考訳）: LLM(Large Language Model)の登場以来、LLMは書込み、翻訳、検索などの分野で広く使われてきた。しかし、スタークラフトII環境における意思決定のような複雑なタスクを扱う上で、LLMベースの手法には大きな可能性がある。 LLMのための階層的エキスパート・プロンプト(HEP)を提案する。提案手法は,専門家レベルの戦術知識を通じてゲーム状況の理解を改善し,階層的な枠組みを通じてタスクの処理品質を向上させる。当社のアプローチは、TextStarCraft IIの最高レベル(エリート)標準組込みエージェントを初めて破り、他の困難の中でベースラインメソッドを一貫して上回りました。提案手法は, 複雑な意思決定課題に対処するための実用的な方法であると考えられた。リプレイビデオはhttps://www.bilibili.com/video/BV1uz42187EFとhttps://youtu.be/dO3PshWLV5Mで見ることができる。

関連論文リスト

GenKI: Enhancing Open-Domain Question Answering with Knowledge Integration and Controllable Generation in Large Language Models [75.25348392263676]
オープンドメイン質問応答(OpenQA)は自然言語処理(NLP)の基盤である。我々は,知識統合と制御可能生成を探求し,OpenQAの性能向上を目的としたGenKIという新しいフレームワークを提案する。
論文参考訳（メタデータ） (2025-05-26T08:18:33Z)
Learning to Play Like Humans: A Framework for LLM Adaptation in Interactive Fiction Games [8.06073345741722]
インタラクティブ・フィクションゲーム(Interactive Fiction Game、IFゲーム)は、プレイヤーが自然言語で操作するゲームである。この研究は認知にインスパイアされたフレームワークを示し、Large Language Models (LLM) を体系的にIFゲームを学び、プレイする。
論文参考訳（メタデータ） (2025-05-18T14:21:56Z)
R1-Searcher: Incentivizing the Search Capability in LLMs via Reinforcement Learning [87.30285670315334]
textbfR1-Searcherは、大規模言語モデルの検索能力を高めるために設計された、2段階の結果に基づく新しいRLアプローチである。本フレームワークは, コールドスタート時に, プロセス報酬や蒸留を必要とせず, RLのみに依存している。提案手法は, クローズドソースGPT-4o-miniと比較して, 従来の強力なRAG法よりも有意に優れていた。
論文参考訳（メタデータ） (2025-03-07T17:14:44Z)
AVA: Attentive VLM Agent for Mastering StarCraft II [56.07921367623274]
Intentive VLM Agent (AVA) は、人工エージェントの認識と人間のゲームプレイ体験を一致させるマルチモーダルのStarCraft IIエージェントである。我々のエージェントは、ゲームプレイ中に人間の認知過程をより密にシミュレートするRGB視覚入力と自然言語観察を組み込むことにより、この制限に対処する。
論文参考訳（メタデータ） (2025-03-07T12:54:25Z)
Reflection of Episodes: Learning to Play Game from Expert and Self Experiences [12.422732989325725]
本稿では,専門家の経験と自己経験に基づくROE(Reflection of Episodes)フレームワークを提案する。実験では,TextStarCraft IIにおける極めて難易度の高い条件下で,本手法がロボットを圧倒した。
論文参考訳（メタデータ） (2025-02-19T02:53:43Z)
Should You Use Your Large Language Model to Explore or Exploit? [55.562545113247666]
探索・探索トレードオフに直面した意思決定エージェントを支援するために,大規模言語モデルの能力を評価する。現在のLLMは、しばしば利用に苦労するが、小規模タスクのパフォーマンスを大幅に改善するために、コンテキスト内緩和が用いられる可能性がある。
論文参考訳（メタデータ） (2025-01-31T23:42:53Z)
Beyond Outcomes: Transparent Assessment of LLM Reasoning in Games [54.49589494014147]
GAMEBoTは、大規模言語モデルの厳格な評価のために設計されたゲームアリーナである。我々は,8つのゲームにまたがる17の卓越したLSMをベンチマークし,様々な戦略能力とゲーム特性について検討した。以上の結果から,LDMに詳細なCoTプロンプトが付与されている場合でも,GAMEBoTは大きな課題となることが示唆された。
論文参考訳（メタデータ） (2024-12-18T08:32:53Z)
LLM-PySC2: Starcraft II learning environment for Large Language Models [16.918044347226104]
本稿では,Large Language Models(LLM)に基づく意思決定手法の開発を支援する新しい環境を提案する。この環境はStarCraft IIのアクションスペース、マルチモーダルな観察インタフェース、構造化されたゲーム知識データベースを提供する最初のものである。
論文参考訳（メタデータ） (2024-11-08T06:04:22Z)
Usable XAI: 10 Strategies Towards Exploiting Explainability in the LLM Era [76.12435556140515]
XAIは大規模言語モデル(LLM)の説明に向けて拡張されている本稿では、XAIがLLMベースのAIシステムをどのように説明し、改善するかを分析する。 10の戦略を導入し、それぞれに重要なテクニックを導入し、関連する課題について議論します。
論文参考訳（メタデータ） (2024-03-13T20:25:27Z)
Large Language Models Play StarCraft II: Benchmarks and A Chain of Summarization Approach [7.693497788883165]
VoyageやMetaGPTのような大規模言語モデル(LLM)エージェントは、複雑なタスクを解く大きな可能性を示す。本稿では,生観測処理のための単一フレーム要約と,ゲーム情報解析のための多フレーム要約を含む要約手法を提案する。 1. LLMはStarCraft IIのシナリオに対処するのに必要な知識と複雑な計画能力を持っている; 2. 人間の専門家は、LLMエージェントのパフォーマンスは、StarCraft IIを8年間プレイした平均的なプレイヤーのそれに近いと考えている; 3. LLMエージェントはAIで構築されたエージェントを倒すことができる。
論文参考訳（メタデータ） (2023-12-19T05:27:16Z)
Rephrase and Respond: Let Large Language Models Ask Better Questions for Themselves [57.974103113675795]
本稿では,Rephrase and Respond'(RaR)という手法を提案する。 RaRは、パフォーマンスを改善するためのシンプルだが効果的なプロンプト方法として機能する。また,RaRは理論的にも経験的にも,一般的なChain-of-Thought(CoT)法と相補的であることを示す。
論文参考訳（メタデータ） (2023-11-07T18:43:34Z)
SPRING: Studying the Paper and Reasoning to Play Games [102.5587155284795]
我々は,ゲーム本来の学術論文を読み取るための新しいアプローチ,SPRINGを提案し,大言語モデル(LLM)を通してゲームの説明とプレイの知識を利用する。実験では,クラフトオープンワールド環境の設定下で,異なる形態のプロンプトによって引き起こされる文脈内「推論」の品質について検討した。我々の実験は、LLMが一貫したチェーン・オブ・シークレットによって誘導されると、洗練された高レベル軌道の完成に大きな可能性があることを示唆している。
論文参考訳（メタデータ） (2023-05-24T18:14:35Z)
Generalization in Text-based Games via Hierarchical Reinforcement Learning [42.70991837415775]
本稿では,知識グラフに基づくRLエージェントを基盤とした階層型フレームワークを提案する。高いレベルでは、メタポリシーが実行され、ゲーム全体をテキストゴールによって指定されたサブタスクのセットに分解する。低レベルにおいては、目標条件付き強化学習を行うためにサブ政治が実行される。
論文参考訳（メタデータ） (2021-09-21T05:27:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。