論文の概要: MIMIC-Py: An Extensible Tool for Personality-Driven Automated Game Testing with Large Language Models
- arxiv url: http://arxiv.org/abs/2604.07752v1
- Date: Thu, 09 Apr 2026 03:16:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.666362
- Title: MIMIC-Py: An Extensible Tool for Personality-Driven Automated Game Testing with Large Language Models
- Title(参考訳): MIMIC-Py: 大規模言語モデルを用いたパーソナリティ駆動型自動ゲームテストのための拡張可能なツール
- Authors: Yifei Chen, Sarra Habchi, Lili Wei,
- Abstract要約: 本稿では,Pythonによる自動ゲームテストツールMIMIC-Pyについて述べる。
MIMIC-Pyは、パーソナリティ特性を入力として公開し、ゲーム固有のロジックから計画、実行、メモリを分離するモジュールアーキテクチャを採用する。
研究プロトタイプと実際の自動ゲームテストのギャップを埋め、最小限のエンジニアリング労力で新しいゲーム環境へのデプロイを可能にする方法を示す。
- 参考スコア(独自算出の注目度): 9.426130742272715
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Modern video games are complex, non-deterministic systems that are difficult to test automatically at scale. Although prior work shows that personality-driven Large Language Model (LLM) agents can improve behavioural diversity and test coverage, existing tools largely remain research prototypes and lack cross-game reusability. This tool paper presents MIMIC-Py, a Python-based automated game-testing tool that transforms personality-driven LLM agents into a reusable and extensible framework. MIMIC-Py exposes personality traits as configurable inputs and adopts a modular architecture that decouples planning, execution, and memory from game-specific logic. It supports multiple interaction mechanisms, enabling agents to interact with games via exposed APIs or synthesized code. We describe the design of MIMIC-Py and show how it enables deployment to new game environments with minimal engineering effort, bridging the gap between research prototypes and practical automated game testing. The source code and a demo video are available on our project webpage: https://mimic-persona.github.io/MIMIC-Py-Home-Page/.
- Abstract(参考訳): 現代のビデオゲームは複雑で非決定論的であり、大規模な自動テストが困難である。
以前の研究は、パーソナリティ駆動の大規模言語モデル(LLM)エージェントが振る舞いの多様性とテストカバレッジを改善することを示していたが、既存のツールは研究のプロトタイプのままであり、ゲーム間の再利用性に欠けていた。
このツールでは、パーソナリティ駆動型LLMエージェントを再利用可能で拡張可能なフレームワークに変換するPythonベースの自動ゲームテストツールMIMIC-Pyを提案する。
MIMIC-Pyは、設定可能な入力としてパーソナリティ特性を公開し、計画、実行、メモリをゲーム固有のロジックから分離するモジュールアーキテクチャを採用する。
複数のインタラクションメカニズムをサポートし、エージェントが公開APIや合成コードを介してゲームと対話できるようにする。
我々はMIMIC-Pyの設計について述べるとともに、研究プロトタイプと実用自動化ゲームテストのギャップを埋め、最小限のエンジニアリング労力で新しいゲーム環境への展開を可能にする方法について述べる。
ソースコードとデモビデオは、プロジェクトのWebページ(https://mimic-persona.github.io/MIMIC-Py-Home-Page/)で公開されています。
関連論文リスト
- GameWorld: Towards Standardized and Verifiable Evaluation of Multimodal Game Agents [76.60994803070436]
GameWorldは、ブラウザ環境におけるマルチモーダル大言語モデル(MLLM)ゲームエージェントの評価のためのベンチマークである。
2つのゲームエージェントインタフェースが研究され、 (i) キーボードとマウスのコントロールを直接出力するコンピュータ利用エージェント、 (ii) セマンティックアクション空間で作用する汎用マルチモーダルエージェントが研究されている。
18組のモデルとインタフェースのペアによる結果は、最高のパフォーマンスエージェントでさえ、ビデオゲームで人間の能力を達成するには程遠いことを示唆している。
論文 参考訳(メタデータ) (2026-04-08T17:49:03Z) - Introducing M: A Modular, Modifiable Social Robot [2.572404739180802]
プラットフォーム摩擦を低減するために設計された,オープンソースの低コストなソーシャルロボットプラットフォームであるMを紹介する。
Mはモジュラー・メカニカル・デザイン、マルチモーダル・センシング、そして表現的かつ機械的にシンプルなアクティベーション・アーキテクチャとROS2ネイティブ・ソフトウェア・パッケージを組み合わせたものである。
参加型デザインと1週間の在宅展開における実世界利用について報告し,Mが縦型再現可能な社会ロボティクス研究の実践的基盤としてどのように機能するかを示した。
論文 参考訳(メタデータ) (2026-03-19T16:51:37Z) - TinyTroupe: An LLM-powered Multiagent Persona Simulation Toolkit [7.56072680903655]
詳細なペルソナ定義を可能にするシミュレーションツールキットであるTinyTroupeを紹介する。
TinyTroupeのコンポーネントは、代表的な動作例を使って提示される。
このライブラリはhttps://github.com/tinytroupe.comでオープンソースとして公開されている。
論文 参考訳(メタデータ) (2025-07-13T21:00:27Z) - Adaptive Tool Use in Large Language Models with Meta-Cognition Trigger [49.81945268343162]
我々は,外部ツール利用のための適応型意思決定戦略であるMeCoを提案する。
MeCoは、表現空間内の高レベル認知信号をキャプチャすることで、メタ認知スコアを定量化する。
MeCoは微調整不要で、最小限のコストがかかる。
論文 参考訳(メタデータ) (2025-02-18T15:45:01Z) - ROS-LLM: A ROS framework for embodied AI with task feedback and structured reasoning [74.58666091522198]
非専門家による直感的なロボットプログラミングのためのフレームワークを提案する。
ロボットオペレーティングシステム(ROS)からの自然言語のプロンプトと文脈情報を活用する
我々のシステムは,大規模言語モデル (LLM) を統合し,非専門家がチャットインタフェースを通じてシステムにタスク要求を記述できるようにする。
論文 参考訳(メタデータ) (2024-06-28T08:28:38Z) - clembench-2024: A Challenging, Dynamic, Complementary, Multilingual Benchmark and Underlying Flexible Framework for LLMs as Multi-Action Agents [19.989503513817095]
大きな言語モデルは、特定の能力を探索する会話ゲームに"セルフプレイ"するよう促すことができる。
本稿では,このようなゲームプレイ環境を構築するためのフレームワークの1つを取り上げ,その有効性を評価機器として検証する。
論文 参考訳(メタデータ) (2024-05-31T14:43:31Z) - A Survey on Large Language Model-Based Game Agents [35.34074811680046]
ゲームエージェントは、人工知能に関連する能力を探索するための貴重なテストベッドを提供する。
近年、LLM(Large Language Models)の出現は、これらのエージェントに一般化可能な推論を与える新たな機会を提供する。
この調査は、統一された参照アーキテクチャを通して、LLMベースのゲームエージェントの最新のレビューを提供する。
論文 参考訳(メタデータ) (2024-04-02T15:34:18Z) - MEIA: Multimodal Embodied Perception and Interaction in Unknown Environments [82.67236400004826]
本稿では,自然言語で表現されたハイレベルなタスクを実行可能なアクションのシーケンスに変換するための,MEIA(Multimodal Embodied Interactive Agent)を提案する。
MEMモジュールは、多様な要件とロボットの能力に基づいて、MEIAが実行可能なアクションプランを生成することを可能にする。
論文 参考訳(メタデータ) (2024-02-01T02:43:20Z) - MAgIC: Investigation of Large Language Model Powered Multi-Agent in Cognition, Adaptability, Rationality and Collaboration [98.18244218156492]
大規模言語モデル(LLM)は、非常に高度な自然言語処理を持つ。
アプリケーションがマルチエージェント環境に拡大するにつれて、包括的な評価フレームワークの必要性が生じる。
この研究は、マルチエージェント設定内でLLMを評価するための新しい競合ベースのベンチマークフレームワークを導入している。
論文 参考訳(メタデータ) (2023-11-14T21:46:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。