論文の概要: Mxplainer: Explain and Learn Insights by Imitating Mahjong Agents
- arxiv url: http://arxiv.org/abs/2506.14246v1
- Date: Tue, 17 Jun 2025 07:07:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-18 17:34:59.369551
- Title: Mxplainer: Explain and Learn Insights by Imitating Mahjong Agents
- Title(参考訳): Mxplainer: MahjongエージェントのImitating Mahjongエージェントによる説明と学習のインサイト
- Authors: Lingfeng Li, Yunlong Lu, Yongyi Wang, Qifan Zheng, Wenxin Li,
- Abstract要約: 本稿では,ブラックボックスエージェントのパラメータを学習するために,等価ニューラルネットワークに変換可能なパラメータ化探索アルゴリズムであるMxplainerを紹介する。
AIと人間プレイヤーのデータを用いて行われた実験は、学習されたパラメータがエージェントの特性やプレイスタイルに対する人間の理解可能な洞察を提供することを示した。
- 参考スコア(独自算出の注目度): 0.8088999193162028
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: People need to internalize the skills of AI agents to improve their own capabilities. Our paper focuses on Mahjong, a multiplayer game involving imperfect information and requiring effective long-term decision-making amidst randomness and hidden information. Through the efforts of AI researchers, several impressive Mahjong AI agents have already achieved performance levels comparable to those of professional human players; however, these agents are often treated as black boxes from which few insights can be gleaned. This paper introduces Mxplainer, a parameterized search algorithm that can be converted into an equivalent neural network to learn the parameters of black-box agents. Experiments conducted on AI and human player data demonstrate that the learned parameters provide human-understandable insights into these agents' characteristics and play styles. In addition to analyzing the learned parameters, we also showcase how our search-based framework can locally explain the decision-making processes of black-box agents for most Mahjong game states.
- Abstract(参考訳): 自分たちの能力を改善するためには、AIエージェントのスキルを内部化する必要がある。
本稿では,不完全な情報を含むマルチプレイヤーゲームであるMahjongに着目した。
AI研究者の努力により、いくつかのMahjong AIエージェントは、すでにプロの人間のプレイヤーに匹敵するパフォーマンスレベルを達成しているが、これらのエージェントはブラックボックスとして扱われることが多く、そこからはほとんど洞察が得られない。
本稿では,ブラックボックスエージェントのパラメータを学習するために,等価ニューラルネットワークに変換可能なパラメータ化探索アルゴリズムであるMxplainerを紹介する。
AIと人間プレイヤーのデータを用いて行われた実験は、学習されたパラメータがエージェントの特性やプレイスタイルに対する人間の理解可能な洞察を提供することを示した。
学習パラメータの解析に加えて,我々の検索ベースのフレームワークが,ほとんどのマヒョンゲーム状態に対するブラックボックスエージェントの意思決定過程をローカルに説明できることを示す。
関連論文リスト
- FAIRGAME: a Framework for AI Agents Bias Recognition using Game Theory [51.96049148869987]
ゲーム理論を用いたAIエージェントバイアス認識フレームワークFAIRGAMEを提案する。
我々は,AIエージェント間の人気ゲームにおけるバイアスのある結果を明らかにするために,その実装と利用について述べる。
全体として、FAIRGAMEはユーザーが望むゲームやシナリオを確実に簡単にシミュレートできる。
論文 参考訳(メタデータ) (2025-04-19T15:29:04Z) - Memento No More: Coaching AI Agents to Master Multiple Tasks via Hints Internalization [56.674356045200696]
本稿では,複雑なメモシステムや事前の高品質な実演データを必要としない,複数のタスクに対する知識とスキルを取り入れたAIエージェントの訓練手法を提案する。
このアプローチでは,エージェントが新たな経験を収集し,ヒントの形で人間から補正フィードバックを受け取り,このフィードバックを重みに組み込む,反復的なプロセスを採用している。
Llama-3をベースとしたエージェントに実装することで,数ラウンドのフィードバックの後,高度なモデルGPT-4oとDeepSeek-V3をタスクセットで性能向上させる手法の有効性を実証する。
論文 参考訳(メタデータ) (2025-02-03T17:45:46Z) - Deciphering Digital Detectives: Understanding LLM Behaviors and
Capabilities in Multi-Agent Mystery Games [26.07074182316433]
本稿では,Jubenshaに特化している最初のデータセットについて紹介する。
我々の研究は、LSMを使ったユニークなマルチエージェントインタラクションフレームワークも提供し、AIエージェントがこのゲームに自律的に関与できるようにする。
これらのAIエージェントのゲーム性能を評価するために,ケース情報と推論スキルの熟達度を測定する新しい手法を開発した。
論文 参考訳(メタデータ) (2023-12-01T17:33:57Z) - The Rise and Potential of Large Language Model Based Agents: A Survey [91.71061158000953]
大規模言語モデル(LLM)は、人工知能(AGI)の潜在的な火花と見なされる
まず、エージェントの概念を哲学的起源からAI開発まで追跡し、LLMがエージェントに適した基盤である理由を説明します。
単一エージェントシナリオ,マルチエージェントシナリオ,ヒューマンエージェント協調の3つの側面において,LLMベースのエージェントの広範な応用について検討する。
論文 参考訳(メタデータ) (2023-09-14T17:12:03Z) - Explainability via Responsibility [0.9645196221785693]
本稿では,特定のトレーニングインスタンスをユーザに提供する,説明可能な人工知能へのアプローチを提案する。
我々は、AIエージェントの動作の説明を人間のユーザに提供する能力を近似することで、このアプローチを評価する。
論文 参考訳(メタデータ) (2020-10-04T20:41:03Z) - AI solutions for drafting in Magic: the Gathering [0.0]
我々は,Drafttsim.comから収集した10,000以上の擬似匿名化人ドラフトのデータセットを提示する。
本稿では,プリミティブな起草エージェント,エキスパートによる複雑なエージェント,ネイブベイズエージェント,ディープニューラルネットワークエージェントの4つの多様な戦略を提案する。
この作業は、ヒューマンライクな起草エージェントの作成における次のステップを特定し、次世代の起草ボットのベンチマークとして機能する。
論文 参考訳(メタデータ) (2020-09-01T18:44:10Z) - Explainability in Deep Reinforcement Learning [68.8204255655161]
説明可能な強化学習(XRL)の実現に向けての最近の成果を概観する。
エージェントの振る舞いを正当化し、説明することが不可欠である重要な状況において、RLモデルのより良い説明可能性と解釈性は、まだブラックボックスと見なされているものの内部動作に関する科学的洞察を得るのに役立つ。
論文 参考訳(メタデータ) (2020-08-15T10:11:42Z) - Navigating the Landscape of Multiplayer Games [20.483315340460127]
大規模ゲームの応答グラフにネットワーク測度を適用することで,ゲームのランドスケープを創出できることを示す。
本研究は, 標準ゲームから複雑な経験ゲームまで, 訓練されたエージェント同士のパフォーマンスを計測する領域における知見について述べる。
論文 参考訳(メタデータ) (2020-05-04T16:58:17Z) - Learning from Learners: Adapting Reinforcement Learning Agents to be
Competitive in a Card Game [71.24825724518847]
本稿では,競争力のあるマルチプレイヤーカードゲームの現実的な実装を学習・プレイするために,一般的な強化学習アルゴリズムをどのように適用できるかについて検討する。
本研究は,学習エージェントに対して,エージェントが競争力を持つことの学習方法を評価するための特定のトレーニングと検証ルーチンを提案し,それらが相互の演奏スタイルにどのように適応するかを説明する。
論文 参考訳(メタデータ) (2020-04-08T14:11:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。