論文の概要: Boltzmann-based Exploration for Robust Decentralized Multi-Agent Planning (Extended Version)
- arxiv url: http://arxiv.org/abs/2603.02154v2
- Date: Tue, 10 Mar 2026 15:54:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-11 15:25:23.668888
- Title: Boltzmann-based Exploration for Robust Decentralized Multi-Agent Planning (Extended Version)
- Title(参考訳): ロバスト分散マルチエージェント計画のためのボルツマンによる探索(拡張版)
- Authors: Nhat D. A. Nguyen, Duong D. Nguyen, Gianluca Rizzo, Hung X. Nguyen,
- Abstract要約: 協調型マルチエージェント計画のための協調型ボルツマンMCTS(CB-MCTS)を提案する。
CB-MCTSは、決定論的UCTをボルツマンのポリシーと、持続的だが焦点を絞った探索のための減衰エントロピーボーナスに置き換える。
シミュレーションの結果,Dec-MCTSは詐欺的シナリオでは優れ,標準ベンチマークでは競争力を維持していることがわかった。
- 参考スコア(独自算出の注目度): 1.9365949510386085
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Decentralized Monte Carlo Tree Search (Dec-MCTS) is widely used for cooperative multi-agent planning but struggles in sparse or skewed reward environments. We introduce Coordinated Boltzmann MCTS (CB-MCTS), which replaces deterministic UCT with a stochastic Boltzmann policy and a decaying entropy bonus for sustained yet focused exploration. While Boltzmann exploration has been studied in single-agent MCTS, applying it in multi-agent systems poses unique challenges. CB-MCTS is the first to address this. We analyze CB-MCTS in the simple-regret setting and show in simulations that it outperforms Dec-MCTS in deceptive scenarios and remains competitive on standard benchmarks, providing a robust solution for multi-agent planning.
- Abstract(参考訳): 分散モンテカルロ木探索 (Dec-MCTS) は協調型マルチエージェント計画に広く用いられているが、スパースやスキュードの報酬環境に苦戦している。
本稿では,決定論的 UCT を確率的 Boltzmann ポリシーに置き換えるコーディネートボルツマンMCTS (CB-MCTS) を導入する。
ボルツマン探索は単エージェントMCTSで研究されているが、これをマルチエージェントシステムに適用することはユニークな課題である。
CB-MCTSが最初にこの問題に対処する。
我々は,CB-MCTSを単純な設定で解析し,デシカMCTSを騙しシナリオで上回る性能を示し,標準ベンチマークで競争力を維持し,マルチエージェント計画のための堅牢なソリューションを提供する。
関連論文リスト
- Human-Centric Open-Future Task Discovery: Formulation, Benchmark, and Scalable Tree-Based Search [55.96277616578607]
我々は,人間中心のオープンフューチャータスク発見(HOTD)の問題を定式化し,複数の課題にまたがる人的労力を減らすタスクの特定に焦点をあてる。
本研究では,HOTD-Benchを提案する。HOTD-Benchは,2K以上の実世界のビデオ,半自動アノテーションパイプライン,オープンセットの将来の評価に適したシミュレーションベースのプロトコルである。
また,多エージェントシステムによる複雑な推論を分解し,スケーラブルな探索木モジュールによる推論プロセスを構築するCMAST(Collaborative Multi-Agent Search Tree)を提案する。
論文 参考訳(メタデータ) (2025-11-24T09:33:59Z) - CTTS: Collective Test-Time Scaling [58.564620942591866]
テスト時スケーリング(TTS)は,大規模言語モデル(LLM)のパフォーマンス向上のための,有望かつトレーニング不要なアプローチとして登場した。
単体テストタイムスケーリング(STTS)パラダイムを克服するために、CTTS(Collective Test-Time Scaling)を導入します。
CTTS-MMは、マルチエージェントとマルチリワードのコラボレーションを運用する新しいフレームワークである。
論文 参考訳(メタデータ) (2025-08-05T11:19:08Z) - Exploring Explainable Multi-agent MCTS-minimax Hybrids in Board Game Using Process Mining [3.07405282890767]
本稿では,モンテカルロ木探索(MCTS)の意思決定と行動に関する潜在的説明について検討する。
MCTSの弱点は、非常に選択的な木を構築し、結果として決定的な動きを見逃し、戦術的な罠に陥ることである。
我々は,マルチエージェントMCTSのロールアウトフェーズに浅いミニマックス探索を統合し,プロセスマイニング技術を用いて3v3チェッカーにおけるエージェントの戦略を説明する。
論文 参考訳(メタデータ) (2025-03-30T05:48:53Z) - Monte Carlo Tree Search with Boltzmann Exploration [16.06815496704043]
本稿では,Boltzmann Tree Search(BTS)とDENTS(Desaying ENtropy Tree-Search)を紹介する。
我々のアルゴリズムは、Goのゲームを含むいくつかのベンチマーク領域で一貫したハイパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-04-11T13:25:35Z) - Decentralized Monte Carlo Tree Search for Partially Observable
Multi-agent Pathfinding [49.730902939565986]
マルチエージェントパスフィンディング問題は、グラフに閉じ込められたエージェントのグループに対するコンフリクトフリーパスのセットを見つけることである。
本研究では、エージェントが他のエージェントをローカルにのみ観察できる分散MAPF設定に焦点を当てた。
MAPFタスクのための分散マルチエージェントモンテカルロ木探索法を提案する。
論文 参考訳(メタデータ) (2023-12-26T06:57:22Z) - An Analysis on the Effects of Evolving the Monte Carlo Tree Search Upper
Confidence for Trees Selection Policy on Unimodal, Multimodal and Deceptive
Landscapes [0.0]
モンテカルロ木探索 (MCTS) は最適決定の探索に最も適したサンプリング法である。
MCTSで特にうまく機能する選択ポリシーは、樹上の信頼境界であり、UCTと呼ばれる。
本研究は, 単項関数から多項関数, 擬似関数まで, 異なる性質の5つの関数の利用について検討する。
論文 参考訳(メタデータ) (2023-11-21T20:40:34Z) - Monte-Carlo Tree Search for Multi-Agent Pathfinding: Preliminary Results [60.4817465598352]
マルチエージェントパスフィンディングに適したモンテカルロ木探索(MCTS)のオリジナル版を紹介する。
具体的には,エージェントの目標達成行動を支援するために,個別の経路を用いる。
また,木探索手順の分岐係数を低減するために,専用の分解手法を用いる。
論文 参考訳(メタデータ) (2023-07-25T12:33:53Z) - Combining Monte Carlo Tree Search and Heuristic Search for Weighted Vertex Coloring [13.545607571625393]
本研究は,モンテカルロ木探索法(MCTS)と重み付き頂点色問題(Weighted Vertex Coloring Problem)の解法について検討する。
基本MCTSアルゴリズムに加えて,従来のランダムシミュレーションを他のシミュレーション手法に置き換えたいくつかの変種について検討する。
我々は、これらの組み合わせMCTSの変種を評価するために、よく知られたベンチマークインスタンスの実験を行う。
論文 参考訳(メタデータ) (2023-04-24T14:50:33Z) - Continuous Monte Carlo Graph Search [61.11769232283621]
連続モンテカルログラフサーチ(Continuous Monte Carlo Graph Search, CMCGS)は、モンテカルログラフサーチ(MCTS)のオンラインプランニングへの拡張である。
CMCGSは、計画中、複数の州で同じ行動方針を共有することで高いパフォーマンスが得られるという洞察を生かしている。
並列化によってスケールアップすることができ、学習力学モデルによる連続制御においてクロスエントロピー法(CEM)よりも優れている。
論文 参考訳(メタデータ) (2022-10-04T07:34:06Z) - Monotonic Value Function Factorisation for Deep Multi-Agent
Reinforcement Learning [55.20040781688844]
QMIXは、中央集権的なエンドツーエンドで分散ポリシーをトレーニングできる新しい価値ベースの手法である。
深層多エージェント強化学習のための新しいベンチマークとして,StarCraft Multi-Agent Challenge (SMAC)を提案する。
論文 参考訳(メタデータ) (2020-03-19T16:51:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。