Fugu-MT 論文翻訳(概要): Auction-Consensus Algorithm with Learned Bidding Scheme for Multi-Robot Systems

論文の概要: Auction-Consensus Algorithm with Learned Bidding Scheme for Multi-Robot Systems

arxiv url: http://arxiv.org/abs/2605.21932v1
Date: Thu, 21 May 2026 03:00:47 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-22 16:35:42.068506
Title: Auction-Consensus Algorithm with Learned Bidding Scheme for Multi-Robot Systems
Title（参考訳）: マルチロボットシステムのための学習バイディング方式によるオークション・コンセンサス・アルゴリズム
Authors: Jose Rodriguez, Constantine Tarawneh, Sven Koenig, Wenjie Dong, Qi Lu,
Abstract要約: Auction-Consensusアルゴリズムは、証明可能な収束を伴うスケーラブルな分散調整を提供する。本稿では、CBBAの決定論的入札機構を強化学習を用いて訓練されたニューラル入札ポリシーに置き換える学習強化オークション・コンセンサス・フレームワークを提案する。様々なSwarmサイズにまたがる実験結果から、学習入札政策は古典的なCBBAよりも解の質を向上させることが示されている。
参考スコア（独自算出の注目度）: 16.187002302872028
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Multi-Robot Task Allocation (MRTA) is a central challenge in decentralized multi-agent systems, where teams of robots must cooperatively assign and execute tasks under limited communication while optimizing global performance objectives. Auction-consensus algorithms, such as the Consensus-Based Bundle Algorithm (CBBA), provide scalable decentralized coordination with provable convergence, but rely on hand-crafted greedy scoring functions that often lead to suboptimal task allocations. This paper proposes a learning-enhanced auction-consensus framework in which CBBA's deterministic bidding mechanism is replaced by a neural bidding policy trained using reinforcement learning. Under a centralized training and decentralized execution paradigm, agents learn to compute task bids from partial local observations while retaining the standard auction and consensus phases for decentralized coordination. The learned bidding policy is trained using Proximal Policy Optimization with rewards shaped by proximity to globally optimal solutions obtained via mixed-integer linear programming. Multiple neural architectures are evaluated, including a Neural Additive Model, the Long Short-Term Memory (LSTM) model, and the Set Transformer Model. Experimental results across varying swarm sizes demonstrate that learned bidding policies can improve solution quality over classical CBBA while preserving decentralized execution. The proposed approach highlights the effectiveness of integrating reinforcement learning with classical distributed coordination algorithms, offering a scalable pathway toward higher-quality decentralized multi-robot task allocation.
Abstract（参考訳）: マルチロボットタスク割り当て(MRTA)は、分散化されたマルチエージェントシステムにおいて中心的な課題であり、ロボットのチームは、グローバルなパフォーマンス目標を最適化しながら、限られたコミュニケーションの下でタスクを協調的に割り当て、実行しなければならない。 CBBA(Consensus-Based Bundle Algorithm)のようなオークション・コンセンサス・アルゴリズムは、証明可能な収束を伴うスケーラブルな分散コーディネートを提供するが、しばしば最適なタスク割り当てにつながる手作りのグレディスコア機能に依存している。本稿では、CBBAの決定論的入札機構を強化学習を用いて訓練されたニューラル入札ポリシーに置き換える学習強化オークション・コンセンサス・フレームワークを提案する。集中的なトレーニングと分散実行パラダイムの下で、エージェントは、分散協調のための標準オークションとコンセンサスフェーズを維持しながら、部分的な局所的な観察からタスク入札を計算することを学ぶ。学習された入札ポリシーは、混合整数線形計画法により得られる大域最適解に近接して形づくられる報酬を用いて、近似ポリシー最適化を用いて訓練される。ニューラル付加モデル、Long Short-Term Memory(LSTM)モデル、Set Transformer Modelなど、複数のニューラルアーキテクチャが評価されている。様々なSwarmサイズにまたがる実験結果から,学習入札政策は分散実行を保ちながら,古典的CBBAよりもソリューション品質を向上させることが示された。提案手法は,従来の分散協調アルゴリズムと強化学習を統合することの有効性を強調し,高品質な分散型マルチロボットタスクアロケーションへのスケーラブルな経路を提供する。

関連論文リスト

Edge-AI-Driven Learning-to-Rank for Decentralized Task Allocation in Circular Smart Manufacturing [54.4933359656657]
本研究は,ランクアウェア交渉に基づくエッジAI駆動型分散タスク割り当てフレームワークを提案する。ランキング対応の定式化は、最終的に学習目標を再認識し、勝者選択の順序付けに基づく性質に適合する。その結果, 高負荷下での遅延および期限順守が向上し, より厳密な制約下でのエネルギー効率が向上した。
論文参考訳（メタデータ） (2026-05-14T20:38:25Z)
Structured Cooperative Multi-Agent Reinforcement Learning: a Bayesian Network Perspective [1.2515675707300356]
本研究では, モデルレス強化学習において, エージェント間結合における構造を有効活用するための体系的アプローチを提案する。 P-DTDEスキームに基づくマルチエージェントポリシー勾配定理を導出し,スケーラブルなアクター・クリティック・アルゴリズムを開発した。
論文参考訳（メタデータ） (2025-10-11T00:29:55Z)
Hierarchical Reinforcement Learning for Optimal Agent Grouping in Cooperative Systems [0.4759142872591625]
本稿では,協調型マルチエージェントシステムにおけるエージェントグループ化やペアリングの問題に対処するための階層型強化学習(RL)手法を提案する。階層的なRLフレームワークを用いることで、グループ化の高レベル決定と低レベルのエージェントのアクションを区別する。エージェント間の均質性や協調性を扱うために、置換型ニューラルネットワークを導入し、効果的な協調を可能にする。
論文参考訳（メタデータ） (2025-01-11T14:22:10Z)
Cluster-Based Multi-Agent Task Scheduling for Space-Air-Ground Integrated Networks [60.085771314013044]
低高度経済は、コミュニケーションやセンシングなどの分野で発展する大きな可能性を秘めている。本稿では,SAGINにおけるマルチUAV協調タスクスケジューリング問題に対処するため,クラスタリングに基づく多エージェントDeep Deterministic Policy Gradient (CMADDPG)アルゴリズムを提案する。
論文参考訳（メタデータ） (2024-12-14T06:17:33Z)
Imitation Learning based Alternative Multi-Agent Proximal Policy Optimization for Well-Formed Swarm-Oriented Pursuit Avoidance [15.498559530889839]
本稿では,分散学習に基づく代替的マルチエージェント・プロキシ・ポリシー最適化(IA-MAPPO)アルゴリズムを提案する。擬似学習を利用して生成コントローラを分散化し,通信オーバーヘッドを低減し,スケーラビリティを向上させる。シミュレーションの結果,IA-MAPPOの有効性が検証され,広範囲なアブレーション実験により,通信オーバーヘッドが著しく減少する集中型解に匹敵する性能が示された。
論文参考訳（メタデータ） (2023-11-06T06:58:16Z)
Serverless Federated AUPRC Optimization for Multi-Party Collaborative Imbalanced Data Mining [119.89373423433804]
有効指標としてAUPRC(Area Under Precision-Recall)を導入した。サーバーレスのマルチパーティ共同トレーニングは、サーバーノードのボトルネックを避けることで通信コストを削減できる。本稿では,AUPRCを直接最適化する ServerLess biAsed sTochastic gradiEnt (SLATE) アルゴリズムを提案する。
論文参考訳（メタデータ） (2023-08-06T06:51:32Z)
F2A2: Flexible Fully-decentralized Approximate Actor-critic for Cooperative Multi-agent Reinforcement Learning [110.35516334788687]
分散マルチエージェント強化学習アルゴリズムは複雑なアプリケーションでは実践的でないことがある。本稿では,大規模で汎用的なマルチエージェント設定を扱える,柔軟な完全分散型アクター批判型MARLフレームワークを提案する。当社のフレームワークは,大規模環境におけるスケーラビリティと安定性を実現し,情報伝達を低減できる。
論文参考訳（メタデータ） (2020-04-17T14:56:29Z)
Decentralized MCTS via Learned Teammate Models [89.24858306636816]
本稿では,モンテカルロ木探索に基づくトレーニング可能なオンライン分散計画アルゴリズムを提案する。深層学習と畳み込みニューラルネットワークを用いて正確なポリシー近似を作成可能であることを示す。
論文参考訳（メタデータ） (2020-03-19T13:10:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。