論文の概要: HMACE: Heterogeneous Multi-Agent Collaborative Evolution for Combinatorial Optimization
- arxiv url: http://arxiv.org/abs/2605.07214v1
- Date: Fri, 08 May 2026 04:02:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.791928
- Title: HMACE: Heterogeneous Multi-Agent Collaborative Evolution for Combinatorial Optimization
- Title(参考訳): HMACE: 組合せ最適化のための不均一な多エージェント協調進化
- Authors: Yuping Yan, Jirui Han, Fei Ming, Yuanshuai Li, Yaochu Jin,
- Abstract要約: HMACEは異種多言語協調進化フレームワークである。
それぞれの進化生成を4つの調整されたエージェントで自律的で役割特異的なループに分解する。
冗長な評価を避けながら、多様で有望な行動への探索を導く。
- 参考スコア(独自算出の注目度): 19.90781293176099
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models have recently emerged as a promising paradigm for automated heuristic design for NP-hard combinatorial optimization problems. Despite this progress, existing LLM-based methods typically rely on monolithic workflows constrained by rigid templates, thereby restricting memory-guided exploration and triggering premature convergence to local optima. To design an autonomous and collaborative architecture, we introduce HMACE, a Heterogeneous Multi-Agent Collaborative Evolution framework that reconceptualizes heuristic search as an organizational design problem. HMACE decomposes each evolutionary generation into an autonomous, role-specialized loop with four coordinated agents: a Proposer for strategy exploration, a Generator for executable heuristic synthesis, an Evaluator for empirical assessment, and a Reflector for archive-backed memory update. By coupling behavior-aware retrieval, lightweight candidate filtering, and fitness-grounded archive updates, HMACE guides the search toward diverse and promising heuristic behaviors while avoiding redundant evaluations. Extensive evaluations on representative COPs, including TSP, Online BPP, MKP, and PFSP, show that HMACE achieves a favorable quality-efficiency trade-off compared to state-of-the-art single-agent and multi-agent baselines. In the matched LLM-driven reference comparison, HMACE achieves the lowest average gaps on TSP and Online BPP (0.464\% and 0.223\%, respectively), while requiring only 0.13M and 0.42M tokens for the two tasks, substantially fewer than the compared baselines.
- Abstract(参考訳): NP-hard組合せ最適化問題に対する自動ヒューリスティック設計のための有望なパラダイムとして、Large Language Modelsが最近登場した。
この進歩にもかかわらず、既存のLCMベースの手法は一般的に固いテンプレートで制約されたモノリシックなワークフローに依存し、メモリ誘導探索を制限し、局所最適に早めに収束させる。
自律的かつ協調的なアーキテクチャを設計するために,ヒューリスティック検索を組織設計問題として再認識する異種多言語協調進化フレームワークであるHMACEを紹介する。
HMACEは、各進化生成を、戦略探索のためのプロポーラ、実行可能なヒューリスティック合成のためのジェネレータ、経験的評価のための評価器、アーカイブ支援されたメモリ更新のためのリフレクタの4つの調整されたエージェントで、自律的なロール特殊化ループに分解する。
HMACEは、行動認識検索、軽量候補フィルタリング、フィットネスグラウンドのアーカイブ更新を結合することにより、冗長な評価を回避しつつ、多様で有望なヒューリスティックな行動への探索をガイドする。
TSP, Online BPP, MKP, PFSPなどの代表的なCOPの広範な評価は, HMACEが最先端の単一エージェントとマルチエージェントのベースラインと比較して, 良好な品質と効率のトレードオフを達成していることを示している。
マッチング LLM による基準比較では、HMACE は TSP と Online BPP (それぞれ 0.464\% と 0.223\%) の最低平均ギャップを達成し、2つのタスクに対して 0.13M と 0.42M のトークンしか必要とせず、比較ベースラインよりもかなり少ない。
関連論文リスト
- Game-Theoretic Co-Evolution for LLM-Based Heuristic Discovery [37.96481049421407]
大規模言語モデル(LLM)は、自動発見の急速な進歩を可能にした。
本稿では,発見を問題解決者とインスタンスジェネレータのプログラムレベルの共進化として再編成するゲーム理論フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-30T12:14:52Z) - Co-GRPO: Co-Optimized Group Relative Policy Optimization for Masked Diffusion Model [74.99242687133408]
Masked Diffusion Models (MDMs) は、視覚、言語、モーダル・ジェネレーションにまたがる有望な可能性を示している。
本稿では,MDM生成をMDP(Markov Decision Process)として再構成し,モデルと推論スケジュールを併用するCo-GRPOを提案する。
論文 参考訳(メタデータ) (2025-12-25T12:06:04Z) - A Simple and Effective Framework for Symmetric Consistent Indexing in Large-Scale Dense Retrieval [11.72564658353791]
大規模情報検索システムでは,高効率・競争精度のため,高密度検索が業界標準となっている。
広く採用されているデュアルトウワー符号化アーキテクチャは、主に表現空間のミスアライメントと検索インデックスの不整合という、固有の課題を導入している。
本稿では2つの相乗的モジュールからなるシンプルで効果的なSCIフレームワークを提案する。
提案手法の有効性は,公開データセットと実世界のeコマースデータセットにまたがる結果によって検証され,理論的に保証される。
論文 参考訳(メタデータ) (2025-12-15T08:11:24Z) - HEAS: Hierarchical Evolutionary Agent Simulation Framework for Cross-Scale Modeling and Multi-Objective Search [4.807104001943257]
階層シミュレーションエージェント(Hierarchical Simulation Agent, HEAS)は、階層化されたエージェントベースのモデリングを進化的最適化とトーナメント評価で統合するPythonフレームワークである。
HEASは、共有コンテキストを読み書きする決定論的レイヤにスケジュールされた軽量プロセス(ストリーム)の階層としてモデルを表現する。
compact APIとCLIは、シングルオブジェクトとマルチオブジェクトの進化をシミュレートし、最適化し、評価します。
論文 参考訳(メタデータ) (2025-08-21T13:35:46Z) - LLM4CMO: Large Language Model-aided Algorithm Design for Constrained Multiobjective Optimization [54.35609820607923]
大規模言語モデル(LLM)は、アルゴリズム設計を支援する新しい機会を提供する。
LLM4CMOは,2つの人口構成をもつ2段階のフレームワークをベースとした新しいCMOEAである。
LLMは複雑な進化最適化アルゴリズムの開発において効率的な共同設計者として機能する。
論文 参考訳(メタデータ) (2025-08-16T02:00:57Z) - Collab: Controlled Decoding using Mixture of Agents for LLM Alignment [90.6117569025754]
人間のフィードバックからの強化学習は、大規模言語モデルを整合させる効果的な手法として現れてきた。
制御された復号化は、再訓練せずに推論時にモデルを整列するメカニズムを提供する。
本稿では,既存の既成のLCMポリシを活用するエージェントベースのデコーディング戦略の混合を提案する。
論文 参考訳(メタデータ) (2025-03-27T17:34:25Z) - Maximize to Explore: One Objective Function Fusing Estimation, Planning,
and Exploration [87.53543137162488]
我々はtextttMEX というオンライン強化学習(オンラインRL)フレームワークを提案する。
textttMEXは、自動的に探索エクスプロイトのバランスをとりながら、見積もりと計画コンポーネントを統合する。
様々な MuJoCo 環境では,ベースラインを安定的なマージンで上回り,十分な報酬を得られる。
論文 参考訳(メタデータ) (2023-05-29T17:25:26Z) - Multi-Agent Reinforcement Learning for Microprocessor Design Space
Exploration [71.95914457415624]
マイクロプロセッサアーキテクトは、高性能でエネルギー効率の追求において、ドメイン固有のカスタマイズにますます頼っている。
この問題に対処するために,Multi-Agent RL (MARL) を利用した別の定式化を提案する。
評価の結果,MARLの定式化は単エージェントRLのベースラインよりも一貫して優れていた。
論文 参考訳(メタデータ) (2022-11-29T17:10:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。