論文の概要: MAS-Algorithm: A Workflow for Solving Algorithmic Programming Problems with a Multi-Agent System
- arxiv url: http://arxiv.org/abs/2605.05949v1
- Date: Thu, 07 May 2026 09:57:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.678257
- Title: MAS-Algorithm: A Workflow for Solving Algorithmic Programming Problems with a Multi-Agent System
- Title(参考訳): MAS-Algorithm:マルチエージェントシステムを用いたアルゴリズムプログラミング問題の解法ワークフロー
- Authors: Yuliang Xu, Xiang Xu, Yao Wan, Hu Wei, Tong Jia,
- Abstract要約: MAS-Algorithmは、競合するプログラマやアルゴリズムエンジニアにインスパイアされたアルゴリズム問題解決のための、体系的なマルチエージェントワークフローである。
我々のフレームワークは、エンドツーエンドの解決プロセスをモジュラーステージに分解し、構造化推論、ツール統合、エージェント間の柔軟な調整を可能にします。
- 参考スコア(独自算出の注目度): 15.213043425523287
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Algorithmic problem solving serves as a rigorous testbed for evaluating structured reasoning in AI coding systems, as it directly reflects a model's ability to perform structured reasoning in complex scenarios.Existing approaches predominantly rely on model-centric strategies, such as architectural modifications and data scaling, which are costly and offer limited interpretability. Alternative methods leveraging external tools or prompting techniques (e.g., chain-of-thought) are often fragmented and lack a unified framework. In this paper, we propose MAS-Algorithm, a systematic multi-agent workflow for algorithmic problem solving inspired by the practices of competitive programmers and algorithm engineers. Our framework decomposes the end-to-end solving process into modular stages, enabling structured reasoning, tool integration, and flexible coordination among agents. The design emphasizes both rigor and extensibility, allowing it to generalize across diverse problem types.Experimental results on a self-constructed benchmark demonstrate consistent improvements across multiple Qwen series models, achieving an average gain of 6.48% in acceptance rate. In contrast, parameter-efficient fine-tuning on the same data yields only a marginal improvement of 0.89%. We further observe a 4.72% gain on LiveCodeBench-Pro, along with consistent improvements across additional accuracy and efficiency metrics.Beyond performance gains, we conduct comprehensive analyses to better understand the reasoning process within the workflow, including error patterns and cross-scenario behaviors. We further perform customized replacement and ablation studies to explore the upper bound of the framework, showing that individual agents can contribute improvements of up to 27.7%. These results highlight the strong potential of MAS-Algorithm for advancing AI-driven algorithmic reasoning.
- Abstract(参考訳): アルゴリズムによる問題解決は、複雑なシナリオで構造化推論を実行するモデル能力を直接反映しているため、AIコーディングシステムの構造化推論を評価するための厳密なテストベッドとして機能する。
外部ツールを利用する別の方法(例えば、チェーン・オブ・シント)は、しばしば断片化され、統一されたフレームワークが欠如している。
本稿では,競合するプログラマやアルゴリズム技術者の実践に触発された,アルゴリズム問題解決のためのマルチエージェントワークフローであるMAS-Algorithmを提案する。
我々のフレームワークは、エンドツーエンドの解決プロセスをモジュラーステージに分解し、構造化推論、ツール統合、エージェント間の柔軟な調整を可能にします。
この設計は厳密さと拡張性の両方を強調し、様々な問題タイプにまたがる一般化を可能にし、自己構築されたベンチマーク実験の結果は、複数のQwenシリーズモデルで一貫した改善を示し、受け入れ率の平均は6.48%に達する。
対照的に、同じデータに対するパラメータ効率の微調整は、0.89%の限界改善しか得られない。
さらに、LiveCodeBench-Proが4.72%向上し、さらなる精度と効率の指標が一貫した改善が見られた。
さらに、フレームワークの上界を探索するために、カスタマイズされた置換とアブレーションの研究を行い、個々のエージェントが最大27.7%の改善に貢献できることを示した。
これらの結果は、AI駆動のアルゴリズム推論を推し進めるためのMAS-Algorithmの強い可能性を浮き彫りにした。
関連論文リスト
- Co-evolving Agent Architectures and Interpretable Reasoning for Automated Optimization [6.428928591765431]
大規模言語モデル(LLM)を用いた操作研究は、手作業による推論によって制限されている。
自動最適化のための共進化的フレームワークであるEvoOR-Agentを提案する。
ケーススタディとアブレーション分析は、明示的なアーキテクチャ進化とグラフによる推論-軌道探索が、性能改善と構造的解釈可能性の両方に寄与していることを示している。
論文 参考訳(メタデータ) (2026-04-20T01:44:18Z) - Multi-Action Self-Improvement for Neural Combinatorial Optimization [0.979731979071071]
自己改善モデルは、高品質なソリューションの生成と模倣によってポリシーを反復的に洗練する。
これらのアプローチは、複数のエージェントの協調に関わる問題の構造を活用できない。
共同マルチエージェント動作による自己改善を拡大する。
論文 参考訳(メタデータ) (2025-10-14T08:26:27Z) - DARS: Dynamic Action Re-Sampling to Enhance Coding Agent Performance by Adaptive Tree Traversal [55.13854171147104]
大規模言語モデル(LLM)は、自然言語処理、データ分析、ソフトウェア開発など、さまざまな領域に革命をもたらした。
符号化エージェントのための新しい推論時間計算スケーリングアプローチである動的アクション再サンプリング(DARS)を提案する。
我々は、SWE-Bench Liteベンチマークに対する我々のアプローチを評価し、このスケーリング戦略がClude 3.5 Sonnet V2で55%のパス@kスコアを達成したことを実証した。
論文 参考訳(メタデータ) (2025-03-18T14:02:59Z) - DeclareAligner: A Leap Towards Efficient Optimal Alignments for Declarative Process Model Conformance Checking [1.4064491732635231]
本稿では,AIパスフィニング手法であるA*探索アルゴリズムを用いた新しいアルゴリズムであるDeclareAlignerを紹介する。
提案手法は,8,054個の合成および実寿命アライメント問題を用いて評価し,最適アライメントを効率的に計算できることを実証した。
論文 参考訳(メタデータ) (2025-03-13T15:49:29Z) - BRiTE: Bootstrapping Reinforced Thinking Process to Enhance Language Model Reasoning [78.63421517563056]
大規模言語モデル(LLM)は複雑な推論タスクにおいて顕著な機能を示した。
本稿では,新しいグラフィカルモデルを用いてLLM推論を定式化する統一確率的フレームワークを提案する。
本稿では,Bootstrapping Reinforced Thinking Process (BRiTE)アルゴリズムについて述べる。
論文 参考訳(メタデータ) (2025-01-31T02:39:07Z) - A Survey on Inference Optimization Techniques for Mixture of Experts Models [50.40325411764262]
大規模Mixture of Experts(MoE)モデルは、条件計算によるモデル容量と計算効率の向上を提供する。
これらのモデル上で推論をデプロイし実行することは、計算資源、レイテンシ、エネルギー効率において大きな課題を示す。
本調査では,システムスタック全体にわたるMoEモデルの最適化手法について分析する。
論文 参考訳(メタデータ) (2024-12-18T14:11:15Z) - Multi-objective Binary Differential Approach with Parameter Tuning for Discovering Business Process Models: MoD-ProM [2.3423913554158653]
本稿では,プロセス発見のための多目的フレームワークにおけるバイナリ微分進化手法について考察する。
提案手法により生成されたプロセスモデルは、最先端のアルゴリズムで生成されたプロセスよりも優れているか、少なくとも優れていることが示されている。
論文 参考訳(メタデータ) (2024-06-25T16:53:55Z) - Solution to Advanced Manufacturing Process Problems using Cohort
Intelligence Algorithm with Improved Constraint Handling Approaches [0.07989135005592125]
コホートインテリジェンス(CI)アルゴリズムは、設計、製造、サプライチェーン、医療などの領域から制約のない現実の問題を解決するために、社会にインスパイアされた最適化手法である。
論文 参考訳(メタデータ) (2023-10-16T05:40:23Z) - Sample-Efficient Multi-Agent RL: An Optimization Perspective [103.35353196535544]
一般関数近似に基づく汎用マルコフゲーム(MG)のためのマルチエージェント強化学習(MARL)について検討した。
汎用MGに対するマルチエージェントデカップリング係数(MADC)と呼ばれる新しい複雑性尺度を導入する。
我々のアルゴリズムは既存の研究に匹敵するサブリニアな後悔を与えることを示す。
論文 参考訳(メタデータ) (2023-10-10T01:39:04Z) - Learning to Optimize Permutation Flow Shop Scheduling via Graph-based
Imitation Learning [70.65666982566655]
置換フローショップスケジューリング(PFSS)は製造業で広く使われている。
我々は,より安定かつ正確に収束を加速する専門家主導の模倣学習を通じてモデルを訓練することを提案する。
我々のモデルのネットワークパラメータはわずか37%に減少し、エキスパートソリューションに対する我々のモデルの解のギャップは平均6.8%から1.3%に減少する。
論文 参考訳(メタデータ) (2022-10-31T09:46:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。