論文の概要: C-Evolve: Consensus-based Evolution for Prompt Groups
- arxiv url: http://arxiv.org/abs/2509.23331v1
- Date: Sat, 27 Sep 2025 14:35:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:19.166688
- Title: C-Evolve: Consensus-based Evolution for Prompt Groups
- Title(参考訳): C-Evolve: Prompt Groupsの合意に基づく進化
- Authors: Tiancheng Li, Yuhang Wang, Zhiyang Chen, Zijun Wang, Liyuan Ma, Guo-jun Qi,
- Abstract要約: 本稿では,集約された出力が最適性能を達成するプロンプト群を探索する進化的アルゴリズムであるConsensus-Evolve(C-Evolve)を紹介する。
C-Evolveは個体数の多様性を維持するために島を基盤とした進化的アルゴリズムを採用しており、異なる島々からのプロンプトはグループを形成するために選択される。
本手法は,HotpotQAのようなオープンエンドタスクとMATHのようなクローズドエンドタスクの両方を含む,幅広いタスクにおける最先端のパフォーマンスを実現する。
- 参考スコア(独自算出の注目度): 43.256446610084986
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Prompt evolution algorithms offer a powerful paradigm for enhancing AI systems based on closed-source models, while few work explores whether aggregating results from multiple prompts to reach a consensus can further advance the system capability boundary. In this paper, we introduce Consensus-Evolve (C-Evolve), an evolutionary algorithm that discovers a group of prompts whose aggregated outputs after majority voting achieve optimal performance. More specifically, C-Evolve employs an island-based evolutionary algorithm to maintain population diversity, and prompts from distinct islands are selected to form groups to aggregate their outputs. The key difference from single individual evolution is a voting score, which evaluates each individual prompt's contribution within groups. We take this as the fitness score for evolution instead of individual performance. Consequently, C-Evolve is more likely to produce and maintain prompts with higher potential to form a high-performing group and eliminate low-performing ones, gradually improving the group performance after reaching consensus. Our method achieves state-of-the-art performance across a wide range of tasks, including both open-ended tasks like HotpotQA and closed-ended tasks like MATH. On Qwen3-8B, C-Evolve achieves 70.67% on HotpotQA and 43.88% on IFBench, which are 4.95% and 2.73% higher than GEPA, respectively. For GPT-4.1-mini, the accuracy on IFBench is further improved to 47.96% and reaches 95.33% in the MATH benchmark. These results demonstrate the C-Evolve's competitive performance.
- Abstract(参考訳): プロンプト進化アルゴリズムは、クローズドソースモデルに基づくAIシステムを強化するための強力なパラダイムを提供する一方で、コンセンサスに到達するために複数のプロンプトから結果を集約することで、システム能力境界をさらに前進させるかどうかを調査する研究はほとんどない。
本稿では,コンセンサス・エボレーブ(Consensus-Evolve, C-Evolve, C-Evolve)を提案する。
より具体的には、C-Evolveは個体数の多様性を維持するために島ベースの進化的アルゴリズムを採用しており、異なる島々からのプロンプトが選択され、そのアウトプットを集約するグループを形成している。
個々の個人の進化との大きな違いは、グループ内の各プロンプトの貢献を評価する投票スコアである。
これは個々のパフォーマンスではなく、進化のためのフィットネススコアだと考えています。
その結果、C-Evolveは高い確率でハイパフォーマンスなグループを形成し、低パフォーマンスなグループを排除し、コンセンサスに達した後に徐々にグループパフォーマンスを向上する。
本手法は,HotpotQAのようなオープンエンドタスクとMATHのようなクローズドエンドタスクの両方を含む,幅広いタスクにおける最先端のパフォーマンスを実現する。
Qwen3-8Bでは、C-EvolveはホットポットQAで70.67%、IFBenchで43.88%、それぞれEPAより4.95%と2.73%高い。
GPT-4.1-miniでは、IFBenchの精度は47.96%に向上し、MATHベンチマークでは95.33%に達した。
これらの結果はC-Evolveの競争性能を示している。
関連論文リスト
- RoundTable: Investigating Group Decision-Making Mechanism in Multi-Agent Collaboration [49.4875652673051]
複数ラウンドのコラボレーションにおいて、異なる投票ルールが意思決定の質と効率にどのように影響するかを分析する。
極端に言えば、全会一致投票は、最高のパフォーマンスの方法よりも87%低い初期パフォーマンスを与える。
本研究は,MASコラボレーションの最適化においてグループ意思決定が重要な役割を担っていることを明らかにする。
論文 参考訳(メタデータ) (2024-11-11T17:37:47Z) - Evolving a multi-population evolutionary-QAOA on distributed QPUs [0.0]
この進化的QAOA(E-QAOA)アプローチをMax-Cut問題に対して4ノードから26ノードの正規グラフ$d$3に対してベンチマークする。
本稿では,2つの量子処理ユニット上で並列で独立した集団を実行する分散多集団EA戦略を提案する。
論文 参考訳(メタデータ) (2024-09-16T21:16:51Z) - ConvBench: A Comprehensive Benchmark for 2D Convolution Primitive Evaluation [0.34952465649465553]
本稿では,畳み込みアルゴリズムの評価と比較のためのプリミティブレベルのベンチマークであるConvBenchを提案する。
1097の現実世界のディープラーニングモデルから派生した9243の畳み込み操作を評価する。
実験の結果、93.6%の畳み込みでIm2col-GEMMよりも速い結果が得られた。
論文 参考訳(メタデータ) (2024-07-15T13:58:24Z) - DARLEI: Deep Accelerated Reinforcement Learning with Evolutionary
Intelligence [77.78795329701367]
本稿では,進化アルゴリズムと並列化強化学習を組み合わせたフレームワークであるDARLEIを提案する。
我々はDARLEIの性能を様々な条件で特徴付け、進化形態の多様性に影響を与える要因を明らかにした。
今後DARLEIを拡張して、よりリッチな環境における多様な形態素間の相互作用を取り入れていきたいと考えています。
論文 参考訳(メタデータ) (2023-12-08T16:51:10Z) - Effective Mutation Rate Adaptation through Group Elite Selection [50.88204196504888]
本稿では,GESMR(Group Elite Selection of Mutation Rates)アルゴリズムを提案する。
GESMRは解の集団とMRの集団を共進化させ、各MRは解群に割り当てられる。
同じ数の関数評価とオーバーヘッドのほとんどないGESMRは、以前のアプローチよりも早く、より良いソリューションに収束する。
論文 参考訳(メタデータ) (2022-04-11T01:08:26Z) - Quality Evolvability ES: Evolving Individuals With a Distribution of
Well Performing and Diverse Offspring [0.2578242050187029]
進化性アルゴリズムは、優れた遺伝子表現を自動的に学習することを目指している。
進化性ESは、ほとんど計算せずに進化性を直接選択できる。
タスクのパフォーマンスと進化性を同時に最適化するQuality Evolvability ESを提案する。
論文 参考訳(メタデータ) (2021-03-19T13:22:22Z) - Involution: Inverting the Inherence of Convolution for Visual
Recognition [72.88582255910835]
本稿では,畳み込みの原理を逆転させることにより,深層ニューラルネットワークの新たな原子操作を提案する。
提案する畳み込み演算子は、視覚認識のための新しい世代のニューラルネットワークを構築するための基本ブロックとして利用することができる。
当社のInvolutionベースのモデルは、ResNet-50を使用した畳み込みベースラインのパフォーマンスを最大1.6%の精度、2.5%と2.4%のバウンディングボックスAP、4.7%は絶対にIoUを意味します。
論文 参考訳(メタデータ) (2021-03-10T18:40:46Z) - Inception Convolution with Efficient Dilation Search [121.41030859447487]
拡散畳み込みは、効果的な受容場を制御し、オブジェクトの大規模な分散を処理するための標準的な畳み込みニューラルネットワークの重要な変異体である。
そこで我々は,異なる軸,チャネル,層間の独立な拡散を有する拡張畳み込みの新たな変異体,すなわち開始(拡張)畳み込みを提案する。
本稿では,データに複雑なインセプション・コンボリューションを適合させる実用的な手法を探索し,統計的最適化に基づく簡易かつ効果的な拡張探索アルゴリズム(EDO)を開発した。
論文 参考訳(メタデータ) (2020-12-25T14:58:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。