論文の概要: CP-SynC: Multi-Agent Zero-Shot Constraint Modeling in MiniZinc with Synthesized Checkers
- arxiv url: http://arxiv.org/abs/2605.01675v1
- Date: Sun, 03 May 2026 02:17:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.879845
- Title: CP-SynC: Multi-Agent Zero-Shot Constraint Modeling in MiniZinc with Synthesized Checkers
- Title(参考訳): CP-SynC: 合成チェッカーを用いたMiniZincにおけるマルチエージェントゼロショット制約モデリング
- Authors: Yuliang Song, Eldan Cohen,
- Abstract要約: CP-SynC(Constraint Programming Modeling with Synthesized Checkers)は,MiniZincにおけるゼロショット制約モデリングのためのマルチエージェントワークフローである。
CP-SynCは、個々のLCM出力に固有のノイズを緩和するため、複数のモデリング軌跡を並列に探索し、選択エージェントを用いて、マルチエージェントエビデンスアグリゲーションアグリゲーションを介して最終モデルを選択する。
- 参考スコア(独自算出の注目度): 4.042110592015443
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Constraint Programming (CP) is a powerful paradigm for solving combinatorial problems, yet translating natural language problem descriptions into executable models remains a significant bottleneck. While Large Language Models (LLMs) show promise in automating this translation, they often struggle with subtle semantic errors in the absence of oracle validation at test time. To address this, we introduce CP-SynC (Constraint Programming modeling with Synthesized Checkers), a multi-agent workflow for zero-shot constraint modeling in MiniZinc. CP-SynC coordinates modeling agents that generate and refine candidate models and validation agents that synthesize semantic checkers to provide feedback on semantic correctness. To mitigate noise inherent in individual LLM outputs, CP-SynC explores multiple modeling trajectories in parallel and employs selection agents to select the final model via multi-agent evidence aggregation. Extensive experiments on a benchmark of 100 CP problems show that CP-SynC substantially outperforms existing baselines in MiniZinc modeling.
- Abstract(参考訳): 制約プログラミング(CP)は組合せ問題を解くための強力なパラダイムであるが、自然言語による問題記述を実行可能なモデルに変換することは大きなボトルネックである。
大きな言語モデル(LLM)は、この翻訳を自動化することを約束する一方で、テスト時にオラクルの検証がない場合に、微妙なセマンティックエラーに悩まされることが多い。
そこで我々は,MiniZincにおけるゼロショット制約モデリングのためのマルチエージェントワークフローであるCP-SynC(Constraint Programming Modeling with Synthesized Checkers)を紹介する。
CP-SynCは、候補モデルの生成と洗練を行うモデリングエージェントと、セマンティックチェッカーを合成して意味的正当性に関するフィードバックを提供するバリデーションエージェントをコーディネートする。
CP-SynCは、個々のLCM出力に固有のノイズを緩和するため、複数のモデリング軌跡を並列に探索し、選択エージェントを用いて、マルチエージェントエビデンスアグリゲーションアグリゲーションを介して最終モデルを選択する。
100のCP問題のベンチマーク実験により、CP-SynCはMiniZincモデリングにおいて既存のベースラインを大幅に上回ることを示した。
関連論文リスト
- UniT: Unified Multimodal Chain-of-Thought Test-time Scaling [85.590774707406]
統一モデルは単一のアーキテクチャ内でマルチモーダル理解と生成の両方を扱うことができるが、通常は出力を反復的に書き換えることなく単一のパスで操作する。
マルチモーダルなテストタイムスケーリングのためのフレームワークであるUniTを導入し、単一の統一モデルで複数のラウンドをまたいだ推論、検証、精査を可能にします。
論文 参考訳(メタデータ) (2026-02-12T18:59:49Z) - When Words Change the Model: Sensitivity of LLMs for Constraint Programming Modelling [1.052782170493037]
大きな言語モデルは、古典的なベンチマークのモデルを自動的に生成する素晴らしい結果を示している。
多くの標準CP問題は、これらのモデルのトレーニングデータに含まれる可能性が高い。
LLMは構文的に妥当で意味論的に妥当なモデルを生成することができるが、その性能は文脈的・言語学的に著しく低下する。
論文 参考訳(メタデータ) (2025-11-18T10:40:32Z) - CP-Bench: Evaluating Large Language Models for Constraint Modelling [6.250460397062786]
制約プログラミング(CP)は、問題を解くために広く使われているが、その中核となるプロセス、すなわち制約モデリングは、かなりの専門知識を必要とし、広く採用される際のボトルネックと考えられている。
近年,問題記述を実行可能な制約モデルに変換するために,Large Language Models (LLMs) を用いて検討されている。
制約モデリングのための既存の評価データセットは、しばしば、現実のシナリオの多様性を捉えない、小さく、均一で、ドメイン固有のインスタンスに限られる。
この研究はCP-Benchの導入によってこのギャップに対処する。CPコミュニティから得られた様々な既知の問題を含む新しいベンチマークであるCP-Benchは構造化されている。
論文 参考訳(メタデータ) (2025-06-06T12:56:02Z) - SYNTHEVAL: Hybrid Behavioral Testing of NLP Models with Synthetic CheckLists [59.08999823652293]
我々は,NLPモデルの包括的評価のために,SyntheVALを提案する。
最後の段階では、人間の専門家が困難な例を調査し、手動でテンプレートを設計し、タスク固有のモデルが一貫して示す障害の種類を特定します。
我々は、感情分析と有害言語検出という2つの分類課題にSynTHEVALを適用し、これらの課題における強力なモデルの弱点を特定するのに、我々のフレームワークが有効であることを示す。
論文 参考訳(メタデータ) (2024-08-30T17:41:30Z) - Recurrent Complex-Weighted Autoencoders for Unsupervised Object Discovery [62.43562856605473]
複雑な重み付き再帰的アーキテクチャの計算上の優位性について論じる。
本稿では,反復的制約満足度を実現する完全畳み込みオートエンコーダSynCxを提案する。
論文 参考訳(メタデータ) (2024-05-27T15:47:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。