論文の概要: Modeling Copilots for Text-to-Model Translation
- arxiv url: http://arxiv.org/abs/2604.12955v2
- Date: Thu, 16 Apr 2026 01:27:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-17 16:09:14.186275
- Title: Modeling Copilots for Text-to-Model Translation
- Title(参考訳): テキストからモデルへの翻訳におけるコパイロットのモデル化
- Authors: Serdar Kadioglu, Karthik Uppuluri, Akash Singirikonda,
- Abstract要約: textscText2Modelは、オンラインのリーダーボードとともに、さまざまな複雑さを持つ複数のLCM戦略に基づいた、コピロのスイートである。
textscText2Zincは、自然言語で指定された最適化と満足度をキャプチャするためのクロスドメインデータセットであり、AIアシスタントを内蔵したインタラクティブエディタである。
- 参考スコア(独自算出の注目度): 3.481166526522356
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: There is growing interest in leveraging large language models (LLMs) for text-to-model translation and optimization tasks. This paper aims to advance this line of research by introducing \textsc{Text2Model} and \textsc{Text2Zinc}. \textsc{Text2Model} is a suite of copilots based on several LLM strategies with varying complexity, along with an online leaderboard. \textsc{Text2Zinc} is a cross-domain dataset for capturing optimization and satisfaction problems specified in natural language, along with an interactive editor with built-in AI assistant. While there is an emerging literature on using LLMs for translating combinatorial problems into formal models, our work is the first attempt to integrate \textit{both} satisfaction and optimization problems within a \textit{unified architecture} and \textit{dataset}. Moreover, our approach is \textit{solver-agnostic} unlike existing work that focuses on translation to a solver-specific model. To achieve this, we leverage \textsc{MiniZinc}'s solver-and-paradigm-agnostic modeling capabilities to formulate combinatorial problems. We conduct comprehensive experiments to compare execution and solution accuracy across several single- and multi-call strategies, including; zero-shot prompting, chain-of-thought reasoning, intermediate representations via knowledge-graphs, grammar-based syntax encoding, and agentic approaches that decompose the model into sequential sub-tasks. Our copilot strategies are competitive, and in parts improve, recent research in this domain. Our findings indicate that while LLMs are promising they are not yet a push-button technology for combinatorial modeling. We contribute \textsc{Text2Model} copilots and leaderboard, and \textsc{Text2Zinc} and interactive editor to open-source to support closing this performance gap.
- Abstract(参考訳): 大規模言語モデル(LLM)をテキストからモデルへの変換や最適化に活用することへの関心が高まっている。
本稿は, textsc{Text2Model} と \textsc{Text2Zinc} を導入することで, この研究の方向性を推し進めることを目的とする。
\textsc{Text2Model} は、オンラインのリーダーボードとともに、さまざまな複雑さを持つ複数の LLM 戦略に基づいた、コピロのスイートである。
\textsc{Text2Zinc}は、自然言語で指定された最適化と満足度問題をキャプチャするためのクロスドメインデータセットであり、AIアシスタントを内蔵したインタラクティブエディタである。
組合せ問題から形式的モデルへの変換にLLMを使うことについて,近年の文献が注目されているが,本研究は, \textit{both} 満足度と最適化問題を, \textit{unified architecture} と \textit{dataset} に組み込む最初の試みである。
さらに,本手法は,解決者固有のモデルへの翻訳に焦点を当てた既存の研究とは異なり,「textit{solver-agnostic」である。
これを実現するために、合成問題を定式化するために、textsc{MiniZinc} のソルバ・アンド・パラダイム・アグノスティック・モデリング機能を利用する。
我々は、ゼロショットプロンプト、チェーンオブ思考推論、知識グラフによる中間表現、文法に基づく構文符号化、そしてモデルを逐次的なサブタスクに分解するエージェント的アプローチを含む、複数の単一およびマルチコール戦略における実行と解の精度を比較する包括的な実験を行う。
当社のコパイロット戦略は競争力があり、一部では、この領域における最近の研究を改善しています。
以上の結果から,LLM はまだ組合せモデリングのためのプッシュボタン技術ではないことが示唆された。
我々は、このパフォーマンスギャップの解消をサポートするために、textsc{Text2Model} のコピロとリーダーボード、および \textsc{Text2Zinc} とインタラクティブエディタをオープンソースにコントリビュートする。
関連論文リスト
- Generative Data Transformation: From Mixed to Unified Data [57.84692191369066]
textscTaesarはtextbftarget-textbfal textbfregenerationのためのEmphdata中心のフレームワークである。
ドメイン間のコンテキストを対象のシーケンスにエンコードすることで、複雑な融合アーキテクチャを使わずに、標準的なモデルで複雑な依存関係を学習することができる。
論文 参考訳(メタデータ) (2026-02-26T08:30:09Z) - Gala: Global LLM Agents for Text-to-Model Translation [12.20235137210144]
この課題に対処するフレームワークであるGalaを,グローバルなエージェント的アプローチで紹介する。
複数の特殊大規模言語モデル(LLM)エージェントは、グローバル制約型によってモデリングタスクを分解する。
問題をより小さくよく定義されたサブタスクに分割することで、各LSMはより単純な推論問題を扱う。
論文 参考訳(メタデータ) (2025-09-10T20:04:20Z) - Rethinking Testing for LLM Applications: Characteristics, Challenges, and a Lightweight Interaction Protocol [83.83217247686402]
大言語モデル(LLM)は、単純なテキストジェネレータから、検索強化、ツール呼び出し、マルチターンインタラクションを統合する複雑なソフトウェアシステムへと進化してきた。
その固有の非決定主義、ダイナミズム、文脈依存は品質保証に根本的な課題をもたらす。
本稿では,LLMアプリケーションを3層アーキテクチャに分解する: textbftextitSystem Shell Layer, textbftextitPrompt Orchestration Layer, textbftextitLLM Inference Core。
論文 参考訳(メタデータ) (2025-08-28T13:00:28Z) - The Unreasonable Effectiveness of Model Merging for Cross-Lingual Transfer in LLMs [45.08958917457921]
大規模言語モデル(LLM)は、ハイソース言語以外のタスクで依然として苦戦している。
本研究では,タスク固有のポストトレーニングデータが不足している低リソース言語への言語間移動について検討する。
論文 参考訳(メタデータ) (2025-05-23T20:28:31Z) - New Dataset and Methods for Fine-Grained Compositional Referring Expression Comprehension via Specialist-MLLM Collaboration [49.180693704510006]
Referring Expression (REC) は、言語理解、画像理解、言語と画像の接点の相互作用を評価するためのクロスモーダルなタスクである。
MLLM(Multimodal Large Language Models)の試験場として機能する。
論文 参考訳(メタデータ) (2025-02-27T13:58:44Z) - Text2Zinc: A Cross-Domain Dataset for Modeling Optimization and Satisfaction Problems in MiniZinc [2.6217304977339473]
本稿では,自然言語テキストの最適化と満足度問題に対処するクロスドメインデータセットであるText2Zincを紹介する。
我々の研究は、満足度と最適化の問題の両方を統合データセットに統合することで、以前の試みと区別されている。
以上の結果から, LLMはテキストから問題をモデル化するためのプッシュボタン技術ではないことが示唆された。
論文 参考訳(メタデータ) (2025-02-22T04:13:53Z) - CELA: Cost-Efficient Language Model Alignment for CTR Prediction [70.65910069412944]
CTR(Click-Through Rate)予測は、レコメンダシステムにおいて最重要位置を占める。
最近の取り組みは、プレトレーニング言語モデル(PLM)を統合することでこれらの課題を緩和しようとしている。
CTR予測のためのtextbfCost-textbfEfficient textbfLanguage Model textbfAlignment (textbfCELA)を提案する。
論文 参考訳(メタデータ) (2024-05-17T07:43:25Z) - Mixture-of-Instructions: Aligning Large Language Models via Mixture Prompting [7.103987978402038]
我々はMixture-of-Instructions (MoI)と呼ばれる新しいテクニックを紹介する。
MoIは命令パッキングと多様なシステムプロンプトを組み合わせて言語モデルのアライメント効率を高める戦略を採用している。
提案手法はオープンソースQwen-7B-chatモデルに適用され,Qwen-SFT-MoIの開発が完了した。
論文 参考訳(メタデータ) (2024-04-29T03:58:12Z) - G-SPEED: General SParse Efficient Editing MoDel [25.48360227520061]
underlinetextbfGeneral underlinetextbfSParse underlinetextbfEfficient underlinetextbfEditing MounderlinetextbfDel(textbfG-SPEED)
論文 参考訳(メタデータ) (2023-10-16T15:01:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。