論文の概要: ORPilot: A Production-Oriented Agentic LLM-for-OR Tool for Optimization Modeling
- arxiv url: http://arxiv.org/abs/2605.02728v1
- Date: Mon, 04 May 2026 15:28:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.375
- Title: ORPilot: A Production-Oriented Agentic LLM-for-OR Tool for Optimization Modeling
- Title(参考訳): ORPilot:最適化モデリングのための生産指向エージェントLLM-for-ORツール
- Authors: Guangrui Xie,
- Abstract要約: ORPilotはエージェントAIシステムで、現実世界のビジネス問題から解決可能な最適化モデルに変換する。
これは、教科書運用研究(OR)ケースよりも生産レベルのビジネス問題をターゲットにした最初の試みである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents ORPilot, an open-source agentic AI system that translates real-world business problems into solver-ready optimization models. Unlike academic LLM-for-OR tools that assume clean problem specifications with preformatted inline data, ORPilot is designed for production conditions: ambiguous descriptions, large-scale raw operational data, and the need for portability across solver backends. The system introduces four novel components: (1) a conversational interview agent to elicit complete problem specifications, (2) a data collection agent that retrieves data independently of prompts, (3) a parameter computation agent to bridge raw tabular data and model-ready parameters, and (4) a solver-agnostic Intermediate Representation (IR) for deterministic, zero-LLM-call recompilation to Gurobi, CPLEX, PuLP, Pyomo, or OR-Tools solvers. Additionally, self-correcting retry loops utilize solver tracebacks for targeted repairs. ORPilot represents the first attempt to target production-level business problems rather than textbook operations research (OR) cases. Evaluation on real-world problems demonstrates promising results. When tested against traditional academic benchmarks: IndustryOR, NL4OPT and NLP4LP, ORPilot outperformed state-of-the-art tools in accuracy on the IndustryOR benchmark and delivered comparable performance on NL4OPT and NLP4LP.
- Abstract(参考訳): 本稿では,実世界のビジネス問題を解法対応最適化モデルに変換する,オープンソースのエージェントAIシステムORPilotを提案する。
事前フォーマットされたインラインデータでクリーンな問題仕様を仮定する学術的なLLM-for-ORツールとは異なり、ORPilotは、あいまいな記述、大規模な実運用データ、およびソルババックエンド間のポータビリティの必要性といった、運用条件のために設計されている。
本システムは,(1)完全な問題仕様を導き出す対話型面接エージェント,(2)プロンプトとは独立にデータを検索するデータ収集エージェント,(3)生の表型データとモデル対応パラメータをブリッジするパラメータ計算エージェント,(4)グロビ,CPLEX,PuLP,Pyomo,OR-Toolsソルバに対する決定論的ゼロLLMコール再コンパイルのためのソルバ非依存中間表現(IR)の4つの新しいコンポーネントを紹介する。
さらに、自己補正リトライループは、目標とする修復にソルバトレースバックを利用する。
ORPilotは、教科書操作研究(OR)ケースではなく、生産レベルのビジネス問題をターゲットにする最初の試みである。
実世界の問題に対する評価は有望な結果を示す。
IndustryOR、NL4OPT、NLP4LPといった従来の学術ベンチマークと比較すると、ORPilotはIndustrialORベンチマークの精度において最先端のツールよりも優れており、NL4OPTとNLP4LPで同等のパフォーマンスを提供している。
関連論文リスト
- AutoOR: Scalably Post-training LLMs to Autoformalize Operations Research Problems [54.593031581486116]
本稿では,拡張性のある合成データ生成および強化学習パイプラインであるAutoORについて述べる。
AutoORは、標準最適化フォームから検証済みのトレーニングデータを生成し、RL後トレーニングの報奨信号としてソルバ実行フィードバックを使用する。
我々は、AutoORのような手法がAIによる工業的意思決定を著しく加速できると考えている。
論文 参考訳(メタデータ) (2026-04-18T03:24:54Z) - SciML Agents: Write the Solver, Not the Solution [69.5021018644143]
敵の"ミスリーディング"問題の診断データセットと,1,000種類のODEタスクの大規模ベンチマークという,2つの新しいデータセットを紹介した。
オープンおよびクローズドソース LLM モデルについて, (i) 誘導型とガイド型, (ii) オフ・ザ・シェルフ対微調整型という2つの軸に沿って評価した。
予備的な結果は、慎重なプロンプトと微調整により、単純なODE問題を確実に解決できる特殊なLLMエージェントが得られることを示唆している。
論文 参考訳(メタデータ) (2025-09-12T02:53:57Z) - GraphTeam: Facilitating Large Language Model-based Graph Analysis via Multi-Agent Collaboration [31.07238612043854]
GraphTeamは3つのモジュールから5つのLLMベースのエージェントで構成されており、異なる特殊性を持つエージェントは複雑な問題に対処するために協力することができる。
6つのグラフ分析ベンチマークの実験は、GraphTeamが最先端のパフォーマンスを達成し、精度の点で最高のベースラインよりも平均25.85%改善していることを示している。
論文 参考訳(メタデータ) (2024-10-23T17:02:59Z) - OptiBench Meets ReSocratic: Measure and Improve LLMs for Optimization Modeling [62.19438812624467]
大規模言語モデル (LLM) は数学的推論における問題解決能力を示した。
本稿では,人間可読入力と出力を用いたエンドツーエンド最適化問題のベンチマークであるOptiBenchを提案する。
論文 参考訳(メタデータ) (2024-07-13T13:27:57Z) - MLLM-DataEngine: An Iterative Refinement Approach for MLLM [62.30753425449056]
本稿では,データ生成,モデルトレーニング,評価を橋渡しする新しいクローズドループシステムを提案する。
各ループ内で、MLLM-DataEngineはまず評価結果に基づいてモデルの弱点を分析する。
ターゲットとして,異なる種類のデータの比率を調整する適応型バッドケースサンプリングモジュールを提案する。
品質については、GPT-4を用いて、各データタイプで高品質なデータを生成する。
論文 参考訳(メタデータ) (2023-08-25T01:41:04Z) - Bandit Data-Driven Optimization [62.01362535014316]
機械学習パイプラインが設定で有用になるためには、克服しなければならない大きな問題点が4つある。
これらの問題点に対処する最初の反復予測記述フレームワークであるBanditデータ駆動最適化を導入する。
本稿では,このフレームワークの新しいアルゴリズム PROOF を提案する。
論文 参考訳(メタデータ) (2020-08-26T17:50:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。