論文の概要: ORMind: A Cognitive-Inspired End-to-End Reasoning Framework for Operations Research
- arxiv url: http://arxiv.org/abs/2506.01326v1
- Date: Mon, 02 Jun 2025 05:11:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:34.038938
- Title: ORMind: A Cognitive-Inspired End-to-End Reasoning Framework for Operations Research
- Title(参考訳): ORMind: オペレーションリサーチのための認知にインスパイアされたエンドツーエンドの推論フレームワーク
- Authors: Zhiyuan Wang, Bokui Chen, Yinya Huang, Qingxing Cao, Ming He, Jianping Fan, Xiaodan Liang,
- Abstract要約: ORMindは認知にインスパイアされたフレームワークで、反ファクト推論を通じて最適化を強化する。
提案手法は,要求を数学的モデルや実行可能なコードに変換するエンド・ツー・エンドのワークフローを実装し,人間の認識をエミュレートする。
現在はLenovoのAIアシスタントで内部でテストされており、ビジネスとコンシューマの両方の最適化機能を強化する予定である。
- 参考スコア(独自算出の注目度): 53.736407871322314
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Operations research (OR) is widely deployed to solve critical decision-making problems with complex objectives and constraints, impacting manufacturing, logistics, finance, and healthcare outcomes. While Large Language Models (LLMs) have shown promising results in various domains, their practical application in industry-relevant operations research (OR) problems presents significant challenges and opportunities. Preliminary industrial applications of LLMs for operations research face two critical deployment challenges: 1) Self-correction focuses on code syntax rather than mathematical accuracy, causing costly errors; 2) Complex expert selection creates unpredictable workflows that reduce transparency and increase maintenance costs, making them impractical for time-sensitive business applications. To address these business limitations, we introduce ORMind, a cognitive-inspired framework that enhances optimization through counterfactual reasoning. Our approach emulates human cognition, implementing an end-to-end workflow that systematically transforms requirements into mathematical models and executable solver code. It is currently being tested internally in Lenovo's AI Assistant, with plans to enhance optimization capabilities for both business and consumer customers. Experiments demonstrate that ORMind outperforms existing methods, achieving a 9.5\% improvement on the NL4Opt dataset and a 14.6\% improvement on the ComplexOR dataset.
- Abstract(参考訳): 運用研究(Operations Research, OR)は、製造、物流、金融、医療の成果に影響を及ぼし、複雑な目標と制約で重要な意思決定問題を解決するために広く展開されている。
大規模言語モデル(LLM)は様々な分野において有望な成果を上げてきたが、産業関連オペレーション研究(OR)問題における実践的応用は、大きな課題と機会をもたらす。
運用研究におけるLCMの予備的産業利用は,2つの重要な展開課題に直面している。
1)自己補正は,コストのかかる誤りを引き起こす,数学的正確性よりもコード構文に重点を置いている。
2) 複雑な専門家の選択は、透明性を低減し、メンテナンスコストを増大させる予測不可能なワークフローを生成します。
このようなビジネス上の制約に対処するため、私たちはORMindを紹介します。
提案手法は,要求を数学的モデルや実行可能な解法コードに体系的に変換するエンド・ツー・エンドのワークフローを実装し,人間の認識をエミュレートする。
現在はLenovoのAIアシスタントで内部でテストされており、ビジネスとコンシューマの両方の最適化機能を強化する予定である。
実験によると、ORMindは既存のメソッドよりも優れており、NL4Optデータセットで9.5\%、ComplexORデータセットで14.6\%改善されている。
関連論文リスト
- A Practical Approach for Building Production-Grade Conversational Agents with Workflow Graphs [2.7905014064567344]
大きな言語モデル(LLM)は、さまざまなサービスドメインで大幅に改善されました。
産業環境でのSOTA(State-of-the-art)研究の適用は課題を提起する。
論文 参考訳(メタデータ) (2025-05-29T02:30:27Z) - ModelingAgent: Bridging LLMs and Mathematical Modeling for Real-World Challenges [72.19809898215857]
ModelingBenchは、様々な領域にわたる数学モデリングの競争から、現実に着想を得たオープンエンドの問題を特徴付ける新しいベンチマークである。
これらのタスクには、自然言語を形式的な数学的定式化に翻訳し、適切なツールを適用し、構造化された防御可能なレポートを生成する必要がある。
ツール使用をコーディネートするマルチエージェントフレームワークである ModelingAgent も紹介します。
論文 参考訳(メタデータ) (2025-05-21T03:33:23Z) - Scaling Autonomous Agents via Automatic Reward Modeling And Planning [52.39395405893965]
大規模言語モデル(LLM)は、様々なタスクにまたがる顕著な機能を示している。
しかし、彼らは多段階の意思決定と環境フィードバックを必要とする問題に苦戦している。
人間のアノテーションを使わずに環境から報酬モデルを自動的に学習できるフレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-17T18:49:25Z) - EVOLvE: Evaluating and Optimizing LLMs For Exploration [76.66831821738927]
大規模言語モデル(LLM)は、不確実性の下で最適な意思決定を必要とするシナリオにおいて、未調査のままである。
多くのアプリケーションに関係のあるステートレス強化学習環境である,帯域幅を最適に決定できる LLM の (in) 能力の測定を行う。
最適な探索アルゴリズムの存在を動機として,このアルゴリズム知識をLLMに統合する効率的な方法を提案する。
論文 参考訳(メタデータ) (2024-10-08T17:54:03Z) - On The Planning Abilities of OpenAI's o1 Models: Feasibility, Optimality, and Generalizability [59.72892401927283]
さまざまなベンチマークタスクでOpenAIのo1モデルの計画能力を評価する。
その結果,o1-preview は GPT-4 よりもタスク制約に順応していることがわかった。
論文 参考訳(メタデータ) (2024-09-30T03:58:43Z) - Language Models for Business Optimisation with a Real World Case Study in Production Scheduling [3.224702011999591]
大規模言語モデル (LLM) は、様々な言語関連タスクにまたがる卓越した性能を示している。
ビジネス最適化における問題定式化を自動化するためのLLMベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-22T23:45:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。