論文の概要: Make Planning Research Rigorous Again!
- arxiv url: http://arxiv.org/abs/2505.21674v1
- Date: Tue, 27 May 2025 18:51:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-29 17:35:50.240239
- Title: Make Planning Research Rigorous Again!
- Title(参考訳): 計画研究をリゴラスに!
- Authors: Michael Katz, Harsha Kokel, Christian Muise, Shirin Sohrabi, Sarath Sreedharan,
- Abstract要約: 我々は、大規模言語モデルによる計画作業の現在のトレンドに厳密さを適用するべきだと論じる。
計画コミュニティの経験と専門知識は、歴史的観点からだけ重要ではありません。
このような落とし穴を避けることは、LSMベースのプランナー構築の進展に大きく貢献すると考えています。
- 参考スコア(独自算出の注目度): 32.54078334699621
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In over sixty years since its inception, the field of planning has made significant contributions to both the theory and practice of building planning software that can solve a never-before-seen planning problem. This was done through established practices of rigorous design and evaluation of planning systems. It is our position that this rigor should be applied to the current trend of work on planning with large language models. One way to do so is by correctly incorporating the insights, tools, and data from the automated planning community into the design and evaluation of LLM-based planners. The experience and expertise of the planning community are not just important from a historical perspective; the lessons learned could play a crucial role in accelerating the development of LLM-based planners. This position is particularly important in light of the abundance of recent works that replicate and propagate the same pitfalls that the planning community has encountered and learned from. We believe that avoiding such known pitfalls will contribute greatly to the progress in building LLM-based planners and to planning in general.
- Abstract(参考訳): 当初から60年以上にわたり、計画の分野は、これまで見たことのない計画問題の解決が可能な計画ソフトウェアの構築の理論と実践の両方に重要な貢献をしてきた。
これは厳格な設計と計画システムの評価の確立を通じて行われた。
我々の立場では、この厳格性は、大規模言語モデルによる計画の現在のトレンドに適用されるべきである。
1つの方法は、自動計画コミュニティからの洞察、ツール、データをLSMベースのプランナーの設計と評価に正しく組み込むことである。
プランニングコミュニティの経験と専門知識は、歴史的観点からだけでなく、LLMベースのプランナーの開発を促進する上でも重要な役割を担っている。
このポジションは、計画コミュニティが遭遇し、学んだのと同じ落とし穴を複製し、広める最近の作品が豊富にあることを踏まえると、特に重要である。
このような落とし穴を避けることは、LSMベースのプランナーの構築や計画全般の進展に大きく貢献すると考えています。
関連論文リスト
- Plan-R1: Safe and Feasible Trajectory Planning as Language Modeling [75.83583076519311]
Plan-R1は、軌道計画を逐次予測タスクとして定式化する、新しい2段階の軌道計画フレームワークである。
第1段階では,専門家データに基づく次の動きトークン予測により,自己回帰軌道予測器を訓練する。
第2段階では、規則に基づく報酬(衝突回避、速度制限など)を設計し、グループ相対政策最適化を用いてモデルを微調整する。
論文 参考訳(メタデータ) (2025-05-23T09:22:19Z) - LHPF: Look back the History and Plan for the Future in Autonomous Driving [10.855426442780516]
本稿では,歴史計画情報を統合した模倣学習プランナ LHPF を紹介する。
我々のアプローチでは、歴史的計画意図をプールする歴史的意図集約モジュールを採用している。
実世界のデータと合成データの両方を用いた実験は、LHPFが既存の高度な学習ベースのプランナーに勝るだけでなく、純粋に学習ベースのプランナーがエキスパートを上回った最初の事例であることを示している。
論文 参考訳(メタデータ) (2024-11-26T09:30:26Z) - Exploring and Benchmarking the Planning Capabilities of Large Language Models [57.23454975238014]
この研究は、大規模言語モデル(LLM)の計画能力を改善するための基礎を築いた。
我々は、古典的な計画ベンチマークと自然言語シナリオの両方を含む包括的なベンチマークスイートを構築した。
本研究は,LLM計画の強化を目的としたマルチショットインコンテキスト学習について検討し,文脈長の増大と計画性能の向上の関係について検討する。
論文 参考訳(メタデータ) (2024-06-18T22:57:06Z) - Open Grounded Planning: Challenges and Benchmark Construction [44.86307213996181]
我々は,新たな計画課題--オープン・グランド・プランニングを提案する。
オープングランドプランニングの主な目的は、可変アクションセットに基づいて実行可能なプランを生成するようモデルに求めることである。
そして、現在最先端のLLMを5つの計画手法とともにテストし、既存のLLMとメソッドが、オープンドメインの基盤となる計画によってもたらされる課題を解決するのに依然として苦労していることを明らかにした。
論文 参考訳(メタデータ) (2024-06-05T03:46:52Z) - Large Language Models are Learnable Planners for Long-Term Recommendation [59.167795967630305]
即時利益と長期利益の両方の計画が、勧告においてますます重要になる。
既存手法では,長期的推薦に対する累積報酬を最大化することにより,計画能力の学習に強化学習を適用している。
本稿では,長期的推薦のために,大規模言語モデルのスパースデータよりも優れた計画能力を活用することを提案する。
論文 参考訳(メタデータ) (2024-02-29T13:49:56Z) - What's the Plan? Evaluating and Developing Planning-Aware Techniques for Language Models [7.216683826556268]
大きな言語モデル(LLM)は、計画機能を必要とするアプリケーションにますます使われています。
我々は,新しいハイブリッド・メソドであるSimPlanを紹介し,その性能を新たな挑戦的な設定で評価する。
論文 参考訳(メタデータ) (2024-02-18T07:42:49Z) - LLM-Assist: Enhancing Closed-Loop Planning with Language-Based Reasoning [65.86754998249224]
従来のルールベースプランナとLCMベースのプランナを併用した,新しいハイブリッドプランナを開発した。
当社のアプローチでは,既存のプランナが苦労する複雑なシナリオをナビゲートし,合理的なアウトプットを生成すると同時に,ルールベースのアプローチと連携して作業する。
論文 参考訳(メタデータ) (2023-12-30T02:53:45Z) - PlanBench: An Extensible Benchmark for Evaluating Large Language Models
on Planning and Reasoning about Change [34.93870615625937]
PlanBenchは、自動計画コミュニティで使用されるドメインの種類に基づいたベンチマークスイートである。
PlanBenchはタスクドメインと特定の計画機能の両方に十分な多様性を提供します。
論文 参考訳(メタデータ) (2022-06-21T16:15:27Z) - A Look at Value-Based Decision-Time vs. Background Planning Methods Across Different Settings [41.606112019744174]
本研究では,意思決定時間と背景計画手法の値に基づくバージョンが,異なる設定で相互に比較する方法について検討する。
全体として,2つの計画手法の値ベースのバージョンは,最も単純なインスタンス化において同等に動作するが,価値ベースの意思決定時間計画手法の近代的なインスタンス化は,価値ベースの背景計画手法の近代的なインスタンス化よりも同等かそれ以上に実行可能であることが示唆された。
論文 参考訳(メタデータ) (2022-06-16T20:48:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。