Fugu-MT 論文翻訳(概要): PreAct: Prediction Enhances Agent's Planning Ability

論文の概要: PreAct: Prediction Enhances Agent's Planning Ability

arxiv url: http://arxiv.org/abs/2402.11534v2
Date: Thu, 05 Dec 2024 04:40:54 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-06 20:43:01.475189
Title: PreAct: Prediction Enhances Agent's Planning Ability
Title（参考訳）: 予測はエージェントの計画能力を高める
Authors: Dayuan Fu, Jianzhao Huang, Siyuan Lu, Guanting Dong, Yejie Wang, Keqing He, Weiran Xu,
Abstract要約: 我々は**PreAct**、**pre**diction、**rea**soning、**act**ionを統合したエージェントフレームワークを提示する。予測から得られた情報を利用することで、大規模言語モデル(LLM)エージェントはより広範囲で戦略的に焦点を絞った推論を提供することができる。
参考スコア（独自算出の注目度）: 23.058048254571027
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Addressing the disparity between forecasts and actual results can enable individuals to expand their thought processes and stimulate self-reflection, thus promoting accurate planning. In this research, we present **PreAct**, an agent framework that integrates **pre**diction, **rea**soning, and **act**ion. By utilizing the information derived from predictions, the large language model (LLM) agent can provide a wider range and more strategically focused reasoning. This leads to more efficient actions that aid the agent in accomplishing intricate tasks. Our experimental results show that PreAct surpasses the ReAct method in completing complex tasks and that PreAct's performance can be further improved when paired with other memory or selection strategy techniques. We presented the model with varying quantities of historical predictions and discovered that these predictions consistently enhance LLM planning.The variances in single-step reasoning between PreAct and ReAct indicate that PreAct indeed has benefits in terms of diversity and strategic orientation over ReAct.
Abstract（参考訳）: 予測と実際の結果の相違に対処することで、個人は思考プロセスを拡張し、自己回帰を刺激し、正確な計画を促進することができる。本研究では,**PreAct**,**pre**Diction,**rea**soning,**act**ionを統合したエージェントフレームワークについて述べる。予測から得られた情報を利用することで、大規模言語モデル(LLM)エージェントはより広範囲で戦略的に焦点を絞った推論を提供することができる。これにより、エージェントが複雑なタスクを達成するのに役立つ、より効率的なアクションがもたらされる。実験の結果,PreActは複雑なタスクの完了時にReActメソッドを超越し,他のメモリや選択戦略と組み合わせることで,PreActのパフォーマンスをさらに向上できることがわかった。我々は,このモデルを様々な歴史的予測とともに提示し,これらの予測がLLM計画を継続的に強化することを発見し,PreActとReActの単一ステップ推論における差異は,PreActがReActよりも多様性と戦略指向の面で真に有益であることを示唆している。

関連論文リスト

Working My Way Back to You: Resource-Centric Next-Activity Prediction [0.3441021278275805]
4つの実生活データセットにまたがる4つの予測モデルと3つの符号化戦略を評価する。その結果、LightGBM と Transformer のモデルでは、2-gram のアクティビティ・トランジションに基づく符号化が最適であることがわかった。このリソース中心のアプローチは、よりスマートなリソース割り当て、戦略的労働計画、パーソナライズされた従業員サポートを可能にする。
論文参考訳（メタデータ） (2025-08-26T13:27:09Z)
Beyond Naïve Prompting: Strategies for Improved Zero-shot Context-aided Forecasting with LLMs [57.82819770709032]
大規模言語モデル (LLM) は、na "ive direct prompting" を通じて効果的な文脈支援予測を行うことができる。 ReDPは、明確な推論トレースを抽出することで、解釈可能性を改善し、コンテキスト上でモデルの推論を評価することができる。 CorDPはLLMを活用して、既存の予測をコンテキストで洗練し、現実の予測パイプラインにおける適用性を高める。 IC-DPは、文脈支援予測タスクの歴史的例を即時に組み込むことを提案し、大規模モデルにおいても精度を大幅に向上させる。
論文参考訳（メタデータ） (2025-08-13T16:02:55Z)
PGPO: Enhancing Agent Reasoning via Pseudocode-style Planning Guided Preference Optimization [58.465778756331574]
本稿では,効果的なエージェント学習のためのPGPOと呼ばれる疑似コード型計画優先最適化手法を提案する。 2つの計画指向の報酬により、PGPOは、高品質なPコードプランを生成するLLMエージェントの能力をさらに強化する。実験により、PGPOは代表エージェントベンチマークよりも優れた性能を示し、現在のリードベースラインより優れていることが示された。
論文参考訳（メタデータ） (2025-06-02T09:35:07Z)
Agentic Predictor: Performance Prediction for Agentic Workflows via Multi-View Encoding [56.565200973244146]
Agentic Predictorは、効率的なエージェントワークフロー評価のための軽量な予測器である。 Agentic Predictorはタスク成功率の近似を学ぶことで、最適なエージェントワークフロー構成の迅速かつ正確な選択を可能にする。
論文参考訳（メタデータ） (2025-05-26T09:46:50Z)
Latent Diffusion Planning for Imitation Learning [78.56207566743154]
Latent Diffusion Planning (LDP) は、プランナーと逆ダイナミクスモデルからなるモジュラーアプローチである。行動予測からプランニングを分離することにより、LDPは最適なデータと行動自由データのより密集した監視信号の恩恵を受けることができる。シミュレーションされた視覚ロボット操作タスクにおいて、LDPは最先端の模倣学習アプローチより優れている。
論文参考訳（メタデータ） (2025-04-23T17:53:34Z)
Interpreting Emergent Planning in Model-Free Reinforcement Learning [13.820891288919002]
モデルフリー強化学習エージェントが計画を学ぶことができるという最初の証拠を提示する。これは、ソコバンのモデルフリーエージェントに概念ベースの解釈可能性に基づく方法論を適用することで達成される。
論文参考訳（メタデータ） (2025-04-02T16:24:23Z)
Microfoundation Inference for Strategic Prediction [26.277259491014163]
本稿では,人口に対する予測モデルの長期的影響をカプセル化した分布図の学習手法を提案する。具体的には,エージェントの応答をコストユーティリティ問題としてモデル化し,そのコストを見積もる。本稿では,この推定値の収束率と,クレジット・スコアリング・データセットの実証実験による品質評価について述べる。
論文参考訳（メタデータ） (2024-11-13T19:37:49Z)
From Novice to Expert: LLM Agent Policy Optimization via Step-wise Reinforcement Learning [62.54484062185869]
本稿では,エージェントの強化学習プロセスの最適化にステップワイド報酬を利用するStepAgentを紹介する。エージェント反射とポリシー調整を容易にする暗黙の逆・逆の強化学習手法を提案する。
論文参考訳（メタデータ） (2024-11-06T10:35:11Z)
Predicting Future Actions of Reinforcement Learning Agents [27.6973598477153]
本稿では,3種類の強化学習エージェントの今後の行動と事象予測の有効性を実験的に評価し,比較した。エージェントの内部計算に基づいて予測を行う内部状態アプローチと、学習された世界モデルでエージェントをアンロールするシミュレーションベースのアプローチの2つのアプローチを採用する。内部計画を使用することで、アクションを予測する場合のシミュレーションベースのアプローチと比較して、モデル品質がより堅牢であること、イベント予測の結果がより混在していることが証明される。
論文参考訳（メタデータ） (2024-10-29T18:48:18Z)
CoPS: Empowering LLM Agents with Provable Cross-Task Experience Sharing [70.25689961697523]
クロスタスク体験の共有と選択によるシーケンシャル推論を強化する一般化可能なアルゴリズムを提案する。我々の研究は、既存のシーケンシャルな推論パラダイムのギャップを埋め、タスク間体験の活用の有効性を検証する。
論文参考訳（メタデータ） (2024-10-22T03:59:53Z)
Performative Prediction on Games and Mechanism Design [69.7933059664256]
エージェントが過去の正確性に基づいて予測を信頼するかを判断する集団リスクジレンマについて検討する。予測が集合的な結果を形成するにつれて、社会福祉は関心の指標として自然に現れる。よりよいトレードオフを実現し、それらをメカニズム設計に使用する方法を示します。
論文参考訳（メタデータ） (2024-08-09T16:03:44Z)
From Recognition to Prediction: Leveraging Sequence Reasoning for Action Anticipation [30.161471749050833]
本稿では,ARR(Accence and Reasoning, 認識・推論)と呼ばれる注意機構を利用した新しいエンドツーエンドビデオモデリングアーキテクチャを提案する。 ARRは行動予測タスクを行動認識と推論タスクに分解し、次の行動予測(NAP)によって行動間の統計的関係を効果的に学習する。さらに、広範囲なトレーニングデータを必要とする関係モデリングの課題に対処するために、デコーダの教師なし事前学習のための革新的なアプローチを提案する。
論文参考訳（メタデータ） (2024-08-05T18:38:29Z)
CAMMARL: Conformal Action Modeling in Multi Agent Reinforcement Learning [5.865719902445064]
本稿では,新しいマルチエージェント強化学習アルゴリズムCAMMARLを提案する。それは、異なる状況における他のエージェントのアクションを、自信集合の形でモデル化することを含む。本稿では,CAMMARLが共形予測セットをモデル化することにより,MARLにおける自律エージェントの能力を高めることを示す。
論文参考訳（メタデータ） (2023-06-19T19:03:53Z)
NashFormer: Leveraging Local Nash Equilibria for Semantically Diverse Trajectory Prediction [11.319057000888638]
NashFormerは、ゲーム理論の逆強化学習を活用してマルチモーダル予測のカバレッジを改善する、軌道予測のためのフレームワークである。実験の結果,予測器はベースラインモデルよりも33%以上の潜在的な相互作用をカバーし,正確な予測を行うことがわかった。
論文参考訳（メタデータ） (2023-05-28T00:41:29Z)
Prediction-Oriented Bayesian Active Learning [51.426960808684655]
予測情報ゲイン(EPIG)は、パラメータではなく予測空間における情報ゲインを測定する。 EPIGは、さまざまなデータセットやモデルにわたるBALDと比較して、予測パフォーマンスが向上する。
論文参考訳（メタデータ） (2023-04-17T10:59:57Z)
Can ChatGPT Forecast Stock Price Movements? Return Predictability and Large Language Models [51.3422222472898]
ニュース見出しを用いて,ChatGPTのような大規模言語モデル(LLM)の株価変動を予測する能力について述べる。我々は,情報容量制約,過小反応,制限対アビタージュ,LLMを組み込んだ理論モデルを構築した。
論文参考訳（メタデータ） (2023-04-15T19:22:37Z)
What Should I Know? Using Meta-gradient Descent for Predictive Feature Discovery in a Single Stream of Experience [63.75363908696257]
計算強化学習は、未来の感覚の予測を通じて、エージェントの世界の知覚を構築しようとする。この一連の作業において、オープンな課題は、エージェントがどの予測が意思決定を最も支援できるかを、無限に多くの予測から決定することである。本稿では,エージェントが何を予測するかを学習するメタ段階的な降下過程,(2)選択した予測の見積もり,3)将来の報酬を最大化するポリシーを生成する方法を紹介する。
論文参考訳（メタデータ） (2022-06-13T21:31:06Z)
A Word is Worth A Thousand Dollars: Adversarial Attack on Tweets Fools Stock Prediction [100.9772316028191]
本稿では,3つのストック予測犠牲者モデルを騙すために,様々な攻撃構成を試行する。以上の結果から,提案手法が一貫した成功率を達成し,取引シミュレーションにおいて大きな損失をもたらす可能性が示唆された。
論文参考訳（メタデータ） (2022-05-01T05:12:22Z)
Finding Useful Predictions by Meta-gradient Descent to Improve Decision-making [1.384055225262046]
我々は、一般値関数として表現される予測に焦点をあてる: 将来的な信号の蓄積の時間的拡張推定。ひとつの課題は、エージェントが意思決定をサポートする可能性のある予測を、無限に多くの予測から決定することである。これらの予測を手動で指定するのではなく、学習することにより、エージェントは自己管理的な方法で有用な予測を特定できる。
論文参考訳（メタデータ） (2021-11-18T20:17:07Z)
The Importance of Prior Knowledge in Precise Multimodal Prediction [71.74884391209955]
道路にはよく定義された地形、地形、交通規則がある。本稿では,構造的事前を損失関数として組み込むことを提案する。実世界の自動運転データセットにおけるアプローチの有効性を実証する。
論文参考訳（メタデータ） (2020-06-04T03:56:11Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。