論文の概要: From Language to Action: A Review of Large Language Models as Autonomous Agents and Tool Users
- arxiv url: http://arxiv.org/abs/2508.17281v1
- Date: Sun, 24 Aug 2025 10:02:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-26 18:43:45.443935
- Title: From Language to Action: A Review of Large Language Models as Autonomous Agents and Tool Users
- Title(参考訳): 言語から行動へ: 自律エージェントとツールユーザとしての大規模言語モデルのレビュー
- Authors: Sadia Sultana Chowa, Riasad Alvi, Subhey Sadi Rahman, Md Abdur Rahman, Mohaimenul Azam Khan Raiaan, Md Rafiqul Islam, Mukhtar Hussain, Sami Azam,
- Abstract要約: 本稿では,大規模言語モデルを用いた自律型エージェントとツールユーザの開発状況について概説する。
LLMエージェントのアーキテクチャ設計原則を構造化分析し,アプリケーションを単一エージェントおよびマルチエージェントシステムに分割する。
我々はLSMの検証可能な推論、自己改善能力、LSMをベースとしたエージェントのパーソナライズに関する批判的な知見を同定した。
- 参考スコア(独自算出の注目度): 2.8141950037574666
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The pursuit of human-level artificial intelligence (AI) has significantly advanced the development of autonomous agents and Large Language Models (LLMs). LLMs are now widely utilized as decision-making agents for their ability to interpret instructions, manage sequential tasks, and adapt through feedback. This review examines recent developments in employing LLMs as autonomous agents and tool users and comprises seven research questions. We only used the papers published between 2023 and 2025 in conferences of the A* and A rank and Q1 journals. A structured analysis of the LLM agents' architectural design principles, dividing their applications into single-agent and multi-agent systems, and strategies for integrating external tools is presented. In addition, the cognitive mechanisms of LLM, including reasoning, planning, and memory, and the impact of prompting methods and fine-tuning procedures on agent performance are also investigated. Furthermore, we evaluated current benchmarks and assessment protocols and have provided an analysis of 68 publicly available datasets to assess the performance of LLM-based agents in various tasks. In conducting this review, we have identified critical findings on verifiable reasoning of LLMs, the capacity for self-improvement, and the personalization of LLM-based agents. Finally, we have discussed ten future research directions to overcome these gaps.
- Abstract(参考訳): 人間レベルの人工知能(AI)の追求は、自律エージェントやLLM(Large Language Models)の開発を大きく進めている。
LLMは、指示を解釈し、シーケンシャルなタスクを管理し、フィードバックを通じて適応する能力のために、意思決定エージェントとして広く利用されている。
本稿では,LSMを自律型エージェントおよびツールユーザとして活用する最近の進展について検討し,7つの研究課題について述べる。
2023年から2025年にかけて発行された論文は、A*とAランクおよびQ1ジャーナルの会議でのみ使用しました。
LLMエージェントのアーキテクチャ設計原則を構造化分析し,アプリケーションを単一エージェントおよびマルチエージェントシステムに分割し,外部ツールの統合戦略を示す。
また, LLMの認知機構, 推論, 計画, 記憶などについて検討し, エージェント性能に及ぼすプロンプト法および微調整法の影響について検討した。
さらに,現在のベンチマークと評価プロトコルを評価し,様々なタスクにおけるLLMエージェントの性能を評価するために,68個の公開データセットの解析を行った。
本総説では,LSMの検証可能な推論,自己改善能力,LSMをベースとしたエージェントのパーソナライズに関する重要な知見を明らかにした。
最後に、これらのギャップを克服するための10の今後の研究方向性について論じる。
関連論文リスト
- IDA-Bench: Evaluating LLMs on Interactive Guided Data Analysis [60.32962597618861]
IDA-Benchは、多ラウンドの対話シナリオで大規模言語モデルを評価する新しいベンチマークである。
エージェント性能は、最終的な数値出力と人間由来のベースラインを比較して判断する。
最先端のコーディングエージェント(Claude-3.7-thinkingなど)でさえ50%のタスクを成功させ、シングルターンテストでは明らかでない制限を強調している。
論文 参考訳(メタデータ) (2025-05-23T09:37:52Z) - Agent-Enhanced Large Language Models for Researching Political Institutions [0.0]
本稿では,タスクを合理化できる動的エージェントとして,Large Language Models (LLM) がどのように機能するかを示す。
エージェント検索増強世代(Agentic RAG)が中心である。
このアプローチの可能性を実証するために、米国議会の研究者を支援するために設計されたLLMエージェントであるコングレスラを紹介する。
論文 参考訳(メタデータ) (2025-03-14T22:04:40Z) - Exploring Large Language Model based Intelligent Agents: Definitions,
Methods, and Prospects [32.91556128291915]
本稿では, シングルエージェントおよびマルチエージェントシステムにおける知的エージェントの詳細な概要を提供するため, 現在の研究状況について調査する。
定義、研究フレームワーク、その構成、認知と計画方法、ツール利用、環境フィードバックに対する反応などの基礎的な構成要素を網羅する。
我々は、AIと自然言語処理の進化の展望を考慮し、LLMベースのエージェントの展望を思い浮かべて結論付ける。
論文 参考訳(メタデータ) (2024-01-07T09:08:24Z) - A Survey on Large Language Model based Autonomous Agents [105.2509166861984]
大規模言語モデル(LLM)は、人間レベルの知性を達成する上で、顕著な可能性を示している。
本稿では,LLMに基づく自律エージェントの分野を総合的な観点から体系的に検討する。
本稿では、社会科学、自然科学、工学の分野におけるLLMベースの自律エージェントの多様な応用について概観する。
論文 参考訳(メタデータ) (2023-08-22T13:30:37Z) - TPTU: Large Language Model-based AI Agents for Task Planning and Tool
Usage [28.554981886052953]
大規模言語モデル(LLM)は、様々な現実世界のアプリケーションのための強力なツールとして登場した。
LLMの本質的な生成能力は、その長所にもかかわらず、複雑なタスクを扱うには不十分である。
本稿では,LLMベースのAIエージェントに適した構造化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-07T09:22:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。