論文の概要: Small Language Models are the Future of Agentic AI
- arxiv url: http://arxiv.org/abs/2506.02153v1
- Date: Mon, 02 Jun 2025 18:35:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:34.971091
- Title: Small Language Models are the Future of Agentic AI
- Title(参考訳): エージェントAIの未来は小さな言語モデル
- Authors: Peter Belcak, Greg Heinrich, Shizhe Diao, Yonggan Fu, Xin Dong, Saurav Muralidharan, Yingyan Celine Lin, Pavlo Molchanov,
- Abstract要約: スモールランゲージモデル(SLM)は十分に強力であり、本質的にはより適しており、エージェントシステムにおける多くの呼び出しに対して経済的である。
本稿では,エージェントシステムにおけるSLM導入の潜在的な障壁について論じ,汎用LLM-to-SLMエージェント変換アルゴリズムの概要を述べる。
- 参考スコア(独自算出の注目度): 24.712103135486984
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) are often praised for exhibiting near-human performance on a wide range of tasks and valued for their ability to hold a general conversation. The rise of agentic AI systems is, however, ushering in a mass of applications in which language models perform a small number of specialized tasks repetitively and with little variation. Here we lay out the position that small language models (SLMs) are sufficiently powerful, inherently more suitable, and necessarily more economical for many invocations in agentic systems, and are therefore the future of agentic AI. Our argumentation is grounded in the current level of capabilities exhibited by SLMs, the common architectures of agentic systems, and the economy of LM deployment. We further argue that in situations where general-purpose conversational abilities are essential, heterogeneous agentic systems (i.e., agents invoking multiple different models) are the natural choice. We discuss the potential barriers for the adoption of SLMs in agentic systems and outline a general LLM-to-SLM agent conversion algorithm. Our position, formulated as a value statement, highlights the significance of the operational and economic impact even a partial shift from LLMs to SLMs is to have on the AI agent industry. We aim to stimulate the discussion on the effective use of AI resources and hope to advance the efforts to lower the costs of AI of the present day. Calling for both contributions to and critique of our position, we commit to publishing all such correspondence at https://research.nvidia.com/labs/lpr/slm-agents.
- Abstract(参考訳): 大規模言語モデル(LLM)は、広範囲のタスクでほぼ人間に近いパフォーマンスを示し、一般的な会話を行う能力で評価されることが多い。
しかしながら、エージェントAIシステムの台頭は、言語モデルが少数の特殊タスクを反復的に実行し、変化をほとんど起こさないような、多数の応用を支えている。
ここでは、小言語モデル(SLM)が十分に強力であり、本質的にはより適しており、エージェントシステムにおける多くの呼び出しに必要以上に経済的であり、したがってエージェントAIの未来である、という立場を定めている。
我々の議論は、SLMが示す現在の能力レベル、エージェントシステムの共通アーキテクチャ、LMデプロイメントの経済に基礎を置いている。
さらに、汎用的な会話能力が不可欠である状況では、異種エージェントシステム(例えば、複数の異なるモデルを呼び出すエージェント)が自然な選択であると主張する。
本稿では,エージェントシステムにおけるSLM導入の潜在的な障壁について論じ,汎用LLM-to-SLMエージェント変換アルゴリズムの概要を述べる。
我々の立場は、価値ステートメントとして定式化され、LLMからSLMへの部分的なシフトでさえ、運用および経済的な影響がAIエージェント産業にもたらす重要性を強調します。
我々は、AIリソースの有効利用に関する議論を刺激し、現在のAIコストを下げるための努力を進めたいと考えている。
私たちの立場に対するコントリビューションと批判の両方を呼びかけ、このような対応はすべてhttps://research.nvidia.com/labs/lpr/slm-agents.comで公開します。
関連論文リスト
- Agentic AI and Multiagentic: Are We Reinventing the Wheel? [0.0]
AI Agenticという言葉は、基本的にAIエージェントのバズワードとしてよく使われ、AI Multiagenticはマルチエージェントシステムのバズワードとして使われる。
この混乱は、自律エージェントとマルチエージェントシステムの分野における数十年の研究を見落としている。
この論文は、科学と技術に関する厳密さと、AIにおける最先端技術から確立された用語の使用を提唱している。
論文 参考訳(メタデータ) (2025-06-02T09:19:11Z) - WorkArena++: Towards Compositional Planning and Reasoning-based Common Knowledge Work Tasks [85.95607119635102]
大型言語モデル(LLM)は人間のような知性を模倣することができる。
WorkArena++は、Webエージェントの計画、問題解決、論理的/論理的推論、検索、コンテキスト的理解能力を評価するように設計されている。
論文 参考訳(メタデータ) (2024-07-07T07:15:49Z) - Position Paper: Agent AI Towards a Holistic Intelligence [53.35971598180146]
エージェントAI - 大きな基盤モデルをエージェントアクションに統合する具体的システム。
本稿では,エージェント・ファウンデーション・モデル(エージェント・ファウンデーション・モデル)を提案する。
論文 参考訳(メタデータ) (2024-02-28T16:09:56Z) - Exploring Large Language Model based Intelligent Agents: Definitions,
Methods, and Prospects [32.91556128291915]
本稿では, シングルエージェントおよびマルチエージェントシステムにおける知的エージェントの詳細な概要を提供するため, 現在の研究状況について調査する。
定義、研究フレームワーク、その構成、認知と計画方法、ツール利用、環境フィードバックに対する反応などの基礎的な構成要素を網羅する。
我々は、AIと自然言語処理の進化の展望を考慮し、LLMベースのエージェントの展望を思い浮かべて結論付ける。
論文 参考訳(メタデータ) (2024-01-07T09:08:24Z) - The Rise and Potential of Large Language Model Based Agents: A Survey [91.71061158000953]
大規模言語モデル(LLM)は、人工知能(AGI)の潜在的な火花と見なされる
まず、エージェントの概念を哲学的起源からAI開発まで追跡し、LLMがエージェントに適した基盤である理由を説明します。
単一エージェントシナリオ,マルチエージェントシナリオ,ヒューマンエージェント協調の3つの側面において,LLMベースのエージェントの広範な応用について検討する。
論文 参考訳(メタデータ) (2023-09-14T17:12:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。