論文の概要: Rethinking Scale: Deployment Trade-offs of Small Language Models under Agent Paradigms
- arxiv url: http://arxiv.org/abs/2604.19299v1
- Date: Tue, 21 Apr 2026 10:05:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.715677
- Title: Rethinking Scale: Deployment Trade-offs of Small Language Models under Agent Paradigms
- Title(参考訳): Rethinking Scale: エージェントパラダイムの下での小さな言語モデルの展開トレードオフ
- Authors: Xinlin Wang, Mats Brorsson,
- Abstract要約: パラメータが100億未満の小さな言語モデル(SLM)には、有望な選択肢がある。
既存の研究は主に、法律のスケーリングや微調整によるSLMの強化に重点を置いている。
本稿では,3つのパラダイムの下で10Bのオープンソースモデルを大規模かつ包括的に研究する。
- 参考スコア(独自算出の注目度): 2.8207195763355712
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite the impressive capabilities of large language models, their substantial computational costs, latency, and privacy risks hinder their widespread deployment in real-world applications. Small Language Models (SLMs) with fewer than 10 billion parameters present a promising alternative; however, their inherent limitations in knowledge and reasoning curtail their effectiveness. Existing research primarily focuses on enhancing SLMs through scaling laws or fine-tuning strategies while overlooking the potential of using agent paradigms, such as tool use and multi-agent collaboration, to systematically compensate for the inherent weaknesses of small models. To address this gap, this paper presents the first large-scale, comprehensive study of <10B open-source models under three paradigms: (1) the base model, (2) a single agent equipped with tools, and (3) a multi-agent system with collaborative capabilities. Our results show that single-agent systems achieve the best balance between performance and cost, while multi-agent setups add overhead with limited gains. Our findings highlight the importance of agent-centric design for efficient and trustworthy deployment in resource-constrained settings.
- Abstract(参考訳): 大きな言語モデルの印象的な機能にもかかわらず、その計算コスト、レイテンシ、プライバシのリスクは、現実世界のアプリケーションに広くデプロイすることを妨げる。
100億未満のパラメータを持つ小言語モデル(SLM)は有望な選択肢である。
既存の研究は主に、小型モデルの固有の弱点を体系的に補うために、ツールの使用やマルチエージェントコラボレーションのようなエージェントパラダイムを使用する可能性を見越しながら、法律のスケーリングや微調整戦略を通じてSLMを強化することに焦点を当てている。
そこで本研究では,(1)ベースモデル,(2)ツールを備えた単一エージェント,(3)協調機能を備えたマルチエージェントシステム,という3つのパラダイムの下で,<10B>オープンソースモデルの大規模かつ包括的研究を行った。
その結果,シングルエージェントシステムは性能とコストのバランスが良く,マルチエージェントのセットアップではオーバヘッドが増大し,ゲインが制限されることがわかった。
本研究は,資源制約のある環境において,効率的かつ信頼性の高い配置を実現するためのエージェント中心設計の重要性を強調した。
関連論文リスト
- Agent Skill Framework: Perspectives on the Potential of Small Language Models in Industrial Environments [14.079091139464175]
この研究は、エージェントスキルプロセスの形式的な数学的定義を導入し、その後、様々な大きさの言語モデルの体系的な評価を行った。
その結果、小型モデルは信頼性の高いスキル選択に苦しむ一方で、中程度のサイズのSLM(約12B~30B)はエージェントスキルアプローチから大きく恩恵を受けることがわかった。
論文 参考訳(メタデータ) (2026-02-18T17:52:17Z) - AgentArk: Distilling Multi-Agent Intelligence into a Single LLM Agent [57.10083973844841]
AgentArkは、マルチエージェントダイナミクスを単一のモデルの重みに蒸留する新しいフレームワークである。
各種モデル,タスク,スケーリング,シナリオの3つの階層的蒸留戦略について検討する。
シミュレーションからトレーニングへ計算の負担をシフトさせることで、蒸留されたモデルは、複数のエージェントの強い推論と自己補正性能を示しながら、一つのエージェントの効率を保ちます。
論文 参考訳(メタデータ) (2026-02-03T19:18:28Z) - Youtu-LLM: Unlocking the Native Agentic Potential for Lightweight Large Language Models [78.73992315826035]
ネイティブエージェントインテリジェンスと高い計算効率を調和させる軽量言語モデルであるYoutu-LLMを紹介する。
Youtu-LLMは、スクラッチから体系的に推論と計画能力の育成まで事前訓練されている。
論文 参考訳(メタデータ) (2025-12-31T04:25:11Z) - KCM: KAN-Based Collaboration Models Enhance Pretrained Large Models [62.658961779827145]
大規模モデルコラボレーションにおける改良手法として,Kan-based Collaborative Model (KCM)を提案する。
Kanは、破滅的な忘れを緩和しながら、優れた視認性と解釈性を提供する。
論文 参考訳(メタデータ) (2025-10-23T07:06:21Z) - Uncertainty-Aware Collaborative System of Large and Small Models for Multimodal Sentiment Analysis [17.98292973608615]
マルチモーダル感情分析のための強力なMLLMと軽量なベースラインモデルを編成する新しい不確実性認識協調システム(U-ACS)を提案する。
提案手法は,スタンドアロンのMLLMに比べて計算資源のごく一部しか必要とせず,最先端の性能を実現する。
論文 参考訳(メタデータ) (2025-08-27T16:01:58Z) - Efficient LLM Collaboration via Planning [56.081879390960204]
小規模で大規模なモデルでは、プランナーと実行担当者として交代で行動し、タスクを協調的に解決するために、多段階のカスケードでプランを交換する。
私たちはCOPEが大規模プロプライエタリモデルに匹敵するパフォーマンスを実現し,推論APIのコストを大幅に削減できることを実証した。
論文 参考訳(メタデータ) (2025-06-13T08:35:50Z) - Large Language Models for Multi-Facility Location Mechanism Design [16.88708405619343]
深層学習モデルは、マルチファシリティロケーションのための戦略防御メカニズムの代替として提案されている。
LLMMechと呼ばれる新しいアプローチを導入し、大きな言語モデルを進化のフレームワークに組み込むことにより、これらの制限に対処する。
実験の結果, LLM生成機構は, 既存の手作りベースラインやディープラーニングモデルよりも優れていることがわかった。
論文 参考訳(メタデータ) (2025-03-12T16:49:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。