論文の概要: The Real Barrier to LLM Agent Usability is Agentic ROI
- arxiv url: http://arxiv.org/abs/2505.17767v1
- Date: Fri, 23 May 2025 11:40:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-26 18:08:34.03316
- Title: The Real Barrier to LLM Agent Usability is Agentic ROI
- Title(参考訳): LLMエージェント使用性に対する真の障壁はエージェントROIである
- Authors: Weiwen Liu, Jiarui Qin, Xu Huang, Xingshan Zeng, Yunjia Xi, Jianghao Lin, Chuhan Wu, Yasheng Wang, Lifeng Shang, Ruiming Tang, Defu Lian, Yong Yu, Weinan Zhang,
- Abstract要約: 大規模言語モデル(LLM)エージェントは、人間とAIの相互作用において有望な変化を示す。
我々は、需要の高いマスマーケットアプリケーションにおいて、重要なユーザビリティギャップを強調します。
- 参考スコア(独自算出の注目度): 110.31127571114635
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Large Language Model (LLM) agents represent a promising shift in human-AI interaction, moving beyond passive prompt-response systems to autonomous agents capable of reasoning, planning, and goal-directed action. Despite the widespread application in specialized, high-effort tasks like coding and scientific research, we highlight a critical usability gap in high-demand, mass-market applications. This position paper argues that the limited real-world adoption of LLM agents stems not only from gaps in model capabilities, but also from a fundamental tradeoff between the value an agent can provide and the costs incurred during real-world use. Hence, we call for a shift from solely optimizing model performance to a broader, utility-driven perspective: evaluating agents through the lens of the overall agentic return on investment (Agent ROI). By identifying key factors that determine Agentic ROI--information quality, agent time, and cost--we posit a zigzag development trajectory in optimizing agentic ROI: first scaling up to improve the information quality, then scaling down to minimize the time and cost. We outline the roadmap across different development stages to bridge the current usability gaps, aiming to make LLM agents truly scalable, accessible, and effective in real-world contexts.
- Abstract(参考訳): 大規模言語モデル(LLM)エージェントは、受動的応答システムを越えて、推論、計画、目標指向アクションが可能な自律エージェントへと、人間のAIインタラクションの有望なシフトを表す。
コーディングや科学研究のような専門的かつ高度なタスクに広く応用されているにもかかわらず、私たちは、需要の高いマスマーケットアプリケーションにおいて、重要なユーザビリティのギャップを強調します。
本論文は, LLMエージェントの限られた実世界の採用は, モデル能力のギャップだけでなく, エージェントが提供できる価値と実世界の利用におけるコストとの根本的なトレードオフにも起因している,と論じる。
したがって、モデルパフォーマンスを単に最適化することから、より広範でユーティリティ駆動的な視点へ移行すること、すなわち、エージェントが投資に対する全体的なエージェントリターン(Agent ROI)のレンズを通してエージェントを評価することを求める(Agent ROI)。
エージェントROI-情報品質、エージェント時間、コストを決定する重要な要因を特定することで、エージェントROIを最適化するためのジグザグ開発軌跡を定めます。
LLMエージェントを真にスケーラブルで、アクセス可能で、現実のコンテキストで有効にすることを目的として、現在のユーザビリティギャップを埋めるために、さまざまな開発ステージにわたるロードマップを概説する。
関連論文リスト
- The Influence of Human-inspired Agentic Sophistication in LLM-driven Strategic Reasoners [3.5083201638203154]
人工推論器の性能形成におけるエージェント的高度化の役割を評価する。
我々は3つのエージェント設計をベンチマークした: 単純なゲーム理論モデル、構造化されていないLLM-as-agentモデル、従来のエージェントフレームワークに統合されたLLM。
我々の分析は、25のエージェント構成にまたがる2000以上の推論サンプルを網羅し、人間にインスパイアされた認知構造が、LLMエージェントと人間の戦略的行動との整合性を高めることを示唆している。
論文 参考訳(メタデータ) (2025-05-14T13:51:24Z) - Towards more Contextual Agents: An extractor-Generator Optimization Framework [0.0]
LLM(Large Language Model)ベースのエージェントは、幅広い汎用アプリケーションにわたる複雑なタスクの解決に顕著な成功を収めている。
しかしながら、それらのパフォーマンスは、専門産業や研究領域のようなコンテキスト固有のシナリオで劣化することが多い。
この課題に対処するため,本研究では,LLMエージェントの文脈適応性を高めるための体系的アプローチを提案する。
論文 参考訳(メタデータ) (2025-02-18T15:07:06Z) - Scaling Autonomous Agents via Automatic Reward Modeling And Planning [52.39395405893965]
大規模言語モデル(LLM)は、様々なタスクにまたがる顕著な機能を示している。
しかし、彼らは多段階の意思決定と環境フィードバックを必要とする問題に苦戦している。
人間のアノテーションを使わずに環境から報酬モデルを自動的に学習できるフレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-17T18:49:25Z) - Gödel Agent: A Self-Referential Agent Framework for Recursive Self-Improvement [117.94654815220404]
G"odel AgentはG"odelマシンにインスパイアされた自己進化型フレームワークである。
G"odel Agentは、パフォーマンス、効率、一般化性において手作業によるエージェントを上回る、継続的な自己改善を実現することができる。
論文 参考訳(メタデータ) (2024-10-06T10:49:40Z) - QuantAgent: Seeking Holy Grail in Trading by Self-Improving Large
Language Model [14.800710112671226]
本稿では,ドメイン固有の知識基盤を効率的に構築し,統合する上での課題に対処する,原則的枠組みを提案する。
内側のループでは、エージェントは知識ベースから引き出すことで応答を洗練し、外側のループでは、これらの応答は現実世界のシナリオでテストされる。
我々はこのフレームワークを、QuantAgentという名のトレーディングシグナルをマイニングするための自律エージェントを通じてインスタンス化する。
論文 参考訳(メタデータ) (2024-02-06T06:47:14Z) - AgentBoard: An Analytical Evaluation Board of Multi-turn LLM Agents [74.16170899755281]
本稿では,LLMエージェントの分析的評価に適したオープンソース評価フレームワークであるAgentBoardを紹介する。
AgentBoardは、インクリメンタルな進歩と包括的な評価ツールキットをキャプチャする、きめ細かい進捗率のメトリクスを提供する。
これはLLMエージェントの能力と限界に光を当てるだけでなく、その性能の解釈可能性も最前線に広める。
論文 参考訳(メタデータ) (2024-01-24T01:51:00Z) - FinMem: A Performance-Enhanced LLM Trading Agent with Layered Memory and
Character Design [11.913409501633616]
textscFinMemは、金融上の意思決定のために考案された新しいLLMベースのエージェントフレームワークである。
textscFinMemのメモリモジュールは、人間のトレーダーの認知構造と密接に一致し、堅牢な解釈性を提供する。
このフレームワークは、エージェントが専門知識を自己開発し、新しい投資方法にアジャイルに反応し、取引決定を継続的に洗練することを可能にする。
論文 参考訳(メタデータ) (2023-11-23T00:24:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。