論文の概要: Validity Is What You Need
- arxiv url: http://arxiv.org/abs/2510.27628v1
- Date: Fri, 31 Oct 2025 17:00:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-03 17:52:16.171465
- Title: Validity Is What You Need
- Title(参考訳): 必要な物は正当性だ
- Authors: Sebastian Benthall, Andrew Clark,
- Abstract要約: 我々はエージェントAIの他の定義を検討し、新しい現実主義的定義を提案する。
しかし、エージェントAIシステムは基盤ではなく、主にアプリケーションである点に留意する。
- 参考スコア(独自算出の注目度): 3.0111718611142684
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While AI agents have long been discussed and studied in computer science, today's Agentic AI systems are something new. We consider other definitions of Agentic AI and propose a new realist definition. Agentic AI is a software delivery mechanism, comparable to software as a service (SaaS), which puts an application to work autonomously in a complex enterprise setting. Recent advances in large language models (LLMs) as foundation models have driven excitement in Agentic AI. We note, however, that Agentic AI systems are primarily applications, not foundations, and so their success depends on validation by end users and principal stakeholders. The tools and techniques needed by the principal users to validate their applications are quite different from the tools and techniques used to evaluate foundation models. Ironically, with good validation measures in place, in many cases the foundation models can be replaced with much simpler, faster, and more interpretable models that handle core logic. When it comes to Agentic AI, validity is what you need. LLMs are one option that might achieve it.
- Abstract(参考訳): AIエージェントは長い間コンピュータ科学で議論され研究されてきたが、今日のエージェントAIシステムは何か新しいものだ。
我々はエージェントAIの他の定義を検討し、新しい現実主義的定義を提案する。
Agentic AIは、ソフトウェア・アズ・ア・サービス(SaaS)に匹敵するソフトウェアデリバリメカニズムである。
基礎モデルとしての大規模言語モデル(LLM)の最近の進歩は、エージェントAIに興奮をもたらした。
しかし、エージェントAIシステムは基本的に基礎ではなくアプリケーションであり、その成功はエンドユーザーや主要ステークホルダーによる検証に依存する。
アプリケーションを検証するのにプリンシパルユーザに必要なツールやテクニックは、基礎モデルを評価するのに使用されるツールやテクニックとは大きく異なります。
皮肉なことに、優れた検証方法があれば、多くの場合、ファンデーションモデルは、コアロジックを扱うよりシンプルで、より高速で、より解釈可能なモデルに置き換えられることができます。
Agentic AIに関しては、有効性が必要なのです。
LLMはそれを実現するための選択肢のひとつです。
関連論文リスト
- SFR-DeepResearch: Towards Effective Reinforcement Learning for Autonomously Reasoning Single Agents [93.26456498576181]
本稿では,ディープリサーチのためのネイティブ自律単エージェントモデルの開発に焦点をあてる。
我々の最良の変種であるSFR-DR-20Bは、HumanityのLast Examベンチマークで28.7%に達する。
論文 参考訳(メタデータ) (2025-09-08T02:07:09Z) - Small Language Models are the Future of Agentic AI [42.62162575221445]
スモールランゲージモデル(SLM)は十分に強力であり、本質的にはより適しており、エージェントシステムにおける多くの呼び出しに対して経済的である。
本稿では,エージェントシステムにおけるSLM導入の潜在的な障壁について論じ,汎用LLM-to-SLMエージェント変換アルゴリズムの概要を述べる。
論文 参考訳(メタデータ) (2025-06-02T18:35:16Z) - Agentic AI and Multiagentic: Are We Reinventing the Wheel? [0.0]
AI Agenticという言葉は、基本的にAIエージェントのバズワードとしてよく使われ、AI Multiagenticはマルチエージェントシステムのバズワードとして使われる。
この混乱は、自律エージェントとマルチエージェントシステムの分野における数十年の研究を見落としている。
この論文は、科学と技術に関する厳密さと、AIにおける最先端技術から確立された用語の使用を提唱している。
論文 参考訳(メタデータ) (2025-06-02T09:19:11Z) - CACA Agent: Capability Collaboration based AI Agent [18.84686313298908]
本稿ではCACAエージェント(Capability Collaboration based AI Agent)を提案する。
CACA Agentは、単一のLLMへの依存を減らすだけでなく、AI Agentを実装するための一連のコラボレーティブ機能を統合する。
本稿ではCACAエージェントの動作とアプリケーションシナリオの拡張について説明する。
論文 参考訳(メタデータ) (2024-03-22T11:42:47Z) - Pangu-Agent: A Fine-Tunable Generalist Agent with Structured Reasoning [50.47568731994238]
人工知能(AI)エージェント作成の鍵となる方法は強化学習(RL)である
本稿では,構造化推論をAIエージェントのポリシーに統合し,学習するための一般的なフレームワークモデルを提案する。
論文 参考訳(メタデータ) (2023-12-22T17:57:57Z) - The Rise and Potential of Large Language Model Based Agents: A Survey [91.71061158000953]
大規模言語モデル(LLM)は、人工知能(AGI)の潜在的な火花と見なされる
まず、エージェントの概念を哲学的起源からAI開発まで追跡し、LLMがエージェントに適した基盤である理由を説明します。
単一エージェントシナリオ,マルチエージェントシナリオ,ヒューマンエージェント協調の3つの側面において,LLMベースのエージェントの広範な応用について検討する。
論文 参考訳(メタデータ) (2023-09-14T17:12:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。