論文の概要: Jenius Agent: Towards Experience-Driven Accuracy Optimization in Real-World Scenarios
- arxiv url: http://arxiv.org/abs/2601.01857v1
- Date: Mon, 05 Jan 2026 07:35:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-06 16:25:22.842068
- Title: Jenius Agent: Towards Experience-Driven Accuracy Optimization in Real-World Scenarios
- Title(参考訳): Jenius Agent: 実世界のシナリオにおけるエクスペリエンス駆動の精度最適化を目指す
- Authors: Defei Xia, Bingfeng Pi, Shenbin Zhang, Song Hua, Yunfei Wei, Lei Zuo,
- Abstract要約: 本稿では,実体験に基づくエージェントフレームワークを提案する。
Jenius-Agentという名前のエンドツーエンドフレームワークは、3つの重要な最適化と統合されている。
実験によると、タスクの精度が20%向上し、トークンコストが削減され、レスポンスレイテンシが低下し、起動障害が発生している。
- 参考スコア(独自算出の注目度): 0.9069311779417014
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As agent systems powered by large language models (LLMs) advance, improving the task performance of an autonomous agent, especially in context understanding, tool usage, and response generation, has become increasingly critical. Although prior studies have advanced the overall design of LLM-based agents, systematic optimization of their internal reasoning and tool-use pipelines remains underexplored. This paper introduces an agent framework grounded in real-world practical experience, with three key innovations: (1) an adaptive prompt generation strategy that aligns with the agent's state and task goals to improve reliability and robustness; (2) a context-aware tool orchestration module that performs tool categorization, semantic retrieval, and adaptive invocation based on user intent and context; and (3) a layered memory mechanism that integrates session memory, task history, and external summaries to improve relevance and efficiency through dynamic summarization and compression. An end-to-end framework named Jenius-Agent has been integrated with three key optimizations, including tools based on the Model Context Protocol (MCP), file input/output (I/O), and execution feedback. The experiments show a 20 percent improvement in task accuracy, along with a reduced token cost, response latency, and invocation failures. The framework is already deployed in Jenius (https://www.jenius.cn), providing a lightweight and scalable solution for robust, protocol-compatible autonomous agents.
- Abstract(参考訳): 大規模言語モデル(LLM)を活用したエージェントシステムが進歩するにつれて、特に文脈理解、ツール使用、応答生成において自律エージェントのタスク性能が向上する傾向にある。
従来の研究はLCMベースのエージェントの全体的な設計を進歩させてきたが、内部推論とツール使用パイプラインの体系的な最適化は未検討のままである。
本稿では,(1)信頼性とロバスト性を向上させるためにエージェントの状態とタスク目標と整合する適応的プロンプト生成戦略,(2)ユーザ意図とコンテキストに基づいてツール分類,意味検索,適応的実行を行うコンテキスト対応ツールオーケストレーションモジュール,(3)セッションメモリ,タスク履歴,外部要約を統合して動的要約と圧縮による信頼性と効率を向上させる階層型メモリ機構を提案する。
Jenius-Agentという名前のエンドツーエンドフレームワークは、モデルコンテキストプロトコル(MCP)に基づくツール、ファイルインプット/アウトプット(I/O)、実行フィードバックの3つの主要な最適化と統合されている。
実験の結果、タスクの精度が20%向上し、トークンコストの削減、レスポンスレイテンシ、呼び出し障害が減少した。
このフレームワークはすでにJenius (https://www.jenius.cn)にデプロイされており、堅牢でプロトコル互換の自律エージェントのための軽量でスケーラブルなソリューションを提供している。
関連論文リスト
- Youtu-Agent: Scaling Agent Productivity with Automated Generation and Hybrid Policy Optimization [37.17893162265247]
Youtu-AgentはLarge Language Model (LLM)エージェントの自動生成と継続的進化のために設計されたフレームワークである。
Youtu-Agentは、実行環境、ツールキット、コンテキスト管理を分離する構造化構成システムを備えている。
実験により、Youtu-Agentはオープンウェイトモデルを用いてWebWalkerQA(71.47%)とGAIA72.8%)で最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2025-12-31T04:17:36Z) - AgentMath: Empowering Mathematical Reasoning for Large Language Models via Tool-Augmented Agent [80.83250816918861]
o3やDeepSeek-R1のようなLarge Reasoning Models (LRM)は、長いチェーン・オブ・シークレットを持つ自然言語推論において顕著な進歩を遂げている。
しかし、計算的に非効率であり、複雑な数学的操作を必要とする問題を解く際には精度に苦しむ。
本稿では,言語モデルの推論能力とコードインタプリタの計算精度をシームレスに統合するエージェントフレームワークであるAgentMathを紹介する。
論文 参考訳(メタデータ) (2025-12-23T19:57:49Z) - Towards Efficient Agents: A Co-Design of Inference Architecture and System [66.59916327634639]
本稿では,エージェントアクセラレーションのための統合フレームワークであるAgentInferを提案する。
問題をAgentCollab、AgentSched、AgentSAM、AgentCompressの4つの相乗的コンポーネントに分解する。
BrowseComp-zhとDeepDiverベンチマークの実験では、これらの手法の相乗的コラボレーションを通じて、AgentInferは非効率なトークン消費を50%以上削減することを示した。
論文 参考訳(メタデータ) (2025-12-20T12:06:13Z) - SCOPE: Prompt Evolution for Enhancing Agent Effectiveness [53.75986399936395]
大規模言語モデル(LLM)エージェントは、大規模で動的なコンテキストを生成する環境にますますデプロイされている。
エージェントはこのコンテキストにアクセスできますが、静的なプロンプトには効果的に管理するメカニズムがありません。
textbfSCOPE (Self-evolving Context Optimization via Prompt Evolution) を導入する。
本稿では,戦術的特異性(即時誤りの解消)と戦略的汎用性(長期原則の進化)のバランスをとるデュアルストリーム機構を提案する。
論文 参考訳(メタデータ) (2025-12-17T12:25:05Z) - Z-Space: A Multi-Agent Tool Orchestration Framework for Enterprise-Grade LLM Automation [3.518072776386001]
本稿では,データ生成指向型マルチエージェント協調ツール実行フレームワークZ-Spaceを提案する。
このフレームワークはElemeプラットフォームの技術部門にデプロイされており、大規模なテストデータ生成シナリオを提供している。
生産データは、ツール推論における平均トークン消費を96.26%削減していることを示している。
論文 参考訳(メタデータ) (2025-11-23T03:59:14Z) - Agent0: Unleashing Self-Evolving Agents from Zero Data via Tool-Integrated Reasoning [84.70211451226835]
大規模言語モデル(LLM)エージェントは、人間の計算データへの依存によって制約される。
我々は,外部データを持たない高性能エージェントを進化させる完全自律型フレームワークであるAgent0を紹介する。
Agent0は推論能力を大幅に向上させ、Qwen3-8B-Baseモデルを数学的推論で18%改善し、一般的な推論ベンチマークで24%改善した。
論文 参考訳(メタデータ) (2025-11-20T05:01:57Z) - State and Memory is All You Need for Robust and Reliable AI Agents [29.259008600842517]
大規模言語モデル(LLM)は、自然言語の理解と生成において強力な進歩を実現している。
しかし、複雑な現実世界の科学への応用は、記憶、計画、ツール統合の課題によって制限されている。
本稿では、LLMベースのエージェントが自律的に計画し、推論し、堅牢で信頼性の高いドメイン固有タスク実行を実現することができるモジュール型エージェントフレームワークであるSciBORGを紹介する。
論文 参考訳(メタデータ) (2025-06-30T02:02:35Z) - UserCentrix: An Agentic Memory-augmented AI Framework for Smart Spaces [8.111700384985356]
エージェントAIは、自律的で積極的な意思決定とともに、スマート環境を変革した。
本稿では、動的でコンテキスト対応な意思決定を通じてスマートスペースを強化するために設計された、エージェント型メモリ拡張AIフレームワークであるUserCentrixを紹介する。
論文 参考訳(メタデータ) (2025-05-01T11:54:49Z) - Learning to Use Tools via Cooperative and Interactive Agents [58.77710337157665]
ツール学習は、外部ツールを使用してユーティリティを拡張するエージェントとして、大きな言語モデル(LLM)を促進する。
ツール選択,ツール実行,アクションキャリブレーションの3つの特別なエージェントを個別にコーディネートする,協調型対話型エージェントフレームワークであるConAgentsを提案する。
3つのデータセットに対する実験により、LLMは、ConAgentsを装備した場合、大幅に改善されたベースラインよりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-03-05T15:08:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。