Fugu-MT 論文翻訳(概要): MOSS: Enabling Code-Driven Evolution and Context Management for AI Agents

論文の概要: MOSS: Enabling Code-Driven Evolution and Context Management for AI Agents

arxiv url: http://arxiv.org/abs/2409.16120v1
Date: Tue, 24 Sep 2024 14:30:21 GMT
ステータス: 翻訳完了
システム内更新日: 2024-09-26 05:36:51.238031
Title: MOSS: Enabling Code-Driven Evolution and Context Management for AI Agents
Title（参考訳）: MOSS:AIエージェントのためのコード駆動進化とコンテキスト管理を実現する
Authors: Ming Zhu, Yi Zhou,
Abstract要約: 動的コンテキスト管理システムとコード生成を統合する新しいフレームワークであるMOSS(llM-oriented Operating System Simulation)を紹介する。フレームワークの中核は、最小限の知識原則を強制するために、インバージョン・オブ・コントロールコンテナとデコレータを併用する。我々は,このフレームワークがエージェント開発における効率性と能力をいかに向上させるかを示し,チューリング完全エージェントへの移行におけるその優位性を強調した。
参考スコア（独自算出の注目度）: 7.4159044558995335
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Developing AI agents powered by large language models (LLMs) faces significant challenges in achieving true Turing completeness and adaptive, code-driven evolution. Current approaches often generate code independently of its runtime context, relying heavily on the LLM's memory, which results in inefficiencies and limits adaptability. Manual protocol development in sandbox environments further constrains the agent's autonomous adaptability. Crucially, achieving consistency in code and context across multi-turn interactions and ensuring isolation of local variables within each interaction remains an unsolved problem. We introduce MOSS (llM-oriented Operating System Simulation), a novel framework that addresses these challenges by integrating code generation with a dynamic context management system. MOSS ensures consistency and adaptability by using a mechanism that maintains the Python context across interactions, including isolation of local variables and preservation of runtime integrity. At its core, the framework employs an Inversion of Control (IoC) container in conjunction with decorators to enforce the least knowledge principle, allowing agents to focus on abstract interfaces rather than concrete implementations. This facilitates seamless integration of new tools and libraries, enables runtime instance replacement, and reduces prompt complexity, providing a "what you see is what you get" environment for the agent. Through a series of case studies, we show how this framework can enhance the efficiency and capabilities of agent development and highlight its advantages in moving towards Turing-complete agents capable of evolving through code.
Abstract（参考訳）: 大規模言語モデル(LLM)を活用したAIエージェントの開発は、真のチューリング完全性と適応的でコード駆動進化を実現する上で大きな課題に直面している。現在のアプローチは実行時コンテキストとは独立してコードを生成することが多く、LLMのメモリに大きく依存しているため、効率が悪く、適応性が制限される。サンドボックス環境における手動プロトコル開発は、エージェントの自律的適応性をさらに制限する。重要なのは、マルチターンインタラクションにおけるコードとコンテキストの一貫性の実現と、各インタラクション内のローカル変数の分離を保証することは、未解決の問題である。 MOSS(llM-oriented Operating System Simulation)は,動的コンテキスト管理システムとコード生成を統合することで,これらの課題に対処する新しいフレームワークである。 MOSSは、ローカル変数の分離やランタイムの整合性の維持を含む、インタラクション間のPythonコンテキストを維持するメカニズムを使用することで、一貫性と適応性を保証する。フレームワークの中核は、インバージョン・オブ・コントロール(IoC)コンテナをデコレータと組み合わせて最小限の知識原則を適用し、エージェントが具体的な実装ではなく抽象インターフェースに集中できるようにする。これにより、新しいツールやライブラリのシームレスな統合が容易になり、ランタイムインスタンスの置換が可能になり、迅速な複雑さが軽減され、エージェントの"見るものは何であるか"環境が提供される。一連のケーススタディを通じて、このフレームワークがエージェント開発の効率性と能力を高め、コードを通して進化できるチューリング完全エージェントへ移行する際の利点を強調した。

関連論文リスト

State and Memory is All You Need for Robust and Reliable AI Agents [29.259008600842517]
大規模言語モデル(LLM)は、自然言語の理解と生成において強力な進歩を実現している。しかし、複雑な現実世界の科学への応用は、記憶、計画、ツール統合の課題によって制限されている。本稿では、LLMベースのエージェントが自律的に計画し、推論し、堅牢で信頼性の高いドメイン固有タスク実行を実現することができるモジュール型エージェントフレームワークであるSciBORGを紹介する。
論文参考訳（メタデータ） (2025-06-30T02:02:35Z)
Get Experience from Practice: LLM Agents with Record & Replay [16.179801770737892]
本稿では,AIエージェントフレームワークに古典的なレコード再生機構を導入する,Agent Record & Replay(Agent Record & Replay)と呼ばれる新しいパラダイムを提案する。本稿では,AgentRRにおけるマルチレベル体験抽象化手法とチェック関数機構について述べる。さらに,AgentRRの複数のアプリケーションモードについて検討し,ユーザ記録タスクのデモ,大規模モデルコラボレーション,プライバシ対応エージェントの実行などを検討した。
論文参考訳（メタデータ） (2025-05-23T10:33:14Z)
MLE-Dojo: Interactive Environments for Empowering LLM Agents in Machine Learning Engineering [57.156093929365255]
自律型大規模言語モデル(LLM)エージェントを体系的に強化し、評価し、改善するためのガイムスタイルのフレームワーク。 MLE-Dojoは、現実的なエンジニアリングシナリオを反映した、多様でオープンなMLEタスクを慎重にキュレートする。完全に実行可能な環境は、教師付き微調整と強化学習の両方を通して包括的なエージェントトレーニングをサポートする。
論文参考訳（メタデータ） (2025-05-12T17:35:43Z)
UserCentrix: An Agentic Memory-augmented AI Framework for Smart Spaces [8.111700384985356]
エージェントAIは、自律的で積極的な意思決定とともに、スマート環境を変革した。本稿では、動的でコンテキスト対応な意思決定を通じてスマートスペースを強化するために設計された、エージェント型メモリ拡張AIフレームワークであるUserCentrixを紹介する。
論文参考訳（メタデータ） (2025-05-01T11:54:49Z)
AgentNet: Decentralized Evolutionary Coordination for LLM-based Multi-Agent Systems [22.291969093748005]
AgentNet(エージェントネット)は、マルチエージェントシステムのための分散化された検索型生成(RAG)ベースのフレームワークである。静的代入や集中制御に依存する従来のマルチエージェントシステムとは異なり、エージェントは動的に専門化できる。 AgentNetはスケーラブルな適応性を促進し、組織間のプライバシ保護コラボレーションを可能にする。
論文参考訳（メタデータ） (2025-04-01T09:45:25Z)
Agent models: Internalizing Chain-of-Action Generation into Reasoning models [15.954047804223379]
我々は、emphChain-of-Action(CoA)の発生を内部化するemphLarge Agent Models(LAMs)を配置する。提案するAutoCoAフレームワークは,教師付き微調整(SFT)と強化学習(RL)を組み合わせたものである。主なコンポーネントは、ステップレベルのアクショントリガー、軌道レベルのCoA、実際の環境相互作用コストを低減するための内部世界モデルである。
論文参考訳（メタデータ） (2025-03-09T12:19:47Z)
IntellAgent: A Multi-Agent Framework for Evaluating Conversational AI Systems [2.2810745411557316]
IntellAgentは、対話型AIシステムを評価するためのスケーラブルでオープンソースのフレームワークである。 IntellAgentは、ポリシー駆動グラフモデリング、リアルイベント生成、対話型ユーザエージェントシミュレーションを組み合わせることで、合成ベンチマークの作成を自動化する。我々の研究は、IntellAgentが、研究と展開の橋渡しの課題に対処することで、会話AIを前進させるための効果的なフレームワークであることを示した。
論文参考訳（メタデータ） (2025-01-19T14:58:35Z)
TheAgentCompany: Benchmarking LLM Agents on Consequential Real World Tasks [52.46737975742287]
我々は、デジタルワーカーと同じような方法で世界と対話するAIエージェントを評価するためのベンチマークであるTheAgentCompanyを紹介する。最も競争力のあるエージェントは、タスクの30%を自律的に完了させることができる。これは、実際の職場の設定でLMエージェントをシミュレートすることで、タスク自動化に関する微妙な絵を描く。
論文参考訳（メタデータ） (2024-12-18T18:55:40Z)
Magentic-One: A Generalist Multi-Agent System for Solving Complex Tasks [39.084974125007165]
本稿では,複雑なタスクを解くための高性能なオープンソースエージェントシステムMagentic-Oneを紹介する。 Magentic-Oneでは、リードエージェントであるOrchestratorが進捗を追跡し、エラーからリカバリするための再計画を行うマルチエージェントアーキテクチャを使用している。 Magentic-Oneは3つの多様かつ挑戦的なエージェントベンチマークにおいて、最先端技術に対して統計的に競争力を発揮することを示す。
論文参考訳（メタデータ） (2024-11-07T06:36:19Z)
Gödel Agent: A Self-Referential Agent Framework for Recursive Self-Improvement [117.94654815220404]
G"odel AgentはG"odelマシンにインスパイアされた自己進化型フレームワークである。 G"odel Agentは、パフォーマンス、効率、一般化性において手作業によるエージェントを上回る、継続的な自己改善を実現することができる。
論文参考訳（メタデータ） (2024-10-06T10:49:40Z)
Compromising Embodied Agents with Contextual Backdoor Attacks [69.71630408822767]
大型言語モデル(LLM)は、エンボディドインテリジェンスの発展に変化をもたらした。本稿では,このプロセスにおけるバックドアセキュリティの重大な脅威を明らかにする。ほんの少しの文脈的デモンストレーションを毒殺しただけで、攻撃者はブラックボックスLDMの文脈的環境を隠蔽することができる。
論文参考訳（メタデータ） (2024-08-06T01:20:12Z)
Internet of Agents: Weaving a Web of Heterogeneous Agents for Collaborative Intelligence [79.5316642687565]
既存のマルチエージェントフレームワークは、多種多様なサードパーティエージェントの統合に苦慮することが多い。我々はこれらの制限に対処する新しいフレームワークであるInternet of Agents (IoA)を提案する。 IoAはエージェント統合プロトコル、インスタントメッセージのようなアーキテクチャ設計、エージェントのチーム化と会話フロー制御のための動的メカニズムを導入している。
論文参考訳（メタデータ） (2024-07-09T17:33:24Z)
ROS-LLM: A ROS framework for embodied AI with task feedback and structured reasoning [74.58666091522198]
非専門家による直感的なロボットプログラミングのためのフレームワークを提案する。ロボットオペレーティングシステム(ROS)からの自然言語のプロンプトと文脈情報を活用する我々のシステムは,大規模言語モデル (LLM) を統合し,非専門家がチャットインタフェースを通じてシステムにタスク要求を記述できるようにする。
論文参考訳（メタデータ） (2024-06-28T08:28:38Z)
AgentScope: A Flexible yet Robust Multi-Agent Platform [66.64116117163755]
AgentScopeは、メッセージ交換をコアコミュニケーションメカニズムとする、開発者中心のマルチエージェントプラットフォームである。豊富な構文ツール、組み込みエージェントとサービス機能、アプリケーションのデモとユーティリティモニタのためのユーザフレンドリなインターフェース、ゼロコードプログラミングワークステーション、自動プロンプトチューニング機構により、開発とデプロイメントの両方の障壁は大幅に低下した。
論文参考訳（メタデータ） (2024-02-21T04:11:28Z)
Breaking Down the Task: A Unit-Grained Hybrid Training Framework for Vision and Language Decision Making [19.87916700767421]
視覚言語意思決定(VLDM)は、難しいマルチモーダルタスクである。環境の観点からは、タスクエピソードはきめ細かいテキストユニットに分けることができる。本研究では,環境中を活発に探索し,露光バイアスを低減できる新しいハイブリッド学習フレームワークを提案する。
論文参考訳（メタデータ） (2023-07-16T11:54:16Z)
SwiftSage: A Generative Agent with Fast and Slow Thinking for Complex Interactive Tasks [81.9962823875981]
我々は、人間の認知の二重プロセス理論に触発された新しいエージェントフレームワークSwiftSageを紹介する。フレームワークは、高速で直感的な思考を表すSwiftモジュールと、意図的な思考プロセスをエミュレートするSageモジュールの2つの主要なモジュールで構成されている。 ScienceWorldベンチマークの30タスクでは、SwiftSageはSayCan、ReAct、Reflexといった他のメソッドよりも大幅に優れています。
論文参考訳（メタデータ） (2023-05-27T07:04:15Z)
CoRL: Environment Creation and Management Focused on System Integration [0.0]
コア強化学習ライブラリ(Core Reinforcement Learning Library, CoRL)は、モジュール式で構成可能で、設定可能な環境作成ツールである。簡単に読み取れる構成ファイル、ピダンティックバリデータ、およびファクタデザインパターンを使用することで、エージェントの観察、報酬、完了条件の微調整を可能にする。
論文参考訳（メタデータ） (2023-03-03T19:01:53Z)
Evolving Hierarchical Memory-Prediction Machines in Multi-Task Reinforcement Learning [4.030910640265943]
行動エージェントは、時間とともに様々な環境や目的にまたがって一般化されなければならない。遺伝的プログラミングを用いて、制御文献から6つのユニークな環境で動作可能な、高度に一般化されたエージェントを進化させる。進化するプログラムにおける創発的階層構造は、時間分解とメモリ上の問題環境の符号化を成功させるマルチタスクエージェントをもたらすことを示す。
論文参考訳（メタデータ） (2021-06-23T21:34:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。