論文の概要: Asynchronous Tool Usage for Real-Time Agents
- arxiv url: http://arxiv.org/abs/2410.21620v1
- Date: Mon, 28 Oct 2024 23:57:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-30 13:40:51.326948
- Title: Asynchronous Tool Usage for Real-Time Agents
- Title(参考訳): リアルタイムエージェントのための非同期ツール利用
- Authors: Antonio A. Ginart, Naveen Kodali, Jason Lee, Caiming Xiong, Silvio Savarese, John Emmons,
- Abstract要約: 並列処理とリアルタイムツール利用が可能な非同期AIエージェントを導入する。
私たちの重要な貢献は、エージェントの実行とプロンプトのためのイベント駆動有限状態マシンアーキテクチャです。
この研究は、流体とマルチタスクの相互作用が可能なAIエージェントを作成するための概念的なフレームワークと実践的なツールの両方を提示している。
- 参考スコア(独自算出の注目度): 61.3041983544042
- License:
- Abstract: While frontier large language models (LLMs) are capable tool-using agents, current AI systems still operate in a strict turn-based fashion, oblivious to passage of time. This synchronous design forces user queries and tool-use to occur sequentially, preventing the systems from multitasking and reducing interactivity. To address this limitation, we introduce asynchronous AI agents capable of parallel processing and real-time tool-use. Our key contribution is an event-driven finite-state machine architecture for agent execution and prompting, integrated with automatic speech recognition and text-to-speech. Drawing inspiration from the concepts originally developed for real-time operating systems, this work presents both a conceptual framework and practical tools for creating AI agents capable of fluid, multitasking interactions.
- Abstract(参考訳): フロンティアの大規模言語モデル(LLM)はツールを使用するエージェントとして機能するが、現在のAIシステムは依然として厳格なターンベースで運用されている。
この同期設計は、ユーザクエリとツールの使用を順次実行させ、システムがマルチタスクを防ぎ、対話性を低下させる。
この制限に対処するために、並列処理とリアルタイムツール使用が可能な非同期AIエージェントを導入する。
我々の重要な貢献は、エージェントの実行とプロンプトのためのイベント駆動有限状態マシンアーキテクチャであり、自動音声認識と音声合成を統合している。
この研究は、もともとリアルタイムオペレーティングシステム用に開発された概念からインスピレーションを得たもので、流体とマルチタスクの相互作用が可能なAIエージェントを作成するための概念的なフレームワークと実践的なツールの両方を提示する。
関連論文リスト
- AI Multi-Agent Interoperability Extension for Managing Multiparty Conversations [0.0]
本稿では,Open Voice Initiative の既存の Multi-Agent 仕様の新たな拡張について述べる。
Convener Agent、Floor-Shared Conversational Space、Floor Manager、Multi-Conversant Support、InterruptionsやUninvited Agentsなどの新しい概念を導入している。
これらの進歩は、複数のAIエージェントが協力し、議論し、議論に貢献する必要があるシナリオにおいて、スムーズで、効率的で、セキュアな相互作用を保証するために不可欠である。
論文 参考訳(メタデータ) (2024-11-05T18:11:55Z) - Internet of Agents: Weaving a Web of Heterogeneous Agents for Collaborative Intelligence [79.5316642687565]
既存のマルチエージェントフレームワークは、多種多様なサードパーティエージェントの統合に苦慮することが多い。
我々はこれらの制限に対処する新しいフレームワークであるInternet of Agents (IoA)を提案する。
IoAはエージェント統合プロトコル、インスタントメッセージのようなアーキテクチャ設計、エージェントのチーム化と会話フロー制御のための動的メカニズムを導入している。
論文 参考訳(メタデータ) (2024-07-09T17:33:24Z) - ROS-LLM: A ROS framework for embodied AI with task feedback and structured reasoning [74.58666091522198]
非専門家による直感的なロボットプログラミングのためのフレームワークを提案する。
ロボットオペレーティングシステム(ROS)からの自然言語のプロンプトと文脈情報を活用する
我々のシステムは,大規模言語モデル (LLM) を統合し,非専門家がチャットインタフェースを通じてシステムにタスク要求を記述できるようにする。
論文 参考訳(メタデータ) (2024-06-28T08:28:38Z) - AgentScope: A Flexible yet Robust Multi-Agent Platform [66.64116117163755]
AgentScopeは、メッセージ交換をコアコミュニケーションメカニズムとする、開発者中心のマルチエージェントプラットフォームである。
豊富な構文ツール、組み込みエージェントとサービス機能、アプリケーションのデモとユーティリティモニタのためのユーザフレンドリなインターフェース、ゼロコードプログラミングワークステーション、自動プロンプトチューニング機構により、開発とデプロイメントの両方の障壁は大幅に低下した。
論文 参考訳(メタデータ) (2024-02-21T04:11:28Z) - LLMind: Orchestrating AI and IoT with LLM for Complex Task Execution [18.816077341295628]
我々は,IoTデバイス間の効果的なコラボレーションを可能にするタスク指向AIフレームワークであるLLMindを紹介する。
脳の機能的特殊化理論に触発されて、我々のフレームワークはLLMとドメイン固有のAIモジュールを統合する。
複数のドメイン固有のAIモジュールとIoTデバイスのコラボレーションを含む複雑なタスクは、コントロールスクリプトを介して実行される。
論文 参考訳(メタデータ) (2023-12-14T14:57:58Z) - ART: Automatic multi-step reasoning and tool-use for large language
models [105.57550426609396]
大規模言語モデル(LLM)は、数秒とゼロショットの設定で複雑な推論を行うことができる。
各推論ステップは、コアLLM機能を超えて計算をサポートする外部ツールに依存することができる。
プログラムとして中間推論ステップを自動生成するために凍結LDMを使用するフレームワークであるART(Automatic Reasoning and Tool-use)を導入する。
論文 参考訳(メタデータ) (2023-03-16T01:04:45Z) - Realistic simulation of users for IT systems in cyber ranges [63.20765930558542]
ユーザアクティビティを生成するために,外部エージェントを用いて各マシンを計測する。
このエージェントは、決定論的および深層学習に基づく手法を組み合わせて、異なる環境に適応する。
また,会話や文書の作成を容易にする条件付きテキスト生成モデルを提案する。
論文 参考訳(メタデータ) (2021-11-23T10:53:29Z) - Workflow Automation for Cyber Physical System Development Processes [1.6735240552964108]
サイバー物理システム(CPS)の開発には、多くの分野の専門知識を持つ開発者間の密接な相互作用が必要である。
複雑なCPS開発プロセスの自動化のためのワークフローモデリング言語を導入する。
保証ベースの学習対応CPSツールチェーンでこれらのモデルを実行するためのプラットフォームを実装した。
論文 参考訳(メタデータ) (2020-04-12T17:32:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。