論文の概要: Conversational AI Multi-Agent Interoperability, Universal Open APIs for Agentic Natural Language Multimodal Communications
- arxiv url: http://arxiv.org/abs/2407.19438v1
- Date: Sun, 28 Jul 2024 09:33:55 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-30 18:12:26.186391
- Title: Conversational AI Multi-Agent Interoperability, Universal Open APIs for Agentic Natural Language Multimodal Communications
- Title(参考訳): 対話型AIマルチエージェントインターオペラビリティ, エージェント自然言語マルチモーダル通信のためのユニバーサルオープンAPI
- Authors: Diego Gosmar, Deborah A. Dahl, Emmett Coin,
- Abstract要約: 本稿では、会話型AI多エージェント相互運用フレームワークについて分析し、Open Voiceイニシアチブが提案する新しいアーキテクチャについて述べる。
この新しいアプローチは、主要なコンポーネントとともに、標準的なマルチモーダルAIエージェンシー(あるいはエージェントAI)通信を展開する上での重要なメリットとユースケースを説明している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper analyses Conversational AI multi-agent interoperability frameworks and describes the novel architecture proposed by the Open Voice Interoperability initiative (Linux Foundation AI and DATA), also known briefly as OVON (Open Voice Network). The new approach is illustrated, along with the main components, delineating the key benefits and use cases for deploying standard multi-modal AI agency (or agentic AI) communications. Beginning with Universal APIs based on Natural Language, the framework establishes and enables interoperable interactions among diverse Conversational AI agents, including chatbots, voicebots, videobots, and human agents. Furthermore, a new Discovery specification framework is introduced, designed to efficiently look up agents providing specific services and to obtain accurate information about these services through a standard Manifest publication, accessible via an extended set of Natural Language-based APIs. The main purpose of this contribution is to significantly enhance the capabilities and scalability of AI interactions across various platforms. The novel architecture for interoperable Conversational AI assistants is designed to generalize, being replicable and accessible via open repositories.
- Abstract(参考訳): 本稿では,Open Voice Interoperability Initiative(Linux Foundation AI and Data,略称OVON)によって提案される新しいアーキテクチャについて述べる。
この新しいアプローチは、主要なコンポーネントとともに、標準的なマルチモーダルAIエージェンシー(あるいはエージェントAI)通信を展開する上での重要なメリットとユースケースを説明している。
自然言語に基づくUniversal APIから始まるこのフレームワークは、チャットボット、ボイスボット、ビデオボット、ヒューマンエージェントなど、さまざまな会話型AIエージェント間の相互運用を可能にする。
さらに、特定のサービスを提供するエージェントを効率的に検索し、自然言語ベースのAPIの拡張を通じてアクセス可能な標準のManifestパブリッシュを通じてこれらのサービスに関する正確な情報を取得するように設計された、新しいDiscovery仕様フレームワークが導入された。
このコントリビューションの主な目的は、さまざまなプラットフォームにわたるAIインタラクションの能力とスケーラビリティを著しく向上させることである。
相互運用可能な会話型AIアシスタントのための新しいアーキテクチャは、オープンリポジトリを介して複製可能でアクセスしやすいように設計されている。
関連論文リスト
- AI Multi-Agent Interoperability Extension for Managing Multiparty Conversations [0.0]
本稿では,Open Voice Initiative の既存の Multi-Agent 仕様の新たな拡張について述べる。
Convener Agent、Floor-Shared Conversational Space、Floor Manager、Multi-Conversant Support、InterruptionsやUninvited Agentsなどの新しい概念を導入している。
これらの進歩は、複数のAIエージェントが協力し、議論し、議論に貢献する必要があるシナリオにおいて、スムーズで、効率的で、セキュアな相互作用を保証するために不可欠である。
論文 参考訳(メタデータ) (2024-11-05T18:11:55Z) - A Learnable Agent Collaboration Network Framework for Personalized Multimodal AI Search Engine [14.123823081267336]
本稿では,Agent Collaboration Network (ACN) と呼ばれる新しいAI検索エンジンフレームワークを提案する。
ACNフレームワークは、複数の専門エージェントが協力して作業し、それぞれがアカウントマネージャ、ソリューションストラテジスト、情報マネージャ、コンテンツクリエータといった異なる役割を担っている。
ACNの特長は、エージェント間のオンライン相乗的調整をサポートする反射フォワード最適化法(RFO)の導入である。
論文 参考訳(メタデータ) (2024-09-01T07:01:22Z) - IDAT: A Multi-Modal Dataset and Toolkit for Building and Evaluating Interactive Task-Solving Agents [20.460482488872145]
本稿では,接地型自然言語命令の理解と実行が可能な対話型エージェントを開発する上での課題について述べる。
本研究では,Minecraftのような環境下で対話型接地言語命令を収集するためのスケーラブルなデータ収集ツールを提案する。
定性解析とエージェント性能比較のためのヒューマン・イン・ザ・ループ対話型評価プラットフォームを提案する。
論文 参考訳(メタデータ) (2024-07-12T00:07:43Z) - Internet of Agents: Weaving a Web of Heterogeneous Agents for Collaborative Intelligence [79.5316642687565]
既存のマルチエージェントフレームワークは、多種多様なサードパーティエージェントの統合に苦慮することが多い。
我々はこれらの制限に対処する新しいフレームワークであるInternet of Agents (IoA)を提案する。
IoAはエージェント統合プロトコル、インスタントメッセージのようなアーキテクチャ設計、エージェントのチーム化と会話フロー制御のための動的メカニズムを導入している。
論文 参考訳(メタデータ) (2024-07-09T17:33:24Z) - KamerRaad: Enhancing Information Retrieval in Belgian National Politics through Hierarchical Summarization and Conversational Interfaces [55.00702535694059]
KamerRaadは、大きな言語モデルを活用するAIツールで、市民がベルギーの政治情報と対話的に関わるのを助ける。
このツールは、議会の手続きから重要な抜粋を抽出し、簡潔に要約し、次いで生成AIに基づくインタラクションの可能性を示す。
論文 参考訳(メタデータ) (2024-04-22T15:01:39Z) - An Interactive Agent Foundation Model [49.77861810045509]
本稿では,AIエージェントを訓練するための新しいマルチタスクエージェントトレーニングパラダイムを用いた対話型エージェント基礎モデルを提案する。
トレーニングパラダイムは、視覚マスク付きオートエンコーダ、言語モデリング、次世代の予測など、多様な事前学習戦略を統一する。
私たちは、ロボティクス、ゲームAI、ヘルスケアという3つの異なる領域でフレームワークのパフォーマンスを実演します。
論文 参考訳(メタデータ) (2024-02-08T18:58:02Z) - Agents: An Open-source Framework for Autonomous Language Agents [98.91085725608917]
我々は、言語エージェントを人工知能への有望な方向と見なしている。
Agentsはオープンソースライブラリで、これらの進歩を広く非専門的な聴衆に開放することを目的としています。
論文 参考訳(メタデータ) (2023-09-14T17:18:25Z) - SHINE: Syntax-augmented Hierarchical Interactive Encoder for Zero-shot
Cross-lingual Information Extraction [47.88887327545667]
本研究では,構文拡張型階層型インタラクティブエンコーダ(SHINE)を提案する。
Shineは、特徴とコンテキスト情報の間の相補的な情報をインタラクティブにキャプチャすることができる。
3つのIEタスクと4つのベンチマークで7つの言語で実験を行い、提案手法の有効性と一般化能力を検証した。
論文 参考訳(メタデータ) (2023-05-21T08:02:06Z) - CAMEL: Communicative Agents for "Mind" Exploration of Large Language
Model Society [58.04479313658851]
本稿では,コミュニケーションエージェント間の自律的協調を支援するスケーラブルな手法の構築の可能性について検討する。
本稿では,ロールプレイングという新しいコミュニケーションエージェントフレームワークを提案する。
コントリビューションには、新しいコミュニケーティブエージェントフレームワークの導入、マルチエージェントシステムの協調行動や能力を研究するためのスケーラブルなアプローチの提供などが含まれます。
論文 参考訳(メタデータ) (2023-03-31T01:09:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。