論文の概要: ADVISER: A Toolkit for Developing Multi-modal, Multi-domain and
Socially-engaged Conversational Agents
- arxiv url: http://arxiv.org/abs/2005.01777v1
- Date: Mon, 4 May 2020 18:27:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-07 00:02:28.402296
- Title: ADVISER: A Toolkit for Developing Multi-modal, Multi-domain and
Socially-engaged Conversational Agents
- Title(参考訳): ADVISER: マルチモーダル・マルチドメイン・ソーシャル型会話エージェントの開発のためのツールキット
- Authors: Chia-Yu Li, Daniel Ortega, Dirk V\"ath, Florian Lux, Lindsey
Vanderlyn, Maximilian Schmidt, Michael Neumann, Moritz V\"olkel, Pavel
Denisov, Sabrina Jenne, Zorica Kacarevic and Ngoc Thang Vu
- Abstract要約: ADVISERはオープンソースのマルチドメインダイアログシステムツールキットである。
マルチモーダル(音声、テキスト、視覚を含む)会話エージェントの開発を可能にする。
ツールキットの最終的なPythonベースの実装は、柔軟で、使いやすく、拡張が容易です。
- 参考スコア(独自算出の注目度): 27.222054181839095
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present ADVISER - an open-source, multi-domain dialog system toolkit that
enables the development of multi-modal (incorporating speech, text and vision),
socially-engaged (e.g. emotion recognition, engagement level prediction and
backchanneling) conversational agents. The final Python-based implementation of
our toolkit is flexible, easy to use, and easy to extend not only for
technically experienced users, such as machine learning researchers, but also
for less technically experienced users, such as linguists or cognitive
scientists, thereby providing a flexible platform for collaborative research.
Link to open-source code: https://github.com/DigitalPhonetics/adviser
- Abstract(参考訳): 本稿では,マルチモーダル(音声,テキスト,視覚を含む),社会的に関与した(感情認識,エンゲージメントレベル予測,バックチャネル化など)対話エージェントの開発を可能にする,オープンソースのマルチドメイン対話システムツールキットである advisorを提案する。
私たちのツールキットの最終的なPythonベースの実装は柔軟で使いやすく、機械学習研究者のような技術的に経験のあるユーザだけでなく、言語学者や認知科学者のような技術的に経験の浅いユーザのためにも拡張が容易です。
オープンソースコードへのリンク: https://github.com/digitalphonetics/adviser
関連論文リスト
- OpenOmni: A Collaborative Open Source Tool for Building Future-Ready Multimodal Conversational Agents [11.928422245125985]
Open Omniはオープンソースのエンドツーエンドパイプラインベンチマークツールである。
音声テキスト、感情検出、検索拡張生成、大規模言語モデルなどの高度な技術を統合している。
ローカルとクラウドのデプロイメントをサポートし、データのプライバシを確保し、レイテンシと精度のベンチマークをサポートする。
論文 参考訳(メタデータ) (2024-08-06T09:02:53Z) - OpenHands: An Open Platform for AI Software Developers as Generalist Agents [109.8507367518992]
私たちは、人間の開発者と同じような方法で世界と対話するAIエージェントを開発するためのプラットフォームであるOpenHandsを紹介します。
プラットフォームが新しいエージェントの実装を可能にし、コード実行のためのサンドボックス環境との安全なインタラクション、評価ベンチマークの導入について説明する。
論文 参考訳(メタデータ) (2024-07-23T17:50:43Z) - OpenAgents: An Open Platform for Language Agents in the Wild [71.16800991568677]
OpenAgentsは、日々の生活の中で言語エージェントを使い、ホストするためのオープンなプラットフォームです。
我々は課題と機会を解明し、現実世界の言語エージェントの将来の研究と開発の基礎を築きたいと考えています。
論文 参考訳(メタデータ) (2023-10-16T17:54:53Z) - Conversational Health Agents: A Personalized LLM-Powered Agent Framework [1.4597673707346281]
会話型健康エージェント(英: Conversational Health Agents、CHA)は、援助や診断などの医療サービスを提供する対話型システムである。
我々は,対話エージェントがユーザの医療クエリに対してパーソナライズされた応答を生成するためのオープンソースのフレームワークであるopenCHAを提案する。
openCHAには、外部ソースから情報を集めるためのアクションを計画し実行するためのオーケストレータが含まれている。
論文 参考訳(メタデータ) (2023-10-03T18:54:10Z) - Agents: An Open-source Framework for Autonomous Language Agents [98.91085725608917]
我々は、言語エージェントを人工知能への有望な方向と見なしている。
Agentsはオープンソースライブラリで、これらの進歩を広く非専門的な聴衆に開放することを目的としています。
論文 参考訳(メタデータ) (2023-09-14T17:18:25Z) - ChatDev: Communicative Agents for Software Development [84.90400377131962]
ChatDevはチャットを利用したソフトウェア開発フレームワークで、特別なエージェントがコミュニケーション方法についてガイドされる。
これらのエージェントは、統一された言語ベースのコミュニケーションを通じて、設計、コーディング、テストフェーズに積極的に貢献する。
論文 参考訳(メタデータ) (2023-07-16T02:11:34Z) - UKP-SQUARE: An Online Platform for Question Answering Research [50.35348764297317]
我々は、研究者向けのオンラインQAプラットフォームであるUKP-SQUAREを紹介した。
UKP-SQUAREでは、ユーザフレンドリーなWebインターフェースと統合テストを通じて、モダンスキルの大規模なコレクションをクエリし、分析することができる。
論文 参考訳(メタデータ) (2022-03-25T15:00:24Z) - Deep Learning Tools for Audacity: Helping Researchers Expand the
Artist's Toolkit [8.942168855247548]
本稿では,ニューラルネットワークをオープンソースオーディオ編集ソフトウェアであるAudacityに統合するソフトウェアフレームワークを提案する。
エンドユーザとニューラルネットワーク開発者の両方で、いくつかのユースケースを紹介します。
論文 参考訳(メタデータ) (2021-10-25T23:56:38Z) - SpeechBrain: A General-Purpose Speech Toolkit [73.0404642815335]
SpeechBrainはオープンソースでオールインワンの音声ツールキットである。
ニューラル音声処理技術の研究開発を促進するために設計された。
幅広い音声ベンチマークにおいて、競争力や最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-06-08T18:22:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。