Fugu-MT 論文翻訳(概要): ADVISER: A Toolkit for Developing Multi-modal, Multi-domain and Socially-engaged Conversational Agents

論文の概要: ADVISER: A Toolkit for Developing Multi-modal, Multi-domain and Socially-engaged Conversational Agents

arxiv url: http://arxiv.org/abs/2005.01777v1
Date: Mon, 4 May 2020 18:27:58 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-07 00:02:28.402296
Title: ADVISER: A Toolkit for Developing Multi-modal, Multi-domain and Socially-engaged Conversational Agents
Title（参考訳）: ADVISER: マルチモーダル・マルチドメイン・ソーシャル型会話エージェントの開発のためのツールキット
Authors: Chia-Yu Li, Daniel Ortega, Dirk V\"ath, Florian Lux, Lindsey Vanderlyn, Maximilian Schmidt, Michael Neumann, Moritz V\"olkel, Pavel Denisov, Sabrina Jenne, Zorica Kacarevic and Ngoc Thang Vu
Abstract要約: ADVISERはオープンソースのマルチドメインダイアログシステムツールキットである。マルチモーダル(音声、テキスト、視覚を含む)会話エージェントの開発を可能にする。ツールキットの最終的なPythonベースの実装は、柔軟で、使いやすく、拡張が容易です。
参考スコア（独自算出の注目度）: 27.222054181839095
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We present ADVISER - an open-source, multi-domain dialog system toolkit that enables the development of multi-modal (incorporating speech, text and vision), socially-engaged (e.g. emotion recognition, engagement level prediction and backchanneling) conversational agents. The final Python-based implementation of our toolkit is flexible, easy to use, and easy to extend not only for technically experienced users, such as machine learning researchers, but also for less technically experienced users, such as linguists or cognitive scientists, thereby providing a flexible platform for collaborative research. Link to open-source code: https://github.com/DigitalPhonetics/adviser
Abstract（参考訳）: 本稿では,マルチモーダル(音声,テキスト,視覚を含む),社会的に関与した(感情認識,エンゲージメントレベル予測,バックチャネル化など)対話エージェントの開発を可能にする,オープンソースのマルチドメイン対話システムツールキットである advisorを提案する。私たちのツールキットの最終的なPythonベースの実装は柔軟で使いやすく、機械学習研究者のような技術的に経験のあるユーザだけでなく、言語学者や認知科学者のような技術的に経験の浅いユーザのためにも拡張が容易です。オープンソースコードへのリンク: https://github.com/digitalphonetics/adviser

関連論文リスト

Awesome-OL: An Extensible Toolkit for Online Learning [10.84664107715407]
Awesome-OLは、オンライン学習研究に適したPythonツールキットである。再現可能な比較、ベンチマークデータセットのキュレーション、マルチモーダルビジュアライゼーションのための統一されたフレームワークを提供する。
論文参考訳（メタデータ） (2025-07-27T06:34:37Z)
OpenOmni: A Collaborative Open Source Tool for Building Future-Ready Multimodal Conversational Agents [11.928422245125985]
Open Omniはオープンソースのエンドツーエンドパイプラインベンチマークツールである。音声テキスト、感情検出、検索拡張生成、大規模言語モデルなどの高度な技術を統合している。ローカルとクラウドのデプロイメントをサポートし、データのプライバシを確保し、レイテンシと精度のベンチマークをサポートする。
論文参考訳（メタデータ） (2024-08-06T09:02:53Z)
OpenHands: An Open Platform for AI Software Developers as Generalist Agents [109.8507367518992]
私たちは、人間の開発者と同じような方法で世界と対話するAIエージェントを開発するためのプラットフォームであるOpenHandsを紹介します。プラットフォームが新しいエージェントの実装を可能にし、コード実行のためのサンドボックス環境との安全なインタラクション、評価ベンチマークの導入について説明する。
論文参考訳（メタデータ） (2024-07-23T17:50:43Z)
psifx -- Psychological and Social Interactions Feature Extraction Package [3.1679243514285194]
psifxはマルチモーダルな特徴抽出ツールキットである。それは、人間の科学研究に最先端の機械学習技術を使うことを容易にし、民主化することを目的としている。
論文参考訳（メタデータ） (2024-07-14T16:20:42Z)
OpenAgents: An Open Platform for Language Agents in the Wild [71.16800991568677]
OpenAgentsは、日々の生活の中で言語エージェントを使い、ホストするためのオープンなプラットフォームです。我々は課題と機会を解明し、現実世界の言語エージェントの将来の研究と開発の基礎を築きたいと考えています。
論文参考訳（メタデータ） (2023-10-16T17:54:53Z)
Conversational Health Agents: A Personalized LLM-Powered Agent Framework [1.4597673707346281]
会話型健康エージェント(英: Conversational Health Agents、CHA)は、援助や診断などの医療サービスを提供する対話型システムである。我々は,対話エージェントがユーザの医療クエリに対してパーソナライズされた応答を生成するためのオープンソースのフレームワークであるopenCHAを提案する。 openCHAには、外部ソースから情報を集めるためのアクションを計画し実行するためのオーケストレータが含まれている。
論文参考訳（メタデータ） (2023-10-03T18:54:10Z)
Agents: An Open-source Framework for Autonomous Language Agents [98.91085725608917]
我々は、言語エージェントを人工知能への有望な方向と見なしている。 Agentsはオープンソースライブラリで、これらの進歩を広く非専門的な聴衆に開放することを目的としています。
論文参考訳（メタデータ） (2023-09-14T17:18:25Z)
ChatDev: Communicative Agents for Software Development [84.90400377131962]
ChatDevはチャットを利用したソフトウェア開発フレームワークで、特別なエージェントがコミュニケーション方法についてガイドされる。これらのエージェントは、統一された言語ベースのコミュニケーションを通じて、設計、コーディング、テストフェーズに積極的に貢献する。
論文参考訳（メタデータ） (2023-07-16T02:11:34Z)
UKP-SQUARE: An Online Platform for Question Answering Research [50.35348764297317]
我々は、研究者向けのオンラインQAプラットフォームであるUKP-SQUAREを紹介した。 UKP-SQUAREでは、ユーザフレンドリーなWebインターフェースと統合テストを通じて、モダンスキルの大規模なコレクションをクエリし、分析することができる。
論文参考訳（メタデータ） (2022-03-25T15:00:24Z)
Deep Learning Tools for Audacity: Helping Researchers Expand the Artist's Toolkit [8.942168855247548]
本稿では,ニューラルネットワークをオープンソースオーディオ編集ソフトウェアであるAudacityに統合するソフトウェアフレームワークを提案する。エンドユーザとニューラルネットワーク開発者の両方で、いくつかのユースケースを紹介します。
論文参考訳（メタデータ） (2021-10-25T23:56:38Z)
SpeechBrain: A General-Purpose Speech Toolkit [73.0404642815335]
SpeechBrainはオープンソースでオールインワンの音声ツールキットである。ニューラル音声処理技術の研究開発を促進するために設計された。幅広い音声ベンチマークにおいて、競争力や最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2021-06-08T18:22:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。