論文の概要: ADVISER: A Toolkit for Developing Multi-modal, Multi-domain and
Socially-engaged Conversational Agents
- arxiv url: http://arxiv.org/abs/2005.01777v1
- Date: Mon, 4 May 2020 18:27:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-07 00:02:28.402296
- Title: ADVISER: A Toolkit for Developing Multi-modal, Multi-domain and
Socially-engaged Conversational Agents
- Title(参考訳): ADVISER: マルチモーダル・マルチドメイン・ソーシャル型会話エージェントの開発のためのツールキット
- Authors: Chia-Yu Li, Daniel Ortega, Dirk V\"ath, Florian Lux, Lindsey
Vanderlyn, Maximilian Schmidt, Michael Neumann, Moritz V\"olkel, Pavel
Denisov, Sabrina Jenne, Zorica Kacarevic and Ngoc Thang Vu
- Abstract要約: ADVISERはオープンソースのマルチドメインダイアログシステムツールキットである。
マルチモーダル(音声、テキスト、視覚を含む)会話エージェントの開発を可能にする。
ツールキットの最終的なPythonベースの実装は、柔軟で、使いやすく、拡張が容易です。
- 参考スコア(独自算出の注目度): 27.222054181839095
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present ADVISER - an open-source, multi-domain dialog system toolkit that
enables the development of multi-modal (incorporating speech, text and vision),
socially-engaged (e.g. emotion recognition, engagement level prediction and
backchanneling) conversational agents. The final Python-based implementation of
our toolkit is flexible, easy to use, and easy to extend not only for
technically experienced users, such as machine learning researchers, but also
for less technically experienced users, such as linguists or cognitive
scientists, thereby providing a flexible platform for collaborative research.
Link to open-source code: https://github.com/DigitalPhonetics/adviser
- Abstract(参考訳): 本稿では,マルチモーダル(音声,テキスト,視覚を含む),社会的に関与した(感情認識,エンゲージメントレベル予測,バックチャネル化など)対話エージェントの開発を可能にする,オープンソースのマルチドメイン対話システムツールキットである advisorを提案する。
私たちのツールキットの最終的なPythonベースの実装は柔軟で使いやすく、機械学習研究者のような技術的に経験のあるユーザだけでなく、言語学者や認知科学者のような技術的に経験の浅いユーザのためにも拡張が容易です。
オープンソースコードへのリンク: https://github.com/digitalphonetics/adviser
関連論文リスト
- OpenAgents: An Open Platform for Language Agents in the Wild [71.16800991568677]
OpenAgentsは、日々の生活の中で言語エージェントを使い、ホストするためのオープンなプラットフォームです。
我々は課題と機会を解明し、現実世界の言語エージェントの将来の研究と開発の基礎を築きたいと考えています。
論文 参考訳(メタデータ) (2023-10-16T17:54:53Z) - Conversational Health Agents: A Personalized LLM-Powered Agent Framework [1.5946909835546885]
会話型健康エージェント(英: Conversational Health Agents、CHA)は、援助や診断などの医療サービスを提供する対話型システムである。
我々は,対話エージェントがユーザの医療クエリに対してパーソナライズされた応答を生成するためのオープンソースのフレームワークであるopenCHAを提案する。
openCHAには、外部ソースから情報を集めるためのアクションを計画し実行するためのオーケストレータが含まれている。
論文 参考訳(メタデータ) (2023-10-03T18:54:10Z) - Agents: An Open-source Framework for Autonomous Language Agents [98.91085725608917]
我々は、言語エージェントを人工知能への有望な方向と見なしている。
Agentsはオープンソースライブラリで、これらの進歩を広く非専門的な聴衆に開放することを目的としています。
論文 参考訳(メタデータ) (2023-09-14T17:18:25Z) - LAMM: Language-Assisted Multi-Modal Instruction-Tuning Dataset,
Framework, and Benchmark [81.42376626294812]
本稿では,Language-Assisted Multi-Modalインストラクションチューニングデータセット,フレームワーク,ベンチマークを提案する。
我々の目標は、MLLMのトレーニングと評価のための成長するエコシステムとしてLAMMを確立することです。
本稿では,2次元および3次元視覚のための広範囲な視覚タスクをカバーする包括的データセットとベンチマークを提案する。
論文 参考訳(メタデータ) (2023-06-11T14:01:17Z) - GLM-Dialog: Noise-tolerant Pre-training for Knowledge-grounded Dialogue
Generation [21.91914619107555]
GLM-Dialogは、中国語で知識に基づく会話ができる10Bパラメータを持つ大規模言語モデル(LLM)である。
我々は,オープンソースモデルと信頼性のある対話評価システムの開発を促進するために,評価プラットフォームをオンラインで提供します。
論文 参考訳(メタデータ) (2023-02-28T08:35:28Z) - UKP-SQUARE: An Online Platform for Question Answering Research [50.35348764297317]
我々は、研究者向けのオンラインQAプラットフォームであるUKP-SQUAREを紹介した。
UKP-SQUAREでは、ユーザフレンドリーなWebインターフェースと統合テストを通じて、モダンスキルの大規模なコレクションをクエリし、分析することができる。
論文 参考訳(メタデータ) (2022-03-25T15:00:24Z) - pymdp: A Python library for active inference in discrete state spaces [52.85819390191516]
pymdpはPythonでアクティブな推論をシミュレートするオープンソースパッケージである。
我々は,POMDPによるアクティブな推論をシミュレートする,最初のオープンソースパッケージを提供する。
論文 参考訳(メタデータ) (2022-01-11T12:18:44Z) - Deep Learning Tools for Audacity: Helping Researchers Expand the
Artist's Toolkit [8.942168855247548]
本稿では,ニューラルネットワークをオープンソースオーディオ編集ソフトウェアであるAudacityに統合するソフトウェアフレームワークを提案する。
エンドユーザとニューラルネットワーク開発者の両方で、いくつかのユースケースを紹介します。
論文 参考訳(メタデータ) (2021-10-25T23:56:38Z) - SpeechBrain: A General-Purpose Speech Toolkit [73.0404642815335]
SpeechBrainはオープンソースでオールインワンの音声ツールキットである。
ニューラル音声処理技術の研究開発を促進するために設計された。
幅広い音声ベンチマークにおいて、競争力や最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-06-08T18:22:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。