論文の概要: SAPIEN: Affective Virtual Agents Powered by Large Language Models
- arxiv url: http://arxiv.org/abs/2308.03022v1
- Date: Sun, 6 Aug 2023 05:13:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-08 17:09:13.080154
- Title: SAPIEN: Affective Virtual Agents Powered by Large Language Models
- Title(参考訳): SAPIEN: 大規模言語モデルによる影響のある仮想エージェント
- Authors: Masum Hasan, Cengiz Ozel, Sammy Potter and Ehsan Hoque
- Abstract要約: 我々は,大規模言語モデルによって駆動される高忠実度仮想エージェントのためのプラットフォームであるSAPIENを紹介する。
このプラットフォームでは、仮想エージェントのパーソナリティ、バックグラウンド、会話の前提をカスタマイズすることができる。
仮想会議の後、ユーザーは会話を分析し、コミュニケーションスキルに対して実行可能なフィードバックを受け取ることができる。
- 参考スコア(独自算出の注目度): 2.423280064224919
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this demo paper, we introduce SAPIEN, a platform for high-fidelity virtual
agents driven by large language models that can hold open domain conversations
with users in 13 different languages, and display emotions through facial
expressions and voice. The platform allows users to customize their virtual
agent's personality, background, and conversation premise, thus providing a
rich, immersive interaction experience. Furthermore, after the virtual meeting,
the user can choose to get the conversation analyzed and receive actionable
feedback on their communication skills. This paper illustrates an overview of
the platform and discusses the various application domains of this technology,
ranging from entertainment to mental health, communication training, language
learning, education, healthcare, and beyond. Additionally, we consider the
ethical implications of such realistic virtual agent representations and the
potential challenges in ensuring responsible use.
- Abstract(参考訳): このデモでは,13の異なる言語でオープンドメインの会話を行ない,表情や音声で感情を表示できる,大規模言語モデルによる高忠実度仮想エージェントのためのプラットフォームであるsapienを紹介する。
このプラットフォームでは、仮想エージェントのパーソナリティ、バックグラウンド、会話の前提をカスタマイズすることができ、リッチで没入的なインタラクションエクスペリエンスを提供する。
さらに、仮想会議の後、ユーザは会話の分析を受け取り、コミュニケーションスキルに対するアクション可能なフィードバックを受け取ることができる。
本稿ではプラットフォームの概要を説明し,エンタテインメントからメンタルヘルス,コミュニケーショントレーニング,言語学習,教育,医療など,この技術のさまざまな応用領域について論じる。
さらに、このような現実的な仮想エージェント表現の倫理的意味と、責任ある使用を確保する上での潜在的な課題についても考察する。
関連論文リスト
- RITA: A Real-time Interactive Talking Avatars Framework [6.060251768347276]
RITAは、生成モデルに基づいて構築された高品質なリアルタイム対話型フレームワークを提供する。
当社のフレームワークは,ユーザのアップロードした写真からリアルタイム対話を行うデジタルアバターへの変換を可能にする。
論文 参考訳(メタデータ) (2024-06-18T22:53:15Z) - VR-GPT: Visual Language Model for Intelligent Virtual Reality Applications [2.5022287664959446]
本研究では,VR環境における視覚言語モデルを用いたユーザインタラクションとタスク効率向上のための先駆的アプローチを提案する。
本システムは,視覚的テキスト命令に頼ることなく,自然言語処理によるリアルタイム・直感的なユーザインタラクションを支援する。
論文 参考訳(メタデータ) (2024-05-19T12:56:00Z) - Agent AI: Surveying the Horizons of Multimodal Interaction [83.18367129924997]
エージェントAI(Agent AI)とは、視覚刺激や言語入力、その他の環境データを知覚できる対話型システムである。
我々は,バーチャルリアリティやシミュレートされたシーンを容易に作成し,仮想環境内に具体化されたエージェントと対話できる未来を構想する。
論文 参考訳(メタデータ) (2024-01-07T19:11:18Z) - Prompt-to-OS (P2OS): Revolutionizing Operating Systems and
Human-Computer Interaction with Integrated AI Generative Models [10.892991111926573]
本稿では,従来のオペレーティングシステムの概念に革命をもたらす,人間とコンピュータのインタラクションのためのパラダイムを提案する。
この革新的なフレームワークでは、マシンに発行されるユーザリクエストは、生成AIモデルの相互接続エコシステムによって処理される。
このビジョンの概念は、プライバシ、セキュリティ、信頼性、生成モデルの倫理的利用など、重要な課題を提起する。
論文 参考訳(メタデータ) (2023-10-07T17:16:34Z) - Let's Give a Voice to Conversational Agents in Virtual Reality [2.7470819871568506]
仮想環境における対話型エージェントの開発を簡略化する目的で,オープンソースアーキテクチャを提案する。
没入型ディスプレイとVRヘッドセットの両方のためにUnityで開発されたデジタルヘルスドメインで動作する会話型プロトタイプを2つ提示する。
論文 参考訳(メタデータ) (2023-08-04T18:51:38Z) - FaceChat: An Emotion-Aware Face-to-face Dialogue Framework [58.67608580694849]
FaceChatは、感情に敏感で対面的な会話を可能にするWebベースの対話フレームワークである。
システムには、カウンセリング、感情サポート、パーソナライズされたカスタマーサービスなど、幅広い潜在的なアプリケーションがある。
論文 参考訳(メタデータ) (2023-03-08T20:45:37Z) - Multimodal Emotion Recognition using Transfer Learning from Speaker
Recognition and BERT-based models [53.31917090073727]
本稿では,音声とテキストのモダリティから,伝達学習モデルと微調整モデルとを融合したニューラルネットワークによる感情認識フレームワークを提案する。
本稿では,対話型感情的モーションキャプチャー・データセットにおけるマルチモーダル・アプローチの有効性を評価する。
論文 参考訳(メタデータ) (2022-02-16T00:23:42Z) - VIRT: Improving Representation-based Models for Text Matching through
Virtual Interaction [50.986371459817256]
本稿では,VIRT と呼ばれる新しいtextitVirtual InteRacTion 機構を提案する。
VIRTは、表現ベースのエンコーダに、対話ベースのモデルのように振舞いを模倣する仮想インタラクションを実行するよう要求する。
論文 参考訳(メタデータ) (2021-12-08T09:49:28Z) - Can You be More Social? Injecting Politeness and Positivity into
Task-Oriented Conversational Agents [60.27066549589362]
人間エージェントが使用する社会言語は、ユーザーの応答性の向上とタスク完了に関連しています。
このモデルは、ソーシャル言語理解要素で拡張されたシーケンスからシーケンスまでのディープラーニングアーキテクチャを使用する。
人的判断と自動言語尺度の両方を用いたコンテンツ保存と社会言語レベルの評価は,エージェントがより社会的に適切な方法でユーザの問題に対処できる応答を生成できることを示している。
論文 参考訳(メタデータ) (2020-12-29T08:22:48Z) - SPA: Verbal Interactions between Agents and Avatars in Shared Virtual
Environments using Propositional Planning [61.335252950832256]
SPA(Sense-Plan-Ask)は、仮想的な仮想環境において、仮想的な人間のようなエージェントとユーザアバターの間の言語的対話を生成する。
提案アルゴリズムは実行時コストを小さくし,自然言語通信を利用せずにエージェントよりも効率的に目標を達成できることが判明した。
論文 参考訳(メタデータ) (2020-02-08T23:15:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。