Fugu-MT 論文翻訳(概要): SAPIEN: Affective Virtual Agents Powered by Large Language Models

論文の概要: SAPIEN: Affective Virtual Agents Powered by Large Language Models

arxiv url: http://arxiv.org/abs/2308.03022v1
Date: Sun, 6 Aug 2023 05:13:16 GMT
ステータス: 翻訳完了
システム内更新日: 2023-08-08 17:09:13.080154
Title: SAPIEN: Affective Virtual Agents Powered by Large Language Models
Title（参考訳）: SAPIEN: 大規模言語モデルによる影響のある仮想エージェント
Authors: Masum Hasan, Cengiz Ozel, Sammy Potter and Ehsan Hoque
Abstract要約: 我々は,大規模言語モデルによって駆動される高忠実度仮想エージェントのためのプラットフォームであるSAPIENを紹介する。このプラットフォームでは、仮想エージェントのパーソナリティ、バックグラウンド、会話の前提をカスタマイズすることができる。仮想会議の後、ユーザーは会話を分析し、コミュニケーションスキルに対して実行可能なフィードバックを受け取ることができる。
参考スコア（独自算出の注目度）: 2.423280064224919
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In this demo paper, we introduce SAPIEN, a platform for high-fidelity virtual agents driven by large language models that can hold open domain conversations with users in 13 different languages, and display emotions through facial expressions and voice. The platform allows users to customize their virtual agent's personality, background, and conversation premise, thus providing a rich, immersive interaction experience. Furthermore, after the virtual meeting, the user can choose to get the conversation analyzed and receive actionable feedback on their communication skills. This paper illustrates an overview of the platform and discusses the various application domains of this technology, ranging from entertainment to mental health, communication training, language learning, education, healthcare, and beyond. Additionally, we consider the ethical implications of such realistic virtual agent representations and the potential challenges in ensuring responsible use.
Abstract（参考訳）: このデモでは,13の異なる言語でオープンドメインの会話を行ない,表情や音声で感情を表示できる,大規模言語モデルによる高忠実度仮想エージェントのためのプラットフォームであるsapienを紹介する。このプラットフォームでは、仮想エージェントのパーソナリティ、バックグラウンド、会話の前提をカスタマイズすることができ、リッチで没入的なインタラクションエクスペリエンスを提供する。さらに、仮想会議の後、ユーザは会話の分析を受け取り、コミュニケーションスキルに対するアクション可能なフィードバックを受け取ることができる。本稿ではプラットフォームの概要を説明し,エンタテインメントからメンタルヘルス,コミュニケーショントレーニング,言語学習,教育,医療など,この技術のさまざまな応用領域について論じる。さらに、このような現実的な仮想エージェント表現の倫理的意味と、責任ある使用を確保する上での潜在的な課題についても考察する。

関連論文リスト

Seamless Interaction: Dyadic Audiovisual Motion Modeling and Large-Scale Dataset [113.25650486482762]
4000時間以上の対面インタラクション映像の大規模な収集であるSeamless Interactionデータセットを紹介した。このデータセットは、ダイドの具体的ダイナミクスを理解するAIテクノロジの開発を可能にする。そこで我々は,このデータセットを用いて,人間の発話に適応した動作ジェスチャーと表情を生成するモデル群を開発した。
論文参考訳（メタデータ） (2025-06-27T18:09:49Z)
Developing Enhanced Conversational Agents for Social Virtual Worlds [0.0]
この提案は、人工知能、自然言語処理、Affective Computing、ユーザーモデリングに関連するさまざまな技術を組み合わせている。本提案は,Second Life ソーシャルバーチャルワールドに展開されている会話エージェントの具体的開発に成功して評価されている。実験の結果,エージェントの対話行動は,そのような環境で対話するユーザの特定の特性に順応することがわかった。
論文参考訳（メタデータ） (2025-01-14T11:15:16Z)
RITA: A Real-time Interactive Talking Avatars Framework [6.060251768347276]
RITAは、生成モデルに基づいて構築された高品質なリアルタイム対話型フレームワークを提供する。当社のフレームワークは,ユーザのアップロードした写真からリアルタイム対話を行うデジタルアバターへの変換を可能にする。
論文参考訳（メタデータ） (2024-06-18T22:53:15Z)
VR-GPT: Visual Language Model for Intelligent Virtual Reality Applications [2.5022287664959446]
本研究では,VR環境における視覚言語モデルを用いたユーザインタラクションとタスク効率向上のための先駆的アプローチを提案する。本システムは,視覚的テキスト命令に頼ることなく,自然言語処理によるリアルタイム・直感的なユーザインタラクションを支援する。
論文参考訳（メタデータ） (2024-05-19T12:56:00Z)
Agent AI: Surveying the Horizons of Multimodal Interaction [83.18367129924997]
エージェントAI(Agent AI)とは、視覚刺激や言語入力、その他の環境データを知覚できる対話型システムである。我々は,バーチャルリアリティやシミュレートされたシーンを容易に作成し,仮想環境内に具体化されたエージェントと対話できる未来を構想する。
論文参考訳（メタデータ） (2024-01-07T19:11:18Z)
Prompt-to-OS (P2OS): Revolutionizing Operating Systems and Human-Computer Interaction with Integrated AI Generative Models [10.892991111926573]
本稿では,従来のオペレーティングシステムの概念に革命をもたらす,人間とコンピュータのインタラクションのためのパラダイムを提案する。この革新的なフレームワークでは、マシンに発行されるユーザリクエストは、生成AIモデルの相互接続エコシステムによって処理される。このビジョンの概念は、プライバシ、セキュリティ、信頼性、生成モデルの倫理的利用など、重要な課題を提起する。
論文参考訳（メタデータ） (2023-10-07T17:16:34Z)
Let's Give a Voice to Conversational Agents in Virtual Reality [2.7470819871568506]
仮想環境における対話型エージェントの開発を簡略化する目的で,オープンソースアーキテクチャを提案する。没入型ディスプレイとVRヘッドセットの両方のためにUnityで開発されたデジタルヘルスドメインで動作する会話型プロトタイプを2つ提示する。
論文参考訳（メタデータ） (2023-08-04T18:51:38Z)
FaceChat: An Emotion-Aware Face-to-face Dialogue Framework [58.67608580694849]
FaceChatは、感情に敏感で対面的な会話を可能にするWebベースの対話フレームワークである。システムには、カウンセリング、感情サポート、パーソナライズされたカスタマーサービスなど、幅広い潜在的なアプリケーションがある。
論文参考訳（メタデータ） (2023-03-08T20:45:37Z)
Multimodal Emotion Recognition using Transfer Learning from Speaker Recognition and BERT-based models [53.31917090073727]
本稿では,音声とテキストのモダリティから,伝達学習モデルと微調整モデルとを融合したニューラルネットワークによる感情認識フレームワークを提案する。本稿では,対話型感情的モーションキャプチャー・データセットにおけるマルチモーダル・アプローチの有効性を評価する。
論文参考訳（メタデータ） (2022-02-16T00:23:42Z)
VIRT: Improving Representation-based Models for Text Matching through Virtual Interaction [50.986371459817256]
本稿では,VIRT と呼ばれる新しいtextitVirtual InteRacTion 機構を提案する。 VIRTは、表現ベースのエンコーダに、対話ベースのモデルのように振舞いを模倣する仮想インタラクションを実行するよう要求する。
論文参考訳（メタデータ） (2021-12-08T09:49:28Z)
Can You be More Social? Injecting Politeness and Positivity into Task-Oriented Conversational Agents [60.27066549589362]
人間エージェントが使用する社会言語は、ユーザーの応答性の向上とタスク完了に関連しています。このモデルは、ソーシャル言語理解要素で拡張されたシーケンスからシーケンスまでのディープラーニングアーキテクチャを使用する。人的判断と自動言語尺度の両方を用いたコンテンツ保存と社会言語レベルの評価は,エージェントがより社会的に適切な方法でユーザの問題に対処できる応答を生成できることを示している。
論文参考訳（メタデータ） (2020-12-29T08:22:48Z)
SPA: Verbal Interactions between Agents and Avatars in Shared Virtual Environments using Propositional Planning [61.335252950832256]
SPA(Sense-Plan-Ask)は、仮想的な仮想環境において、仮想的な人間のようなエージェントとユーザアバターの間の言語的対話を生成する。提案アルゴリズムは実行時コストを小さくし,自然言語通信を利用せずにエージェントよりも効率的に目標を達成できることが判明した。
論文参考訳（メタデータ） (2020-02-08T23:15:06Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。