論文の概要: HIVA: Holographic Intellectual Voice Assistant
- arxiv url: http://arxiv.org/abs/2307.05501v1
- Date: Wed, 28 Jun 2023 03:29:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-16 03:35:05.637590
- Title: HIVA: Holographic Intellectual Voice Assistant
- Title(参考訳): HIVA:ホログラフィー・インテリジェント音声アシスタント
- Authors: Ruslan Isaev, Radmir Gumerov, Gulzada Esenalieva, Remudin Reshid
Mekuria, Ermek Doszhanov
- Abstract要約: Holographic Intellectual Voice Assistant (HIVA) は、視覚効果と3Dアバターを用いた人間のコンピュータインタラクションを促進することを目的としている。
HIVAは、入学、研究問題、手数料、部署、大学構造と歴史、伝道所、人事、図書館、学生生活とイベント、国と都市に関する情報など、大学に関する完全な情報を提供している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Holographic Intellectual Voice Assistant (HIVA) aims to facilitate human
computer interaction using audiovisual effects and 3D avatar. HIVA provides
complete information about the university, including requests of various
nature: admission, study issues, fees, departments, university structure and
history, canteen, human resources, library, student life and events,
information about the country and the city, etc. There are other ways for
receiving the data listed above: the university's official website and other
supporting apps, HEI (Higher Education Institution) official social media,
directly asking the HEI staff, and other channels. However, HIVA provides the
unique experience of "face-to-face" interaction with an animated 3D mascot,
helping to get a sense of 'real-life' communication. The system includes many
sub-modules and connects a family of applications such as mobile applications,
Telegram chatbot, suggestion categorization, and entertainment services. The
Voice assistant uses Russian language NLP models and tools, which are pipelined
for the best user experience.
- Abstract(参考訳): Holographic Intellectual Voice Assistant (HIVA)は、視覚効果と3Dアバターを用いた人間のコンピュータインタラクションを促進することを目的としている。
hivaは、入学、研究問題、手数料、部門、大学構造と歴史、カンティーン、人的資源、図書館、学生生活とイベント、国と市に関する情報など、様々な性質の要求を含む、大学に関する完全な情報を提供している。
以上のデータを受信するには、大学の公式サイトやその他のサポートアプリ、HEI(Higher Education Institution)公式ソーシャルメディア、HEIスタッフに直接質問する他のチャンネルなどがある。
しかし、HIVAはアニメーション3Dマスコットとの「対面」相互作用のユニークな体験を提供し、実際のコミュニケーションの感覚を得るのに役立つ。
このシステムは、多くのサブモジュールを含み、モバイルアプリケーション、Telegramチャットボット、提案分類、エンターテイメントサービスなどのアプリケーション群を接続する。
音声アシスタントは、最高のユーザーエクスペリエンスのためにパイプライン化されたロシア語のnlpモデルとツールを使用する。
関連論文リスト
- M$^3$AV: A Multimodal, Multigenre, and Multipurpose Audio-Visual Academic Lecture Dataset [26.339836754484082]
マルチモーダル・マルチジャンル・多目的音声視覚学術講義データセット(M$3$AV)を提案する。
M$3$AVには、コンピュータ科学、数学、医学、生物学に関する5つの情報源から367時間分のビデオがある。
スライドテキストと音声単語の高品質な人間のアノテーションにより、データセットは複数の音声視覚認識および理解タスクに使用することができる。
論文 参考訳(メタデータ) (2024-03-21T06:43:59Z) - I would love this to be like an assistant, not the teacher: a voice of the customer perspective of what distance learning students want from an Artificial Intelligence Digital Assistant [0.0]
本研究では,仮想AIデジタルアシスタント(AIDA)の設計に関する10人のオンライン・遠隔学習学生の認識について検討した。
参加者全員が、リアルタイムのアシストとクエリの解決、学術的なタスクのサポート、パーソナライゼーションとアクセシビリティのサポート、そして感情的および社会的サポートにAIツールを使用することのメリットを研究し、報告しながら、そのようなAIツールの有用性について同意した。
学生の懸念は、AIDA、データプライバシとデータ利用、運用上の課題、学術的完全性と誤用、教育の将来に関する倫理的・社会的意味に関するものである。
論文 参考訳(メタデータ) (2024-02-16T08:10:41Z) - Generative AI Perceptions: A Survey to Measure the Perceptions of
Faculty, Staff, and Students on Generative AI Tools in Academia [0.0]
ChatGPTは自然言語処理ツールで、人間のような会話ができる。
本稿では,ChatGPTが工学教育の領域に革命をもたらすかに焦点を当てる。
学生,教員,職員に対するChatGPTの効果を調査した。
論文 参考訳(メタデータ) (2023-04-21T23:08:39Z) - Hey Dona! Can you help me with student course registration? [1.8047694351309205]
学生登録では,Hey Dona(あるいは単にDona)と呼ばれるインテリジェントなパーソナルエージェントのデモを行う。
ドナは、学生登録における音声支援のための知的パーソナルエージェントとして最初の存在である。
スマートな生活とスマートな人々のスマートシティの特徴は、新しい生活方法への貢献によって、より広範な影響を与える。
論文 参考訳(メタデータ) (2023-03-21T21:37:19Z) - VATLM: Visual-Audio-Text Pre-Training with Unified Masked Prediction for
Speech Representation Learning [119.49605266839053]
VATLM (Visual-Audio-Text Language Model) を用いたクロスモーダル表現学習フレームワークを提案する。
提案したVATLMは、モダリティに依存しない情報をモデル化するために、統一されたバックボーンネットワークを使用する。
これら3つのモダリティを1つの共有セマンティック空間に統合するために、VATLMは統一トークンのマスク付き予測タスクで最適化される。
論文 参考訳(メタデータ) (2022-11-21T09:10:10Z) - AVLEN: Audio-Visual-Language Embodied Navigation in 3D Environments [60.98664330268192]
AVLEN(Audio-Visual-Language Embodied Navigationの対話型エージェント)を提案する。
AVLENの目標は、3Dビジュアルワールドをナビゲートすることでオーディオイベントをローカライズすることである。
これらの能力を実現するために、AVLENはマルチモーダル階層的な強化学習バックボーンを使用する。
論文 参考訳(メタデータ) (2022-10-14T16:35:06Z) - Video-Guided Curriculum Learning for Spoken Video Grounding [65.49979202728167]
音声言語記述から所望のビデオ断片をローカライズすることを目的とした,新たなタスクである音声ビデオグラウンドティング(SVG)を導入する。
識別音素の修正と雑音の多い音声から映像関連情報を抽出するために,新しいビデオ指導カリキュラム学習(VGCL)を開発した。
さらに,ActivityNetをベースとした,最初の大規模音声グラウンドデータセットを収集する。
論文 参考訳(メタデータ) (2022-09-01T07:47:01Z) - Neural Approaches to Conversational Information Retrieval [94.77863916314979]
会話情報検索(CIR)システムは、会話インタフェースを備えた情報検索(IR)システムである。
近年のディープラーニングの進歩により、自然言語処理(NLP)と会話型AIが大幅に改善されている。
この本は、ここ数年で開発された神経アプローチに焦点を当てた、CIRの最近の進歩を調査します。
論文 参考訳(メタデータ) (2022-01-13T19:04:59Z) - ViDA-MAN: Visual Dialog with Digital Humans [50.218369825060876]
音声要求が与えられた場合、ViDA-MANは秒以下のレイテンシで高品質なビデオに応答することができる。
ViDA-MANは、大きな知識ベースを基盤として、チキンチャット、天気予報、デバイス制御、ニュースレコメンデーション、ホテルの予約、構造化された知識による質問に答えるなど、さまざまなトピックについてユーザーとチャットすることができる。
論文 参考訳(メタデータ) (2021-10-26T03:23:51Z) - Vyaktitv: A Multimodal Peer-to-Peer Hindi Conversations based Dataset
for Personality Assessment [50.15466026089435]
本稿では,ピアツーピアのHindi会話データセットであるVyaktitvを提案する。
参加者の高品質な音声とビデオの録音と、会話ごとにヒングリッシュのテキストによる書き起こしで構成されている。
データセットには、収入、文化的指向など、すべての参加者のための豊富な社会デコグラフィー的特徴が含まれています。
論文 参考訳(メタデータ) (2020-08-31T17:44:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。