論文の概要: Challenges and Opportunities for the Design of Smart Speakers
- arxiv url: http://arxiv.org/abs/2306.05741v1
- Date: Fri, 9 Jun 2023 08:18:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-12 14:06:40.477753
- Title: Challenges and Opportunities for the Design of Smart Speakers
- Title(参考訳): スマートスピーカー設計への挑戦と機会
- Authors: Tao Long, Lydia B. Chilton
- Abstract要約: これらのデバイスが市場の成長とVUI研究の本体に反映される可能性にもかかわらず、この技術はいまだにあまり使われていない、といううわさがある。
本稿は,VUI設計ガイドライン127点を5つのテーマに分類・合成するために,35の論文の体系的な文献レビューを行った。
我々は15名のスマートスピーカーユーザに対して,その使用状況と非使用状況を理解するため,半構造化インタビューを行った。
- 参考スコア(独自算出の注目度): 7.868449549351487
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Advances in voice technology and voice user interfaces (VUIs) -- such as
Alexa, Siri, and Google Home -- have opened up the potential for many new types
of interaction. However, despite the potential of these devices reflected by
the growing market and body of VUI research, there is a lingering sense that
the technology is still underused. In this paper, we conducted a systematic
literature review of 35 papers to identify and synthesize 127 VUI design
guidelines into five themes. Additionally, we conducted semi-structured
interviews with 15 smart speaker users to understand their use and non-use of
the technology. From the interviews, we distill four design challenges that
contribute the most to non-use. Based on their (non-)use, we identify four
opportunity spaces for designers to explore such as focusing on information
support while multitasking (cooking, driving, childcare, etc), incorporating
users' mental models for smart speakers, and integrating calm design
principles.
- Abstract(参考訳): Alexa、Siri、Google Homeといった音声技術と音声ユーザーインターフェース(VUI)の進歩は、多くの新しいタイプのインタラクションの可能性を広げている。
しかし、これらのデバイスが市場やVUI研究の本体に反映される可能性にもかかわらず、この技術はいまだに過小評価されている。
本稿では,35の論文を体系的にレビューし,127のvui設計ガイドラインを5つのテーマに分類した。
さらに,この技術の利用状況と利用方法を理解するため,スマートスピーカー利用者15人と半構造化インタビューを行った。
インタビューでは,非利用に最も貢献する4つの設計課題を抽出した。
彼らの(非)使用状況に基づいて、マルチタスク(料理、運転、育児など)中の情報サポートにフォーカスすること、スマートスピーカーにユーザのメンタルモデルを統合すること、落ち着いた設計原則を統合することなど、デザイナーが探求する4つの機会空間を特定します。
関連論文リスト
- Vinci: A Real-time Embodied Smart Assistant based on Egocentric Vision-Language Model [49.90916095152366]
我々は、エゴセントリックな視覚言語モデルに基づいて構築されたリアルタイムエンボディ型スマートアシスタントであるVinciを紹介する。
ヴィンチは「常に」モードで動作し、環境を継続的に観察してシームレスな相互作用と補助を提供する。
我々は、アップロードされたビデオをテストするためのデモWebプラットフォームとともに、デバイス開発のための完全な実装をリリースする。
論文 参考訳(メタデータ) (2024-12-30T16:57:05Z) - Survey of User Interface Design and Interaction Techniques in Generative AI Applications [79.55963742878684]
我々は,デザイナやディベロッパの参照として使用できる,さまざまなユーザインタラクションパターンのコンペレーションを作ることを目指している。
また、生成AIアプリケーションの設計についてもっと学ぼうとする人たちの参入障壁を低くしようと努力しています。
論文 参考訳(メタデータ) (2024-10-28T23:10:06Z) - Roadmap towards Superhuman Speech Understanding using Large Language Models [60.57947401837938]
大規模言語モデル(LLM)は、音声データと音声データを統合したものである。
GPT-4oのような最近の進歩は、エンドツーエンドのLLMの可能性を強調している。
本稿では,基本自動音声認識(ASR)から高度な超人モデルまで,5段階のロードマップを提案する。
論文 参考訳(メタデータ) (2024-10-17T06:44:06Z) - A Design Space for Intelligent and Interactive Writing Assistants [55.9780345526642]
タスク、ユーザ、テクノロジ、インタラクション、エコシステムの5つの側面について調べる。
各側面において、115の論文を体系的にレビューすることで、次元(アスペクトの基本成分)と符号(各次元の潜在的なオプション)を定義する。
私たちのデザインスペースは、研究者やデザイナーに、アシスタントを書く様々な可能性について、ナビゲートし、理解し、比較するための実用的なツールを提供することを目的としています。
論文 参考訳(メタデータ) (2024-03-21T04:03:16Z) - Driving Towards Inclusion: A Systematic Review of AI-powered Accessibility Enhancements for People with Disability in Autonomous Vehicles [4.080497848091375]
本稿では,自律走行車(AV)と自律走行車(自律走行車)における包括的ヒューマンコンピュータインタラクション(HCI)について検討する。
議論されている主な技術は、脳-コンピュータインターフェース、人為的相互作用、仮想現実、拡張現実、モード適応、音声アクティベートインターフェース、触覚フィードバックなどである。
これらの知見に基づいて,多様なユーザ層にまたがるアクセシビリティ要件に対処するエンドツーエンドの設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-26T00:06:08Z) - End-to-end Spoken Conversational Question Answering: Task, Dataset and
Model [92.18621726802726]
音声による質問応答では、システムは関連する音声書き起こしの中に連続したテキストスパンからの質問に答えるように設計されている。
本稿では,複雑な対話フローをモデル化することを目的とした音声対話型質問応答タスク(SCQA)を提案する。
本研究の目的は,音声記録に基づく対話型質問に対処するシステムを構築することであり,情報収集システムによる様々なモダリティからより多くの手がかりを提供する可能性を探ることである。
論文 参考訳(メタデータ) (2022-04-29T17:56:59Z) - SpeechBrain: A General-Purpose Speech Toolkit [73.0404642815335]
SpeechBrainはオープンソースでオールインワンの音声ツールキットである。
ニューラル音声処理技術の研究開発を促進するために設計された。
幅広い音声ベンチマークにおいて、競争力や最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-06-08T18:22:56Z) - Intelligent Conversational Android ERICA Applied to Attentive Listening
and Job Interview [41.789773897391605]
我々はインテリジェントな会話型android ericaを開発した。
ERICAには,注意深い聞き取り,就職面接,スピードデートなど,いくつかのソーシャルインタラクションタスクを設定した。
40人の高齢者が会話を分解することなく5~7分間の会話を行ったことが評価されている。
論文 参考訳(メタデータ) (2021-05-02T06:37:23Z) - Towards Tool-Support for Interactive-Machine Learning Applications in
the Android Ecosystem [0.0]
機械学習モデルの実装、テスト、デプロイの課題に対処するには、AIエンジニアのためのツールサポートが必要であると考えています。
本稿では,AI技術者へのインタビューや,スマートウォッチとスマートフォンを用いた対話型機械学習ユースケースの実験を含む,一連の質問の予備的結果を示す。
論文 参考訳(メタデータ) (2021-03-27T09:28:40Z) - Exploration of Voice User Interfaces for Older Adults - A Pilot Study to
Address Progressive Vision Loss [6.94155967798386]
音声ユーザインタフェース(VUI)は、ますます直感的で機能的になってきている。
VUIは情報通信技術(ICT)ソリューションへのアクセスに関わる障壁を取り除くため、特に高齢者には特別なニーズがある。
論文 参考訳(メタデータ) (2020-12-31T18:58:32Z) - Conversational User Interfaces for Blind Knowledge Workers: A Case Study [0.0]
タッチ面の制御を用いたオフィス機器のインタフェース設計の最近のトレンドは、視覚障害者や視覚障害者にとってより大きな障害を生み出している。
本研究は,多機能プリンタのアクセシビリティのための対話型ユーザインタフェースを開発するための事例研究である。
論文 参考訳(メタデータ) (2020-06-13T00:27:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。