論文の概要: Can Voice Assistants Sound Cute? Towards a Model of Kawaii Vocalics
- arxiv url: http://arxiv.org/abs/2304.12809v1
- Date: Sat, 22 Apr 2023 01:47:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-26 20:32:59.010697
- Title: Can Voice Assistants Sound Cute? Towards a Model of Kawaii Vocalics
- Title(参考訳): 音声アシスタントは可愛く聞こえるか?
川井声楽のモデルに向けて
- Authors: Katie Seaborn, Somang Nam, Julia Keckeis, Tatsuya Itagaki
- Abstract要約: かわいさ・弱さ・魅力を表す「川井」は世界的な文化輸出である。
音声アシスタント音声の音声品質を探索することで、音声が川井になるかどうかを考察する。
- 参考スコア(独自算出の注目度): 10.036312061637764
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The Japanese notion of "kawaii" or expressions of cuteness, vulnerability,
and/or charm is a global cultural export. Work has explored kawaii-ness as a
design feature and factor of user experience in the visual appearance,
nonverbal behaviour, and sound of robots and virtual characters. In this
initial work, we consider whether voices can be kawaii by exploring the vocal
qualities of voice assistant speech, i.e., kawaii vocalics. Drawing from an
age-inclusive model of kawaii, we ran a user perceptions study on the
kawaii-ness of younger- and older-sounding Japanese computer voices. We found
that kawaii-ness intersected with perceptions of gender and age, i.e., gender
ambiguous and girlish, as well as VA features, i.e., fluency and artificiality.
We propose an initial model of kawaii vocalics to be validated through the
identification and study of vocal qualities, cognitive appraisals, behavioural
responses, and affective reports.
- Abstract(参考訳): かわいさ・弱さ・魅力の表現である「カワイ」という日本の概念は、世界的な文化輸出である。
作業は、視覚的外観、非言語行動、ロボットと仮想キャラクタの音におけるユーザ体験のデザイン特徴と要因として、カワイイネスを探求してきた。
本研究は, 音声アシスタントの声質, すなわち, 声質について検討することで, 声質が河井であるかどうかを検討するものである。
本研究は, カワイイの年齢差モデルから, 若年者および高齢者のコンピュータ音声のカワイイ性について, ユーザの知覚調査を行った。
その結果, 性別や年齢, 性別があいまい, 少女的, VA的特徴, 流布性, 人工性に交差していることがわかった。
本研究では, 声質, 認知評価, 行動反応, 情緒的報告の識別, 研究を通じて検証すべき川井音声学の初期モデルを提案する。
関連論文リスト
- Coimagining the Future of Voice Assistants with Cultural Sensitivity [27.504761918190958]
日本における非西洋的文脈における共同設計VAの価値について検討する。
日本語と英語のアメリカ・コンテクストのデザインガイドラインを提供する。
論文 参考訳(メタデータ) (2024-03-26T11:09:58Z) - Seeking Soulmate via Voice: Understanding Promises and Challenges of
Online Synchronized Voice-Based Mobile Dating [25.30209978159759]
音声ベースのデートアプリ「Soul」を開発中
プロファイル情報に大きく依存する従来のプラットフォームとは異なり、Soulは音声ベースのコミュニケーションを通じてユーザーインタラクションを促進する。
本研究は,モデレーターとしての音声の役割が印象管理に影響を及ぼし,発信者と受信者の知覚に影響を及ぼすことを示す。
論文 参考訳(メタデータ) (2024-02-29T16:30:07Z) - The Manga Whisperer: Automatically Generating Transcriptions for Comics [55.544015596503726]
我々は,パネル,テキストボックス,文字ボックスを検出可能な統一モデル Magi を提案する。
本稿では,検出したテキストボックスを読み順にソートし,対話文を生成する手法を提案する。
論文 参考訳(メタデータ) (2024-01-18T18:59:09Z) - InCharacter: Evaluating Personality Fidelity in Role-Playing Agents
through Psychological Interviews [58.43874908985246]
本稿では, RPAの性格的忠実度を心理的尺度で評価するための新しい視点を紹介する。
実験には様々な種類の RPA と LLM が含まれ、14の広く使用されている心理学的尺度で32の異なる文字をカバーしている。
InCharacterでは、現在最先端のRPAが人物の人格と高度に一致した個性を示し、80.7%の精度を達成している。
論文 参考訳(メタデータ) (2023-10-27T08:42:18Z) - Does My Dog ''Speak'' Like Me? The Acoustic Correlation between Pet Dogs
and Their Human Owners [19.422796780268605]
本稿では,犬声の表情と人間の言語環境との相関性について予備的検討を行った。
われわれはまず、シバイヌの犬の声のデータセットをYouTubeから公開し、7500曲のクリーンなサウンドクリップを提供している。
分類課題と顕著な因子分析により,2つの言語環境における声道の音響的差異が顕著であることがわかった。
論文 参考訳(メタデータ) (2023-09-21T23:49:21Z) - Vocalsound: A Dataset for Improving Human Vocal Sounds Recognition [13.373579620368046]
VocalSoundのデータセットは、21,000件以上のクラウドソースによる笑い声、うさぎ声、うなり声、喉のクリアリング、くしゃみ、嗅ぎ声の録音で構成されています。
実験の結果,既存のデータセットにVocalSoundデータセットを追加することで,モデルの音声認識性能を41.9%向上させることができることがわかった。
論文 参考訳(メタデータ) (2022-05-06T18:08:18Z) - Learning the Beauty in Songs: Neural Singing Voice Beautifier [69.21263011242907]
我々は、新しいタスク、歌声美化(SVB)に興味を持っている。
アマチュア歌手の歌声を考えると、SVBは内容と声の音色を保ちながら、声のイントネーションと声のトーンを改善することを目的としている。
SVBタスクを解く最初の生成モデルであるNSVB(Neural Singing Voice Beautifier)を導入する。
論文 参考訳(メタデータ) (2022-02-27T03:10:12Z) - Perception Point: Identifying Critical Learning Periods in Speech for
Bilingual Networks [58.24134321728942]
ディープニューラルベース視覚唇読解モデルにおける認知的側面を比較し,識別する。
我々は、認知心理学におけるこれらの理論と独自のモデリングの間に強い相関関係を観察する。
論文 参考訳(メタデータ) (2021-10-13T05:30:50Z) - Few-shot Language Coordination by Modeling Theory of Mind [95.54446989205117]
我々は、数ショット$textit language coordinate$のタスクについて研究する。
リードエージェントは、言語能力の異なるエージェントの$textitpopulation$と調整する必要があります。
これは、人間のコミュニケーションの重要な構成要素であるパートナーの信念をモデル化する能力を必要とする。
論文 参考訳(メタデータ) (2021-07-12T19:26:11Z) - Protecting gender and identity with disentangled speech representations [49.00162808063399]
音声における性情報保護は,話者識別情報のモデル化よりも効果的であることを示す。
性別情報をエンコードし、2つの敏感な生体識別子を解読する新しい方法を提示する。
論文 参考訳(メタデータ) (2021-04-22T13:31:41Z) - asya: Mindful verbal communication using deep learning [0.0]
Asyaは、人間の声のスペクトルを分析するディープラーニングモデルで構成されるモバイルアプリケーションである。
モデルは、カスタマーサービスの改善、営業効果のある会話、カップルセラピーなど、さまざまな分野に適用できる。
論文 参考訳(メタデータ) (2020-08-20T13:37:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。