Fugu-MT 論文翻訳(概要): Can Voice Assistants Sound Cute? Towards a Model of Kawaii Vocalics

論文の概要: Can Voice Assistants Sound Cute? Towards a Model of Kawaii Vocalics

arxiv url: http://arxiv.org/abs/2304.12809v1
Date: Sat, 22 Apr 2023 01:47:19 GMT
ステータス: 翻訳完了
システム内更新日: 2023-04-26 20:32:59.010697
Title: Can Voice Assistants Sound Cute? Towards a Model of Kawaii Vocalics
Title（参考訳）: 音声アシスタントは可愛く聞こえるか? 川井声楽のモデルに向けて
Authors: Katie Seaborn, Somang Nam, Julia Keckeis, Tatsuya Itagaki
Abstract要約: かわいさ・弱さ・魅力を表す「川井」は世界的な文化輸出である。音声アシスタント音声の音声品質を探索することで、音声が川井になるかどうかを考察する。
参考スコア（独自算出の注目度）: 10.036312061637764
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: The Japanese notion of "kawaii" or expressions of cuteness, vulnerability, and/or charm is a global cultural export. Work has explored kawaii-ness as a design feature and factor of user experience in the visual appearance, nonverbal behaviour, and sound of robots and virtual characters. In this initial work, we consider whether voices can be kawaii by exploring the vocal qualities of voice assistant speech, i.e., kawaii vocalics. Drawing from an age-inclusive model of kawaii, we ran a user perceptions study on the kawaii-ness of younger- and older-sounding Japanese computer voices. We found that kawaii-ness intersected with perceptions of gender and age, i.e., gender ambiguous and girlish, as well as VA features, i.e., fluency and artificiality. We propose an initial model of kawaii vocalics to be validated through the identification and study of vocal qualities, cognitive appraisals, behavioural responses, and affective reports.
Abstract（参考訳）: かわいさ・弱さ・魅力の表現である「カワイ」という日本の概念は、世界的な文化輸出である。作業は、視覚的外観、非言語行動、ロボットと仮想キャラクタの音におけるユーザ体験のデザイン特徴と要因として、カワイイネスを探求してきた。本研究は, 音声アシスタントの声質, すなわち, 声質について検討することで, 声質が河井であるかどうかを検討するものである。本研究は, カワイイの年齢差モデルから, 若年者および高齢者のコンピュータ音声のカワイイ性について, ユーザの知覚調査を行った。その結果, 性別や年齢, 性別があいまい, 少女的, VA的特徴, 流布性, 人工性に交差していることがわかった。本研究では, 声質, 認知評価, 行動反応, 情緒的報告の識別, 研究を通じて検証すべき川井音声学の初期モデルを提案する。

関連論文リスト

Machine Learning Approaches to Vocal Register Classification in Contemporary Male Pop Music [49.1574468325115]
ポップミュージックでは、1人のアーティストが好みの質を達成するために様々な音色やテクスチャを使用する場合があり、歌手が使用するボーカル範囲内でのボーカルレジスタを特定することは困難である。本稿では,メル・スペクトログラム画像のテクスチャ的特徴の分析を通じて,男性ポップミュージックの音声信号に声帯を分類する2つの方法を提案する。
論文参考訳（メタデータ） (2025-05-16T15:41:28Z)
Building Trust Through Voice: How Vocal Tone Impacts User Perception of Attractiveness of Voice Assistants [5.6506553465822424]
VA音声のトーンが,その魅力と信頼性に顕著に影響を及ぼすことを示す。 VAの信頼感は,様々な声調を取り入れた思慮深い音声設計によって向上することができると結論付けた。
論文参考訳（メタデータ） (2024-09-27T17:41:18Z)
Sketching With Your Voice: "Non-Phonorealistic" Rendering of Sounds via Vocal Imitation [44.50441058435848]
人間の声の模倣を再現する手法を提案する。まず、モデルの制御パラメータを調整して、音声の模倣を生成する。人間の話者が聴取者に対して戦略的に判断する方法について,コミュニケーションの認知理論を適用した。
論文参考訳（メタデータ） (2024-09-20T13:48:48Z)
Speech After Gender: A Trans-Feminine Perspective on Next Steps for Speech Science and Technology [1.7126708168238125]
トランスフェミニンの性別確認音声教師は、話者のアイデンティティに関する現在の理解を損なう音声に対して、ユニークな視点を持っている。 VVD(Versatile Voice dataset)は,ジェンダー付き軸に沿って声を変更する3人の話者の集合体である。
論文参考訳（メタデータ） (2024-07-09T21:19:49Z)
FunAudioLLM: Voice Understanding and Generation Foundation Models for Natural Interaction Between Humans and LLMs [63.8261207950923]
FunAudioLLMは、人間と大規模言語モデル(LLM)の間の自然な音声相互作用を強化するために設計されたモデルファミリーである中心となる2つの革新的なモデルとして、多言語音声認識、感情認識、音声イベント検出を処理するSenseVoiceと、複数の言語、音色、話し方、話者識別を制御した自然言語生成を容易にするCosyVoiceがある。 SenseVoiceとCosyVoiceに関連するモデルは、GitHubでリリースされたトレーニング、推論、微調整コードとともに、ModelscopeとHuggingfaceでオープンソース化されている。
論文参考訳（メタデータ） (2024-07-04T16:49:02Z)
Kawaii Computing: Scoping Out the Japanese Notion of Cute in User Experiences with Interactive Systems [28.689320648900118]
川井コンピューティングは、人間-コンピュータインタラクション(HCI)研究および実践における「カット」という日本の概念に関する着実に成長している研究分野の新たな用語である。文化的に日本人が経験した特定の情緒的・文化的側面、すなわち、日本の社会文化的文脈によって引き起こされた河合のユーザ体験(UX)と精神モデルを指す。
論文参考訳（メタデータ） (2024-05-14T00:16:09Z)
The Manga Whisperer: Automatically Generating Transcriptions for Comics [55.544015596503726]
我々は,パネル,テキストボックス,文字ボックスを検出可能な統一モデル Magi を提案する。本稿では,検出したテキストボックスを読み順にソートし,対話文を生成する手法を提案する。
論文参考訳（メタデータ） (2024-01-18T18:59:09Z)
Does My Dog ''Speak'' Like Me? The Acoustic Correlation between Pet Dogs and Their Human Owners [19.422796780268605]
本稿では,犬声の表情と人間の言語環境との相関性について予備的検討を行った。われわれはまず、シバイヌの犬の声のデータセットをYouTubeから公開し、7500曲のクリーンなサウンドクリップを提供している。分類課題と顕著な因子分析により,2つの言語環境における声道の音響的差異が顕著であることがわかった。
論文参考訳（メタデータ） (2023-09-21T23:49:21Z)
Learning the Beauty in Songs: Neural Singing Voice Beautifier [69.21263011242907]
我々は、新しいタスク、歌声美化(SVB)に興味を持っている。アマチュア歌手の歌声を考えると、SVBは内容と声の音色を保ちながら、声のイントネーションと声のトーンを改善することを目的としている。 SVBタスクを解く最初の生成モデルであるNSVB(Neural Singing Voice Beautifier)を導入する。
論文参考訳（メタデータ） (2022-02-27T03:10:12Z)
Perception Point: Identifying Critical Learning Periods in Speech for Bilingual Networks [58.24134321728942]
ディープニューラルベース視覚唇読解モデルにおける認知的側面を比較し,識別する。我々は、認知心理学におけるこれらの理論と独自のモデリングの間に強い相関関係を観察する。
論文参考訳（メタデータ） (2021-10-13T05:30:50Z)
Protecting gender and identity with disentangled speech representations [49.00162808063399]
音声における性情報保護は,話者識別情報のモデル化よりも効果的であることを示す。性別情報をエンコードし、2つの敏感な生体識別子を解読する新しい方法を提示する。
論文参考訳（メタデータ） (2021-04-22T13:31:41Z)
asya: Mindful verbal communication using deep learning [0.0]
Asyaは、人間の声のスペクトルを分析するディープラーニングモデルで構成されるモバイルアプリケーションである。モデルは、カスタマーサービスの改善、営業効果のある会話、カップルセラピーなど、さまざまな分野に適用できる。
論文参考訳（メタデータ） (2020-08-20T13:37:49Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。