論文の概要: Better Adherence, Richer Context: A Field Evaluation of LLM-Powered Conversational Voice Diaries for Sleep
- arxiv url: http://arxiv.org/abs/2606.18596v1
- Date: Wed, 17 Jun 2026 01:46:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 17:16:50.959542
- Title: Better Adherence, Richer Context: A Field Evaluation of LLM-Powered Conversational Voice Diaries for Sleep
- Title(参考訳): より親和性, よりリッチな文脈:睡眠のためのLLMを用いた会話音声日記のフィールド評価
- Authors: Amama Mahmood, Bokyung Kim, Honghao Zhao, Molly E. Atwood, Luis F. Buenaver, Michael T. Smith, Chien-Ming Huang,
- Abstract要約: 睡眠日記は不眠症に対する行動医学と認知行動療法の中心である。
LLMを用いた会話音声日記を設計し, 臨床症状のある朝と夜の睡眠日記の質問に回答した。
- 参考スコア(独自算出の注目度): 3.088036471252577
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Sleep diaries are central to behavioral sleep medicine and cognitive behavioral therapy for insomnia, yet daily completion is difficult to sustain, and static forms often provide limited context for interpreting night-to-night sleep variation. We designed an LLM-powered conversational voice diary that delivers clinically grounded morning and evening sleep diary questions through proactive smart-speaker prompts, structured conversational intake, and adaptive follow-up dialogue. We evaluated the system in a four-week between-subjects field study with 30 university students, comparing it with a text-based mobile diary using matched diary items, reporting windows, and reminder intervals. Compared with the text-based diary, the conversational voice diary showed higher adherence and elicited more detailed contextual self-report about routines, stressors, environmental conditions, and other sleep-related factors. Participants also described the voice diary as easier to integrate into daily routines, despite longer perceived completion time. However, voice-based conversational intake produced lower completeness for some structured diary fields, revealing a trade-off between expressive richness and structured precision. These findings show both the promise and the challenge of using LLM-powered conversational voice assistants for longitudinal health self-report.
- Abstract(参考訳): 睡眠日記は、不眠症に対する行動医学や認知行動療法の中心であるが、日常的な完遂は維持が困難であり、静的な形態は、夜と夜の睡眠変動を解釈するための限られた文脈を提供することが多い。
LLMを利用した会話音声日記を設計し, 早朝と夜の睡眠日記の質問に対して, プロアクティブなスマートスピーカープロンプト, 構造化された会話摂取, 適応的なフォローアップ対話を通じて, 臨床的に根拠づけた。
本研究は,30人の大学生を対象に4週間のフィールドスタディで評価し,一致した日記項目,レポートウィンドウ,リマインダー間隔を用いたテキストベースのモバイル日記と比較した。
テキストベースの日記と比較すると、会話音声日記はより順応性が高く、ルーチンやストレス、環境条件、その他の睡眠関連要因に関するより詳細な文脈的な自己報告がもたらされた。
参加者はまた、音声日記は完成時間が長いにもかかわらず、日々のルーチンに簡単に統合できると説明した。
しかし、音声による会話の取り込みは、いくつかの構造化された日記の分野において完全性が低下し、表現豊かさと構造的精度のトレードオフが明らかとなった。
以上の結果から,LLMを用いた音声アシスタントを縦断的健康管理に活用することの意義と課題が示唆された。
関連論文リスト
- VowelPrompt: Hearing Speech Emotions from Text via Vowel-level Prosodic Augmentation [34.905479321921575]
このフレームワークは、解釈可能な、きめ細かい母音レベルの韻律的手がかりで、大きな言語モデルを拡張する。
VowelPromptは、ゼロショット、微調整、クロスドメイン、クロス言語条件下で、最先端の感情認識手法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2026-02-06T00:09:14Z) - Detecting Mental Manipulation in Speech via Synthetic Multi-Speaker Dialogue [12.181747090385612]
心的操作は、他者に影響を与えるか、搾取するために、言語を戦略的に利用することである。
音声対話における心的操作検出に関する最初の研究について述べる。
少数ショットの大きな音声言語モデルと人間のアノテーションを用いて、モーダリティが検出精度と知覚にどのように影響するかを評価する。
論文 参考訳(メタデータ) (2026-01-13T09:02:08Z) - A Cocktail-Party Benchmark: Multi-Modal dataset and Comparative Evaluation Results [62.01871490859886]
第9回CHiMEチャレンジにおいて,マルチモーダルコンテキスト認識(MCoRec)の課題を紹介した。
MCoRecは、録音が説明のない、カジュアルなグループチャットに集中する、自然なマルチパーティの会話をキャプチャする。
このタスクでは、各話者のスピーチを共同で翻訳し、音声・視覚録音から各話者の会話にまとめることにより、「誰がいつ、何、誰と話をするのか?」という質問に答えるシステムが必要である。
論文 参考訳(メタデータ) (2025-10-27T12:36:43Z) - EchoMind: An Interrelated Multi-level Benchmark for Evaluating Empathetic Speech Language Models [47.41816926003011]
音声言語モデル(SLM)は、音声言語理解において大きな進歩を遂げている。
SLMが非語彙的声道を完全に知覚できるかどうかは不明であるが、感情的・文脈的要因の双方に合致する共感に反応する。
共感的対話の認知過程をシミュレートする最初の相互関連型マルチレベルベンチマークであるEchoMindを提案する。
論文 参考訳(メタデータ) (2025-10-26T17:15:56Z) - Voice Interaction With Conversational AI Could Facilitate Thoughtful Reflection and Substantive Revision in Writing [23.89410974646694]
よく書くには、アイデアを表現するだけでなく、リフレクションによって促進されるプロセスであるリビジョンを通じてそれらを洗練する必要がある。
近年の多モード大言語モデル(LLM)の進歩は、対話的で表現力のある音声ベースのリフレクションをサポートする新しい可能性を提供している。
音声による対話は、この会話交換を自然に促進し、高次関心事への作家の関与を促進することができると我々は主張する。
論文 参考訳(メタデータ) (2025-04-11T16:54:12Z) - IntrinsicVoice: Empowering LLMs with Intrinsic Real-time Voice Interaction Abilities [55.11130688075417]
IntrinsicVoicは、本質的なリアルタイム音声対話機能を備えたLLMである。
我々の新規アーキテクチャであるGroupFormerは、テキストシーケンスに匹敵する長さまで音声シーケンスを削減できる。
我々は,500k近い音声対音声対話を含む,メソッド500kというマルチターン音声対音声対話データセットを構築した。
論文 参考訳(メタデータ) (2024-10-09T05:04:31Z) - Reasoning in Conversation: Solving Subjective Tasks through Dialogue
Simulation for Large Language Models [56.93074140619464]
本稿では,対話シミュレーションによる主観的課題の解決に焦点を当てたRiC(Reasoning in Conversation)を提案する。
RiCのモチベーションは、チェーン・オブ・ソート・スタイルの合理性を提供するのではなく、対話をシミュレートすることで有用な文脈情報をマイニングすることである。
GPT-4、ChatGPT、OpenChatなど、APIベースのLLMとオープンソースのLLMの両方を12のタスクで評価する。
論文 参考訳(メタデータ) (2024-02-27T05:37:10Z) - A Sliding-Window Approach to Automatic Creation of Meeting Minutes [66.39584679676817]
会議の議事録には、議論された問題、決定、会議での行動が記録されている。
会議時間の自動生成のためのスライディングウインドウ手法を提案する。
長い写本や文書構造の欠如など、発話テキストの性質に関連する問題に取り組むことを目指しています。
論文 参考訳(メタデータ) (2021-04-26T02:44:14Z) - MultiQT: Multimodal Learning for Real-Time Question Tracking in Speech [4.384576489684272]
本稿では,音声中のリアルタイムシーケンスラベリングに対する新しいアプローチを提案する。
本モデルでは、音声とそれ自身のテキスト表現を2つの異なるモダリティまたはビューとして扱う。
テキストや音声のみと比較して,2つのモードから共同学習を行うことで大きな効果が得られた。
論文 参考訳(メタデータ) (2020-05-02T12:16:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。