論文の概要: Predicting Cognitive Load from Speech and Interaction Dynamics in Dyadic Conversations
- arxiv url: http://arxiv.org/abs/2606.12971v1
- Date: Thu, 11 Jun 2026 07:05:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-12 15:55:27.627964
- Title: Predicting Cognitive Load from Speech and Interaction Dynamics in Dyadic Conversations
- Title(参考訳): 対話における音声からの認知的負荷予測と対話のダイナミクス
- Authors: Tahiya Chowdhury,
- Abstract要約: 音声から認知負荷を推定することは、制御された実験室で主に研究されている。
我々は,9つの協調作業を行う53のダイアドから音声を分析し,静的音響,動的,対話的特徴を抽出し,2つの頭部Gated Recurrent Unitエンコーダを訓練する。
その結果、会話の相互作用は、時間的プレッシャー、メンタルワーク、努力、タスクパフォーマンスに関連する認知的負荷を予測するのに有用な信号であることが示された。
- 参考スコア(独自算出の注目度): 5.53329677986653
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Estimating cognitive load from speech has largely been studied in controlled laboratory settings, with limited understanding of its reliability in natural collaborative conversations. We investigate whether speech and interaction dynamics predict perceived cognitive load during dyadic conversations. We analyze audio from 53 dyads performing nine collaborative tasks and extract static acoustic, dynamic, and interaction features to train a two-head Gated Recurrent Unit encoder to predict cognitive load scores. Results show conversational interaction provides useful signals for predicting cognitive load related to time pressure, mental work, effort, and task performance. Temporal demand is associated with turn-taking dynamics such as overlap and speaker switch, while mental demand is linked to imbalanced participation between speakers. These findings highlight the importance of task structure and conversational interaction for modeling cognitive load in natural collaborative settings.
- Abstract(参考訳): 音声から認知負荷を推定する手法は, 制御された実験室環境において主に研究されており, 自然な協調会話における信頼性を限定的に理解している。
音声と対話のダイナミクスがダイアディック会話における認知的負荷を予測するかどうかを検討する。
我々は,9つの協調作業を行う53のダイアドから音声を分析し,静的音響,動的,対話的特徴を抽出し,認知負荷の予測のために2つの頭部Gated Recurrent Unitエンコーダを訓練する。
その結果、会話の相互作用は、時間的プレッシャー、メンタルワーク、努力、タスクパフォーマンスに関連する認知的負荷を予測するのに有用な信号であることが示された。
時間的需要は重なり合いや話者スイッチのようなターンテイクのダイナミクスと関連付けられ、一方精神的な需要は話者間の不均衡な参加と関連している。
これらの知見は,自然協調環境における認知負荷のモデル化におけるタスク構造と対話的相互作用の重要性を浮き彫りにした。
関連論文リスト
- The Silent Thought: Modeling Internal Cognition in Full-Duplex Spoken Dialogue Models via Latent Reasoning [76.96796481909581]
内部認知処理は高品質な応答の定式化に役立っている。
本稿では,音声認識と同時に潜在的思考を行うFLAIRという新しい手法を提案する。
我々のアプローチは音声対話システムとシームレスに一致している。
論文 参考訳(メタデータ) (2026-03-18T15:30:29Z) - Acoustic and Facial Markers of Perceived Conversational Success in Spontaneous Speech [0.0]
本研究では,対話のダイナミクスが対話の質とどのように関連しているかを調べるために,自発的なZoom会話の大規模コーパスを分析した。
その結果, 自発音声で確実に検出され, 高い評価が得られた。
論文 参考訳(メタデータ) (2026-03-03T19:11:38Z) - Hear You in Silence: Designing for Active Listening in Human Interaction with Conversational Agents Using Context-Aware Pacing [17.874659591744486]
会話エージェント(CA)の設計において「アクティブリスニング」は見過ごされる
提案手法は, 反射サイレンス, ファシリテートサイレンス, 共感サイレンス, ホールディングスペース, 即時応答の5つである。
この研究は、コンテキスト認識のペアリングのような人間の会話からの洞察が、より共感的な人間とAIコミュニケーションの設計を促進する方法を示している。
論文 参考訳(メタデータ) (2026-02-05T19:08:06Z) - Chronological Thinking in Full-Duplex Spoken Dialogue Language Models [66.84843878538207]
時系列思考は、完全なSDLMの応答品質を改善することを目的としている。
追加のレイテンシがない: ユーザが話すのをやめると、エージェントは考えるのをやめ、それ以上の遅延なしに話し始める。
結果: 客観的指標と人的評価の両面から, 時系列思考の有効性を示す実験を行った。
論文 参考訳(メタデータ) (2025-10-02T10:28:11Z) - Relational Dissonance in Human-AI Interactions: The Case of Knowledge Work [4.678160092569168]
人為的な会話エージェントに固有の基本的なオントロジ的・リレーショナルなあいまいさは、個人がそれらに対して一貫したリレーショナルなスタンスを維持するのを困難にしている。
以上の結果から,このようなエージェントに対する人々の明瞭な姿勢は,インタラクション中に発生する関係力学とはしばしば異なることが示唆された。
本稿では,研究者,デザイナー,政策立案者の緊張感の認識を支援するために,関係不協和の概念を提案する。
論文 参考訳(メタデータ) (2025-09-19T10:15:55Z) - Exploring neural oscillations during speech perception via surrogate gradient spiking neural networks [59.38765771221084]
本稿では、ディープラーニングフレームワークと互換性があり、スケーラブルな、生理学的にインスパイアされた音声認識アーキテクチャを提案する。
本研究では, 終末から終末までの勾配降下訓練が, 中枢スパイク神経ネットワークにおける神経振動の出現に繋がることを示す。
本研究は, スパイク周波数適応やリカレント接続などのフィードバック機構が, 認識性能を向上させるために, 神経活動の調節と同期に重要な役割を担っていることを明らかにする。
論文 参考訳(メタデータ) (2024-04-22T09:40:07Z) - Dyadic Interaction Modeling for Social Behavior Generation [6.626277726145613]
ダイアディックインタラクションにおける3次元顔の動きを効果的に生成するための枠組みを提案する。
私たちのフレームワークの中心は、事前トレーニングアプローチであるDydic Interaction Modeling(DIM)です。
実験は、リスナー動作の生成において、我々のフレームワークが優れていることを示す。
論文 参考訳(メタデータ) (2024-03-14T03:21:33Z) - Co-Located Human-Human Interaction Analysis using Nonverbal Cues: A
Survey [71.43956423427397]
本研究の目的は,非言語的キューと計算手法を同定し,効果的な性能を実現することである。
この調査は、最も広い範囲の社会現象と相互作用設定を巻き込むことによって、相手と異なる。
もっともよく使われる非言語キュー、計算方法、相互作用環境、センシングアプローチは、それぞれマイクとカメラを備えた3,4人で構成される会話活動、ベクターマシンのサポート、ミーティングである。
論文 参考訳(メタデータ) (2022-07-20T13:37:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。