論文の概要: Decoding Workload and Agreement From EEG During Spoken Dialogue With Conversational AI
- arxiv url: http://arxiv.org/abs/2601.05825v1
- Date: Fri, 09 Jan 2026 14:59:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-12 17:41:49.990424
- Title: Decoding Workload and Agreement From EEG During Spoken Dialogue With Conversational AI
- Title(参考訳): 会話型AIと対話中の脳波からのワークロードとアグリーメントのデコード
- Authors: Lucija Mihić Zidar, Philipp Wicke, Praneel Bhatia, Rosa Lutz, Marius Klug, Thorsten O. Zander,
- Abstract要約: 本稿では,精神労働負荷と暗黙的合意のための確立された脳波分類器を,音声による人間-AI対話に転送できるかどうかを検討する。
Spelling Beeタスクと文補完タスクの2つの会話パラダイムと、単語レベルの会話イベントの書き起こし、注釈付け、調整のためのエンドツーエンドパイプラインを導入する。
- 参考スコア(独自算出の注目度): 4.8791534661065805
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Passive brain-computer interfaces offer a potential source of implicit feedback for alignment of large language models, but most mental state decoding has been done in controlled tasks. This paper investigates whether established EEG classifiers for mental workload and implicit agreement can be transferred to spoken human-AI dialogue. We introduce two conversational paradigms - a Spelling Bee task and a sentence completion task- and an end-to-end pipeline for transcribing, annotating, and aligning word-level conversational events with continuous EEG classifier output. In a pilot study, workload decoding showed interpretable trends during spoken interaction, supporting cross-paradigm transfer. For implicit agreement, we demonstrate continuous application and precise temporal alignment to conversational events, while identifying limitations related to construct transfer and asynchronous application of event-based classifiers. Overall, the results establish feasibility and constraints for integrating passive BCI signals into conversational AI systems.
- Abstract(参考訳): 受動的脳-コンピュータインタフェースは、大きな言語モデルのアライメントに対する暗黙のフィードバックの潜在的な源を提供するが、ほとんどの精神状態復号は制御されたタスクで行われている。
本稿では,精神労働負荷と暗黙的合意のための確立された脳波分類器を,音声による人間-AI対話に転送できるかどうかを検討する。
本稿では,2つの会話パラダイム – Spelling Bee タスクと文補完タスク – と,単語レベルの会話イベントを連続的なEEG分類器出力で書き起こし,注釈付け,調整するためのエンドツーエンドパイプライン – を導入する。
実験的検討では, 作業負荷の復号化は音声対話における解釈可能な傾向を示し, パラダイム間移動をサポートした。
暗黙的な合意のために、コンストラクト転送とイベントベース分類器の非同期適用に関する制約を特定しながら、連続的な適用と会話イベントの正確な時間的アライメントを示す。
全体としては、受動的BCI信号を対話型AIシステムに統合するための実現可能性と制約を確立する。
関連論文リスト
- Enabling Conversational Behavior Reasoning Capabilities in Full-Duplex Speech [15.41279444168073]
我々は,このプロセスをグラフ・オブ・ソート(GoT)内の因果推論としてモデル化することで,会話行動に対する推論を可能にするフレームワークを導入する。
我々は、制御可能でイベントリッチなシミュレーションと、有意な有理数と実際の会話音声とを組み合わせたハイブリッドコーパスを開発する。
GoTフレームワークは、ストリーミング予測を進化グラフとして構成し、マルチモーダルトランスフォーマーが次の音声行為を予測することを可能にする。
論文 参考訳(メタデータ) (2025-12-25T15:00:50Z) - OmniFlatten: An End-to-end GPT Model for Seamless Voice Conversation [53.7173034249361]
エンド・ツー・エンドのGPTベースモデルであるOmniFlattenは、低レイテンシで自然な会話に固有の複雑な振る舞いを効果的にモデル化することができる。
提案手法は, 簡便なモデリング手法と, より効率的かつ自然な対話システムを構築するための研究の方向性を提供する。
論文 参考訳(メタデータ) (2024-10-23T11:58:58Z) - Large Language Model Based Generative Error Correction: A Challenge and Baselines for Speech Recognition, Speaker Tagging, and Emotion Recognition [110.8431434620642]
生成音声の書き起こし誤り訂正(GenSEC)の課題について紹介する。
この課題は、(i)ASR後の転写補正、(ii)話者タグ付け、(iii)感情認識という、3つのASR後の言語モデリングタスクを含む。
本稿では,ベースライン評価から得られた知見と,今後の評価設計における教訓について論じる。
論文 参考訳(メタデータ) (2024-09-15T16:32:49Z) - DiscreteSLU: A Large Language Model with Self-Supervised Discrete Speech Units for Spoken Language Understanding [51.32965203977845]
本稿では,連続的な音声エンコーダ出力の代わりに離散音声単位(DSU)を用いることを提案する。
提案モデルでは, 未知領域からの音声入力に対する頑健な性能と, 音声質問応答における指示追従能力を示す。
この結果から,ASRタスクとデータセットは,音声質問応答タスクの指導訓練に必須ではないことが示唆された。
論文 参考訳(メタデータ) (2024-06-13T17:28:13Z) - System-Initiated Transitions from Chit-Chat to Task-Oriented Dialogues
with Transition Info Extractor and Transition Sentence Generator [4.714297769572548]
チャットから始まる対話シナリオについて検討するが、最終的にはタスク関連サービスに切り替える。
統合対話モデルは、チャットとタスク指向対話の両方に関わり得るが、対話モード遷移の間は主導権を握る。
論文 参考訳(メタデータ) (2023-08-06T12:25:22Z) - Does Collaborative Human-LM Dialogue Generation Help Information
Extraction from Human Dialogues? [55.28340832822234]
実際のアプリケーションにおける人間の対話の問題解決は、既存のWizard-of-Ozコレクションよりもはるかに複雑である。
本稿では,リアルな対話を合成できる人間間対話生成フレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-13T20:02:50Z) - Discourse-Aware Emotion Cause Extraction in Conversations [21.05202596080196]
会話における感情的原因抽出(ECEC)は、会話における感情的原因を含む発話を抽出することを目的としている。
本稿では,この課題に対する談話認識モデル(DAM)を提案する。
ベンチマークコーパスの結果、DAMは文学における最先端システム(SOTA)よりも優れていた。
論文 参考訳(メタデータ) (2022-10-26T02:11:01Z) - Back to the Future: Bidirectional Information Decoupling Network for
Multi-turn Dialogue Modeling [80.51094098799736]
ユニバーサル対話エンコーダとして双方向情報デカップリングネットワーク(BiDeN)を提案する。
BiDeNは過去と将来の両方のコンテキストを明示的に取り入れており、幅広い対話関連のタスクに一般化することができる。
異なる下流タスクのデータセットに対する実験結果は、我々のBiDeNの普遍性と有効性を示している。
論文 参考訳(メタデータ) (2022-04-18T03:51:46Z) - TOD-DA: Towards Boosting the Robustness of Task-oriented Dialogue
Modeling on Spoken Conversations [24.245354500835465]
本稿では,音声対話におけるタスク指向対話モデリングの堅牢性を高めるために,新しいモデルに依存しないデータ拡張パラダイムを提案する。
本手法は,音声対話におけるタスク指向対話モデリングのベンチマークであるDSTC10 Track2の両タスクにおいて,第1位となった。
論文 参考訳(メタデータ) (2021-12-23T10:04:25Z) - TOD-BERT: Pre-trained Natural Language Understanding for Task-Oriented
Dialogue [113.45485470103762]
本研究では,言語モデリングのためのタスク指向対話データセットを,人間とマルチターンの9つに統合する。
事前学習時の対話動作をモデル化するために,ユーザトークンとシステムトークンをマスク付き言語モデルに組み込む。
論文 参考訳(メタデータ) (2020-04-15T04:09:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。