論文の概要: Predicting and Understanding Turn-Taking Behavior in Open-Ended Group Activities in Virtual Reality
- arxiv url: http://arxiv.org/abs/2407.02896v1
- Date: Wed, 3 Jul 2024 08:17:59 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-04 15:05:39.435071
- Title: Predicting and Understanding Turn-Taking Behavior in Open-Ended Group Activities in Virtual Reality
- Title(参考訳): バーチャルリアリティにおけるオープンエンディンググループ活動におけるターンタイキング行動の予測と理解
- Authors: Portia Wang, Eugy Han, Anna C. M. Queiroz, Cyan DeVeaux, Jeremy N. Bailenson,
- Abstract要約: ネットワーク型バーチャルリアリティ(VR)では、ユーザー行動、個人差、グループダイナミクスが将来の音声行動の重要なシグナルとなる。
本研究では,社会的ダイナミクスの文献から抽出した特徴を用いたターンテイク行動の予測を行う。
77セッションと1660分間の少人数のソーシャルインタラクションからなる大規模なVR教室データセットの結果について論じる。
- 参考スコア(独自算出の注目度): 0.5274644816192076
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In networked virtual reality (VR), user behaviors, individual differences, and group dynamics can serve as important signals into future speech behaviors, such as who the next speaker will be and the timing of turn-taking behaviors. The ability to predict and understand these behaviors offers opportunities to provide adaptive and personalized assistance, for example helping users with varying sensory abilities navigate complex social scenes and instantiating virtual moderators with natural behaviors. In this work, we predict turn-taking behaviors using features extracted based on social dynamics literature. We discuss results from a large-scale VR classroom dataset consisting of 77 sessions and 1660 minutes of small-group social interactions collected over four weeks. In our evaluation, gradient boosting classifiers achieved the best performance, with accuracies of 0.71--0.78 AUC (area under the ROC curve) across three tasks concerning the "what", "who", and "when" of turn-taking behaviors. In interpreting these models, we found that group size, listener personality, speech-related behavior (e.g., time elapsed since the listener's last speech event), group gaze (e.g., how much the group looks at the speaker), as well as the listener's and previous speaker's head pitch, head y-axis position, and left hand y-axis position more saliently influenced predictions. Results suggested that these features remain reliable indicators in novel social VR settings, as prediction performance is robust over time and with groups and activities not used in the training dataset. We discuss theoretical and practical implications of the work.
- Abstract(参考訳): ネットワーク型バーチャルリアリティ(VR)では、ユーザの行動、個人差、グループダイナミクスは、次の話者が誰であるか、ターンテイク行動のタイミングなど、将来の音声行動の重要なシグナルとして機能する。
これらの振る舞いを予測し、理解する能力は、適応的でパーソナライズされた支援を提供する機会を提供する。例えば、様々な感覚能力を持つユーザーが複雑な社会的シーンをナビゲートしたり、仮想モデレーターを自然な振る舞いでインスタンス化したりすることができる。
本研究では,社会的ダイナミクスの文献から抽出した特徴を用いたターンテイク行動の予測を行う。
77セッションと1660分間の少人数のソーシャルインタラクションを4週間にわたって収集した大規模VR教室データセットの結果について論じる。
評価では, 順応行動の「何」「誰」「何」「何」の3つの課題に対して, 0.71--0.78 AUC (ROC曲線下) を達成し, 最適性能を得た。
これらのモデルを解釈すると,グループサイズ,聴取者個性,発話関連行動(例えば,聴取者の最後のスピーチイベントから経過した時間),グループガウン(例えば,聴取者および過去の話者の頭部ピッチ,頭部y軸位置,左手y軸位置)が,より健康的に予測に影響を及ぼすことがわかった。
その結果、これらの機能は、予測性能が時間とともに堅牢であり、トレーニングデータセットに使用されていないグループやアクティビティを持つため、新しいソーシャルVR設定において信頼性の高い指標のままであることが示唆された。
本研究の理論的・実践的意義について論じる。
関連論文リスト
- Social Processes: Probabilistic Meta-learning for Adaptive Multiparty Interaction Forecasting [3.9134031118910264]
社会プロセス(SP)モデルを導入し、全てのグループメンバーに対して、将来のマルチモーダルキューの分布を予測する。
また,現実的な合成データセットを用いて,SPモデルの出力および潜時空間における一般化能力を解析した。
論文 参考訳(メタデータ) (2025-01-03T17:34:53Z) - Timing Matters: Enhancing User Experience through Temporal Prediction in Smart Homes [33.47304614659701]
ユーザアクションとそのタイミングを,それぞれの日付と時刻のスタンプに合わせた11kのアクションシーケンスを用いて予測する。
私たちの知る限りでは、これはスマートホームの時間予測の最初の試みだ。
すべてのデータセットで40%の精度(96クラス)、正確なタイムスタンプを含むデータセットでは80%の精度(8クラス)を実現しています。
論文 参考訳(メタデータ) (2024-11-27T19:49:11Z) - Learning Manipulation by Predicting Interaction [85.57297574510507]
本稿では,インタラクションを予測して操作を学習する一般的な事前学習パイプラインを提案する。
実験の結果,MPIは従来のロボットプラットフォームと比較して10%から64%向上していることがわかった。
論文 参考訳(メタデータ) (2024-06-01T13:28:31Z) - What Makes Pre-Trained Visual Representations Successful for Robust
Manipulation? [57.92924256181857]
照明やシーンテクスチャの微妙な変化の下では,操作や制御作業のために設計された視覚表現が必ずしも一般化されないことがわかった。
創発的セグメンテーション能力は,ViTモデルにおける分布外一般化の強い予測因子であることがわかった。
論文 参考訳(メタデータ) (2023-11-03T18:09:08Z) - Decoding the Silent Majority: Inducing Belief Augmented Social Graph
with Large Language Model for Response Forecasting [74.68371461260946]
SocialSenseは、既存のソーシャルネットワーク上に信念中心のグラフを誘導するフレームワークであり、グラフベースの伝播によって社会的ダイナミクスを捉える。
本手法は,ゼロショット設定と教師あり設定の両方に対する実験的な評価において,既存の最先端技術を超えている。
論文 参考訳(メタデータ) (2023-10-20T06:17:02Z) - Learning Action-Effect Dynamics for Hypothetical Vision-Language
Reasoning Task [50.72283841720014]
本研究では,行動の効果に関する推論を改善する新しい学習戦略を提案する。
本稿では,提案手法の有効性を実証し,性能,データ効率,一般化能力の観点から,従来のベースラインに対する優位性を論じる。
論文 参考訳(メタデータ) (2022-12-07T05:41:58Z) - Bodily Behaviors in Social Interaction: Novel Annotations and
State-of-the-Art Evaluation [0.0]
本稿では,社会相互作用に埋め込まれた複雑な身体行動の最初のアノテーションであるBBSIについて述べる。
心理学における過去の研究に基づいて,26時間の自発的な行動について手動で注釈を付けた。
我々は、人間の行動検出のための最先端のアプローチであるピラミッド拡張注意ネットワーク(PDAN)を適応する。
論文 参考訳(メタデータ) (2022-07-26T11:24:00Z) - Co-Located Human-Human Interaction Analysis using Nonverbal Cues: A
Survey [71.43956423427397]
本研究の目的は,非言語的キューと計算手法を同定し,効果的な性能を実現することである。
この調査は、最も広い範囲の社会現象と相互作用設定を巻き込むことによって、相手と異なる。
もっともよく使われる非言語キュー、計算方法、相互作用環境、センシングアプローチは、それぞれマイクとカメラを備えた3,4人で構成される会話活動、ベクターマシンのサポート、ミーティングである。
論文 参考訳(メタデータ) (2022-07-20T13:37:57Z) - Noisy Agents: Self-supervised Exploration by Predicting Auditory Events [127.82594819117753]
本稿では, エージェントが行動の因果的影響を理解することを奨励する, 強化学習(Reinforcement Learning, RL)の本質的なモチベーションを提案する。
ニューラルネットワークを用いて聴覚事象を予測し、予測誤差を本質的な報奨として利用し、RL探索を誘導する。
Atariゲームの実験結果から、我々の新しい本質的な動機は、最先端のベースラインを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2020-07-27T17:59:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。