論文の概要: Co-Located Human-Human Interaction Analysis using Nonverbal Cues: A
Survey
- arxiv url: http://arxiv.org/abs/2207.10574v2
- Date: Wed, 4 Oct 2023 07:52:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-05 18:48:27.969428
- Title: Co-Located Human-Human Interaction Analysis using Nonverbal Cues: A
Survey
- Title(参考訳): 非言語クイズを用いた人間と人間の共焦点インタラクション分析:調査
- Authors: Cigdem Beyan and Alessandro Vinciarelli and Alessio Del Bue
- Abstract要約: 本研究の目的は,非言語的キューと計算手法を同定し,効果的な性能を実現することである。
この調査は、最も広い範囲の社会現象と相互作用設定を巻き込むことによって、相手と異なる。
もっともよく使われる非言語キュー、計算方法、相互作用環境、センシングアプローチは、それぞれマイクとカメラを備えた3,4人で構成される会話活動、ベクターマシンのサポート、ミーティングである。
- 参考スコア(独自算出の注目度): 71.43956423427397
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Automated co-located human-human interaction analysis has been addressed by
the use of nonverbal communication as measurable evidence of social and
psychological phenomena. We survey the computing studies (since 2010) detecting
phenomena related to social traits (e.g., leadership, dominance, personality
traits), social roles/relations, and interaction dynamics (e.g., group
cohesion, engagement, rapport). Our target is to identify the nonverbal cues
and computational methodologies resulting in effective performance. This survey
differs from its counterparts by involving the widest spectrum of social
phenomena and interaction settings (free-standing conversations, meetings,
dyads, and crowds). We also present a comprehensive summary of the related
datasets and outline future research directions which are regarding the
implementation of artificial intelligence, dataset curation, and
privacy-preserving interaction analysis. Some major observations are: the most
often used nonverbal cue, computational method, interaction environment, and
sensing approach are speaking activity, support vector machines, and meetings
composed of 3-4 persons equipped with microphones and cameras, respectively;
multimodal features are prominently performing better; deep learning
architectures showed improved performance in overall, but there exist many
phenomena whose detection has never been implemented through deep models. We
also identified several limitations such as the lack of scalable benchmarks,
annotation reliability tests, cross-dataset experiments, and explainability
analysis.
- Abstract(参考訳): 非言語コミュニケーションを社会的・心理的現象の計測可能な証拠として利用することで、人間と人間の対話分析の自動化に対処してきた。
社会特性(リーダーシップ、支配、パーソナリティ特性)、社会的役割/関係、相互作用のダイナミクス(グループ結束、エンゲージメント、ラプポートなど)に関連する現象を検出するコンピュータ研究(2010年以降)を調査した。
我々の目標は、効果的な性能をもたらす非言語的手がかりと計算方法論を特定することである。
この調査は、最も幅広い社会現象と相互作用設定(自由な会話、会議、ダイド、群衆)を巻き込むことによって、相手と異なる。
また、関連するデータセットの概要を概説し、人工知能、データセットキュレーション、プライバシー保護相互作用分析の実装に関する今後の研究の方向性について概説する。
もっともよく使われる非言語的キュー、計算方法、相互作用環境、および知覚的アプローチは、それぞれマイクとカメラを備えた3,4人の人物で構成された音声活動、支援ベクトルマシン、ミーティングである。
また、スケーラブルなベンチマークの欠如、アノテーションの信頼性テスト、データセット間の実験、説明可能性分析など、いくつかの制限を指摘した。
関連論文リスト
- Visual-Geometric Collaborative Guidance for Affordance Learning [63.038406948791454]
本稿では,視覚的・幾何学的手がかりを取り入れた視覚・幾何学的協調学習ネットワークを提案する。
本手法は,客観的指標と視覚的品質の代表的なモデルより優れている。
論文 参考訳(メタデータ) (2024-10-15T07:35:51Z) - Multimodal Fusion with LLMs for Engagement Prediction in Natural Conversation [70.52558242336988]
我々は,不関心や混乱の兆候を検出することを目的として,言語的および非言語的手がかりを精査することにより,ダイアディック的相互作用における係り合いを予測することに焦点を当てた。
本研究では,カジュアルなダイアディック会話に携わる34人の参加者を対象に,各会話の最後に自己報告されたエンゲージメント評価を行うデータセットを収集する。
大規模言語モデル(LLMs)を用いた新たな融合戦略を導入し,複数行動モダリティをマルチモーダル・トランスクリプトに統合する。
論文 参考訳(メタデータ) (2024-09-13T18:28:12Z) - Nonverbal Interaction Detection [83.40522919429337]
この研究は、社会的文脈における人間の非言語的相互作用を理解するという新たな課題に対処する。
我々はNVIと呼ばれる新しい大規模データセットを寄贈し、人間とそれに対応する社会グループのための境界ボックスを含むように細心の注意を払ってアノテートする。
第2に,非言語的インタラクション検出のための新たなタスクNVI-DETを構築し,画像から三つ子を識別する。
第3に,非言語相互作用検出ハイパーグラフ (NVI-DEHR) を提案する。
論文 参考訳(メタデータ) (2024-07-11T02:14:06Z) - Expanding the Role of Affective Phenomena in Multimodal Interaction
Research [57.069159905961214]
マルチモーダルインタラクション, 感情計算, 自然言語処理において, 選ばれたカンファレンスから16,000以上の論文を調査した。
本論文では,感情関連論文910を同定し,情緒現象の役割について分析した。
我々は、人間の社会的行動や認知状態の機械的理解を高めるために、AIシステムによって感情と感情の予測がどのように使用されるかについて、限られた研究結果を得た。
論文 参考訳(メタデータ) (2023-05-18T09:08:39Z) - Automatic Context-Driven Inference of Engagement in HMI: A Survey [6.479224589451863]
本稿では,人間と機械の相互作用に関するエンゲージメント推論について述べる。
これには、学際的定義、エンゲージメントコンポーネントと要因、公開データセット、地上真実の評価、そして最も一般的に使用される機能と方法が含まれる。
これは、信頼性の高いコンテキスト認識エンゲージメント推論機能を備えた、将来の人間と機械のインタラクションインターフェースの開発のためのガイドとして機能する。
論文 参考訳(メタデータ) (2022-09-30T10:46:13Z) - Bodily Behaviors in Social Interaction: Novel Annotations and
State-of-the-Art Evaluation [0.0]
本稿では,社会相互作用に埋め込まれた複雑な身体行動の最初のアノテーションであるBBSIについて述べる。
心理学における過去の研究に基づいて,26時間の自発的な行動について手動で注釈を付けた。
我々は、人間の行動検出のための最先端のアプローチであるピラミッド拡張注意ネットワーク(PDAN)を適応する。
論文 参考訳(メタデータ) (2022-07-26T11:24:00Z) - BOSS: A Benchmark for Human Belief Prediction in Object-context
Scenarios [14.23697277904244]
本稿では,人間と自律システム間の協調を促進させる手法を検討するために,心の理論(ToM)とオブジェクトコンテキスト関係(Object-Context Relations)の複合知識を利用する。
本稿では、人工知能(AI)システムによる、オブジェクトコンテキストシナリオにおける人間の信念状態の予測能力を評価するための、新しい、かつ挑戦的なマルチモーダルビデオデータセットを提案する。
論文 参考訳(メタデータ) (2022-06-21T18:29:17Z) - Human Trajectory Forecasting in Crowds: A Deep Learning Perspective [89.4600982169]
本稿では,既存の深層学習に基づくソーシャルインタラクションのモデル化手法について詳細に分析する。
本稿では、これらの社会的相互作用を効果的に捉えるための知識に基づく2つのデータ駆動手法を提案する。
我々は,人間の軌道予測分野において,重要かつ欠落したコンポーネントであるTrajNet++を大規模に開発する。
論文 参考訳(メタデータ) (2020-07-07T17:19:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。