論文の概要: Part-Aware Bottom-Up Group Reasoning for Fine-Grained Social Interaction Detection
- arxiv url: http://arxiv.org/abs/2511.03666v1
- Date: Wed, 05 Nov 2025 17:33:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-06 18:19:32.507177
- Title: Part-Aware Bottom-Up Group Reasoning for Fine-Grained Social Interaction Detection
- Title(参考訳): ファイングラインド型ソーシャルインタラクション検出のためのパートアウェアなボトムアップグループ推論
- Authors: Dongkeun Kim, Minsu Cho, Suha Kwak,
- Abstract要約: 本稿では,詳細なソーシャルインタラクション検出のためのボトムアップグループ推論フレームワークを提案する。
提案手法は,身体部分の特徴と対人関係を用いて,社会的グループとその相互作用を推定する。
モデルではまず個人を検知し,その特徴を部分認識的手がかりを用いて拡張し,類似性に基づく推論によって個人を連想させることによりグループ構成を推論する。
- 参考スコア(独自算出の注目度): 82.70752567211251
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Social interactions often emerge from subtle, fine-grained cues such as facial expressions, gaze, and gestures. However, existing methods for social interaction detection overlook such nuanced cues and primarily rely on holistic representations of individuals. Moreover, they directly detect social groups without explicitly modeling the underlying interactions between individuals. These drawbacks limit their ability to capture localized social signals and introduce ambiguity when group configurations should be inferred from social interactions grounded in nuanced cues. In this work, we propose a part-aware bottom-up group reasoning framework for fine-grained social interaction detection. The proposed method infers social groups and their interactions using body part features and their interpersonal relations. Our model first detects individuals and enhances their features using part-aware cues, and then infers group configuration by associating individuals via similarity-based reasoning, which considers not only spatial relations but also subtle social cues that signal interactions, leading to more accurate group inference. Experiments on the NVI dataset demonstrate that our method outperforms prior methods, achieving the new state of the art.
- Abstract(参考訳): 社会的相互作用はしばしば、表情、視線、ジェスチャーのような微妙できめ細かな手がかりから現れる。
しかし、既存の社会的相互作用検出手法は、このようなニュアンスな手がかりを見落とし、主に個人の全体的表現に依存している。
さらに、個人間の相互作用を明示的にモデル化することなく、直接社会的グループを検出する。
これらの欠点は、局所的な社会的シグナルを捉える能力を制限し、集団構成がニュアンスド・キュー(nuanced cues)に根ざした社会的相互作用から推論されるべきときに曖昧さをもたらす。
本研究では,詳細なソーシャルインタラクション検出のためのボトムアップグループ推論フレームワークを提案する。
提案手法は,身体部分の特徴と対人関係を用いて,社会的グループとその相互作用を推定する。
本モデルでは,まず個人を識別し,その特徴を高めるとともに,類似性に基づく推論によってグループ構成を推論する。
NVIデータセットの実験では,提案手法が先行手法より優れ,新しい最先端技術を実現していることが示された。
関連論文リスト
- Learning Human-Object Interaction as Groups [52.28258599873394]
GroupHOIは、幾何学的近接性および意味的類似性の観点から文脈情報を伝播するフレームワークである。
これは、より困難な非言語間相互作用検出タスクにおいて、主要なパフォーマンスを示す。
論文 参考訳(メタデータ) (2025-10-21T07:25:10Z) - MINGLE: VLMs for Semantically Complex Region Detection in Urban Scenes [49.89767522399176]
公共空間におけるグループレベルの社会的相互作用は都市計画に不可欠である。
対人関係によって定義された視覚領域の推測と空間的接地を必要とする社会集団領域検出タスクを導入する。
本稿では,人間検出と深度推定を統合したモジュール型3段階パイプラインであるMINGLEと,ソーシャルアフィリエイトを相互に分類するVLMベースの推論と,ソーシャルに連結したグループを局所化する軽量な空間アグリゲーションアルゴリズムを提案する。
そこで本稿では,個人と社会的に相互作用するグループの両方に対して,境界ボックスとラベルを付加した100万の街路ビュー画像のデータセットを提案する。
論文 参考訳(メタデータ) (2025-09-16T19:31:40Z) - Diffusion-Based Imitation Learning for Social Pose Generation [0.0]
ロボットや仮想エージェントのような知的なエージェントは、人間と対話する複雑な社会的相互作用のダイナミクスを理解する必要がある。
我々は、社会的相互作用における複数の個人の単一のモダリティ、ポーズ行動を用いて、その相互作用のファシリテータのための非言語的社会的手がかりを生成する方法について検討する。
論文 参考訳(メタデータ) (2025-01-18T20:31:55Z) - Co-Located Human-Human Interaction Analysis using Nonverbal Cues: A
Survey [71.43956423427397]
本研究の目的は,非言語的キューと計算手法を同定し,効果的な性能を実現することである。
この調査は、最も広い範囲の社会現象と相互作用設定を巻き込むことによって、相手と異なる。
もっともよく使われる非言語キュー、計算方法、相互作用環境、センシングアプローチは、それぞれマイクとカメラを備えた3,4人で構成される会話活動、ベクターマシンのサポート、ミーティングである。
論文 参考訳(メタデータ) (2022-07-20T13:37:57Z) - Self-supervised Social Relation Representation for Human Group Detection [18.38523753680367]
人間のグループ検出のための新しい2段階のマルチヘッドフレームワークを提案する。
第1段階では,人間行動シミュレーター・ヘッドを提案し,ソーシャル・リレーション・フィーチャの埋め込みを学習する。
第2段階では,社会関係の埋め込みに基づいて,人間集団検出のための自己注意型ネットワークを開発する。
論文 参考訳(メタデータ) (2022-03-08T04:26:07Z) - PHASE: PHysically-grounded Abstract Social Events for Machine Social
Perception [50.551003004553806]
私たちは、物理的に根拠のある抽象的なソーシャルイベント、フェーズのデータセットを作成します。
フェーズは人間の実験によって検証され、人間は社会出来事において豊かな相互作用を知覚する。
ベースラインモデルとして,最新のフィードフォワードニューラルネットワークよりも優れたベイズ逆計画手法SIMPLEを導入する。
論文 参考訳(メタデータ) (2021-03-02T18:44:57Z) - Connections between Relational Event Model and Inverse Reinforcement
Learning for Characterizing Group Interaction Sequences [0.18275108630751835]
我々は、リレーショナルイベントモデル(REM)と逆強化学習(IRL)の未同定接続について検討する。
REM はそのような問題に対処する従来の手法であるが、IRL の応用は未完成の手法である。
実験により,集団の社会的相互作用を特徴付けるためのIRLの特殊効果を実証した。
論文 参考訳(メタデータ) (2020-10-19T19:40:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。