論文の概要: EgoGroups: A Benchmark For Detecting Social Groups of People in the Wild
- arxiv url: http://arxiv.org/abs/2603.22249v1
- Date: Mon, 23 Mar 2026 17:43:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:39.823544
- Title: EgoGroups: A Benchmark For Detecting Social Groups of People in the Wild
- Title(参考訳): EgoGroups: 野生の人々のソーシャルグループを検出するベンチマーク
- Authors: Jeffri Murrugarra-Llerena, Pranav Chitale, Zicheng Liu, Kai Ao, Yujin Ham, Guha Balakrishnan, Paola Cascante-Bonilla,
- Abstract要約: EgoGroupsは、世界中の都市でソーシャルなダイナミクスをキャプチャする、一人称のビューデータセットだ。
人や社会グループのための密集した人的アノテーションや、リッチな地理的、シーンのメタデータが含まれています。
我々は最先端のVLM/LLMを広範囲に評価し,グループ検出機能に関する教師付きモデルを構築した。
- 参考スコア(独自算出の注目度): 22.208270430723644
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Social group detection, or the identification of humans involved in reciprocal interpersonal interactions (e.g., family members, friends, and customers and merchants), is a crucial component of social intelligence needed for agents transacting in the world. The few existing benchmarks for social group detection are limited by low scene diversity and reliance on third-person camera sources (e.g., surveillance footage). Consequently, these benchmarks generally lack real-world evaluation on how groups form and evolve in diverse cultural contexts and unconstrained settings. To address this gap, we introduce EgoGroups, a first-person view dataset that captures social dynamics in cities around the world. EgoGroups spans 65 countries covering low, medium, and high-crowd settings under four weather/time-of-day conditions. We include dense human annotations for person and social groups, along with rich geographic and scene metadata. Using this dataset, we performed an extensive evaluation of state-of-the-art VLM/LLMs and supervised models on their group detection capabilities. We found several interesting findings, including VLMs and LLMs can outperform supervised baselines in a zero-shot setting, while crowd density and cultural regions clearly influence model performance.
- Abstract(参考訳): ソーシャルグループ検出(Social Group Detection)とは、相互に相互作用する人間(例えば、家族、友人、顧客、商人)を識別することである。
ソーシャルグループ検出のための数少ないベンチマークは、低いシーンの多様性と第三者のカメラソース(例えば監視映像)への依存によって制限されている。
その結果、これらのベンチマークは、様々な文化的文脈や制約のない環境において、グループがどのように形成し、進化するかの実際の評価を欠いている。
このギャップに対処するために、世界中の都市における社会的ダイナミクスをキャプチャする、一人称ビューデータセットであるEgoGroupsを紹介します。
EgoGroupsは、4つの天候/昼の条件下で、低、中、高密度の環境をカバーする65の国にまたがる。
人や社会グループのための密集した人的アノテーションや、リッチな地理的、シーンのメタデータが含まれています。
このデータセットを用いて、最先端のVLM/LLMと教師付きモデルによるグループ検出機能の評価を行った。
VLM や LLM はゼロショット設定で教師付きベースラインを上回り、群衆密度と文化領域は明らかにモデル性能に影響を及ぼす。
関連論文リスト
- Modeling Epistemic Uncertainty in Social Perception via Rashomon Set Agents [6.341462133837518]
LLM駆動型マルチエージェント確率モデルフレームワークを提案する。
これは、現実世界の教室環境において、学生の主観的社会的知覚の違いがどのように出現し、進化するかを示すものである。
論文 参考訳(メタデータ) (2026-03-21T10:47:09Z) - Beyond Static Snapshots: Dynamic Modeling and Forecasting of Group-Level Value Evolution with Large Language Models [24.234813956858577]
社会シミュレーションは複雑な社会力学をマイニングし、データ駆動意思決定をサポートするために重要である。
既存のLLMベースのアプローチは、主に離散時点におけるグループレベルの値に焦点を当てている。
LLMに基づくヒューマン・レスポンス・モデリングに歴史的価値トラジェクトリを組み込んだグループレベルの動的社会シミュレーションのための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-15T08:14:55Z) - Us-vs-Them bias in Large Language Models [0.569978892646475]
基礎的大言語モデル間で、一貫した内集団陽性および外集団陰性な関連を見いだす。
調査対象者は,保守的ペルソナは対人関係が強く,リベラルなペルソナは対人関係が強かった。
論文 参考訳(メタデータ) (2025-12-03T07:11:22Z) - Mind the Gaps: Auditing and Reducing Group Inequity in Large-Scale Mobility Prediction [9.369284351516358]
次のロケーション予測は、モビリティ、小売、公衆衛生のアプリケーションの増加を支えている。
本稿では,大規模データセット上で訓練された最先端のモビリティ予測モデルを評価する。
基礎となるデータセットから生じる系統的な差異が示され、位置とユーザグループに基づいて精度に大きな違いが生じる。
論文 参考訳(メタデータ) (2025-10-30T18:54:33Z) - MINGLE: VLMs for Semantically Complex Region Detection in Urban Scenes [49.89767522399176]
公共空間におけるグループレベルの社会的相互作用は都市計画に不可欠である。
対人関係によって定義された視覚領域の推測と空間的接地を必要とする社会集団領域検出タスクを導入する。
本稿では,人間検出と深度推定を統合したモジュール型3段階パイプラインであるMINGLEと,ソーシャルアフィリエイトを相互に分類するVLMベースの推論と,ソーシャルに連結したグループを局所化する軽量な空間アグリゲーションアルゴリズムを提案する。
そこで本稿では,個人と社会的に相互作用するグループの両方に対して,境界ボックスとラベルを付加した100万の街路ビュー画像のデータセットを提案する。
論文 参考訳(メタデータ) (2025-09-16T19:31:40Z) - SocialBench: Sociality Evaluation of Role-Playing Conversational Agents [85.6641890712617]
大規模言語モデル(LLM)は、様々なAI対話エージェントの開発を進めてきた。
SocialBenchは、ロールプレイングの会話エージェントの社会的性を個人レベルとグループレベルで評価するために設計された最初のベンチマークである。
個人レベルで優れたエージェントは,集団レベルでの熟練度を示唆しない。
論文 参考訳(メタデータ) (2024-03-20T15:38:36Z) - On the steerability of large language models toward data-driven personas [98.9138902560793]
大規模言語モデル(LLM)は、特定のグループや集団の意見が不足している偏りのある応答を生成することが知られている。
本稿では, LLM を用いて特定の視点の制御可能な生成を実現するための新しい手法を提案する。
論文 参考訳(メタデータ) (2023-11-08T19:01:13Z) - Ranking-based Group Identification via Factorized Attention on Social
Tripartite Graph [68.08590487960475]
グループ識別のための文脈的要因認識(CFAG)という,GNNに基づく新しいフレームワークを提案する。
我々は3部グラフ畳み込み層を考案し、ユーザ、グループ、アイテム間の異なる種類の近隣からの情報を集約する。
データ疎度問題に対処するため,提案した因子化注意機構に基づく新しい伝搬増強層を考案した。
論文 参考訳(メタデータ) (2022-11-02T01:42:20Z) - JRDB-Act: A Large-scale Multi-modal Dataset for Spatio-temporal Action,
Social Group and Activity Detection [54.696819174421584]
大学構内環境における生活行動の実際の分布を反映したマルチモーダルデータセットであるJRDB-Actを紹介する。
JRDB-Actには280万以上のアクションラベルがある。
JRDB-Actは、現場での対話に基づいて個人をグループ化するタスクに着想を得た社会集団識別アノテーションが付属している。
論文 参考訳(メタデータ) (2021-06-16T14:43:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。