論文の概要: Diffusion-Based Imitation Learning for Social Pose Generation
- arxiv url: http://arxiv.org/abs/2501.10869v1
- Date: Sat, 18 Jan 2025 20:31:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-22 14:20:19.473021
- Title: Diffusion-Based Imitation Learning for Social Pose Generation
- Title(参考訳): 拡散に基づくソーシャルポーズ生成のための模倣学習
- Authors: Antonio Lech Martin-Ozimek, Isuru Jayarathne, Su Larb Mon, Jouh Yeong Chew,
- Abstract要約: ロボットや仮想エージェントのような知的なエージェントは、人間と対話する複雑な社会的相互作用のダイナミクスを理解する必要がある。
我々は、社会的相互作用における複数の個人の単一のモダリティ、ポーズ行動を用いて、その相互作用のファシリテータのための非言語的社会的手がかりを生成する方法について検討する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Intelligent agents, such as robots and virtual agents, must understand the dynamics of complex social interactions to interact with humans. Effectively representing social dynamics is challenging because we require multi-modal, synchronized observations to understand a scene. We explore how using a single modality, the pose behavior, of multiple individuals in a social interaction can be used to generate nonverbal social cues for the facilitator of that interaction. The facilitator acts to make a social interaction proceed smoothly and is an essential role for intelligent agents to replicate in human-robot interactions. In this paper, we adapt an existing diffusion behavior cloning model to learn and replicate facilitator behaviors. Furthermore, we evaluate two representations of pose observations from a scene, one representation has pre-processing applied and one does not. The purpose of this paper is to introduce a new use for diffusion behavior cloning for pose generation in social interactions. The second is to understand the relationship between performance and computational load for generating social pose behavior using two different techniques for collecting scene observations. As such, we are essentially testing the effectiveness of two different types of conditioning for a diffusion model. We then evaluate the resulting generated behavior from each technique using quantitative measures such as mean per-joint position error (MPJPE), training time, and inference time. Additionally, we plot training and inference time against MPJPE to examine the trade-offs between efficiency and performance. Our results suggest that the further pre-processed data can successfully condition diffusion models to generate realistic social behavior, with reasonable trade-offs in accuracy and processing time.
- Abstract(参考訳): ロボットや仮想エージェントのような知的なエージェントは、人間と対話する複雑な社会的相互作用のダイナミクスを理解する必要がある。
社会的ダイナミクスを効果的に表現することは困難である。
我々は、社会的相互作用における複数の個人の単一のモダリティ、ポーズ行動を用いて、その相互作用のファシリテータのための非言語的社会的手がかりを生成する方法について検討する。
ファシリテーターは、社会的相互作用を円滑に進めるために働き、知的エージェントが人間とロボットの相互作用を再現するのに不可欠な役割である。
本稿では,ファシリテータの動作を学習し,再現するために,既存の拡散行動クローニングモデルを適用する。
さらに、シーンからのポーズ観察の2つの表現を評価し、1つの表現は前処理を施し、もう1つの表現は適用しない。
本研究の目的は,ソーシャルインタラクションにおけるポーズ生成のための拡散行動クローニングの新たな利用を提案することである。
二つ目は,2つの異なる手法を用いて場面の観察を収集し,社会的ポーズ行動を生成するための性能と計算負荷の関係を理解することである。
このように、拡散モデルに対する2つの異なる条件付けの有効性を本質的に検証している。
次に,各手法から得られた振る舞いを,平均結合位置誤差(MPJPE),トレーニング時間,推定時間などの測定値を用いて評価する。
さらに,MPJPEに対する学習時間と推定時間をプロットし,効率と性能のトレードオフを検討する。
以上の結果から,事前処理したデータから,現実的な社会的行動を生成するための拡散モデルの構築に成功し,精度と処理時間に適切なトレードオフが生じる可能性が示唆された。
関連論文リスト
- SocialCircle+: Learning the Angle-based Conditioned Interaction Representation for Pedestrian Trajectory Prediction [10.240007698680097]
本論文は,軌道予測ネットワークにおける説明可能性と条件条件性に焦点をあてる。
本研究は, 海産動物が他の動物や水中環境をエコーロケーションで知覚し, アングルに基づく条件付き社会相互作用表現SocialCircle+を構築した。
実験は、異なる軌道予測バックボーンを持つSocialCircle+の優位性を示す。
論文 参考訳(メタデータ) (2024-09-23T13:02:12Z) - Multi-Agent Dynamic Relational Reasoning for Social Robot Navigation [50.01551945190676]
社会ロボットナビゲーションは、日常生活の様々な状況において有用であるが、安全な人間とロボットの相互作用と効率的な軌道計画が必要である。
本稿では, 動的に進化する関係構造を明示的に推論した系統的関係推論手法を提案する。
マルチエージェント軌道予測とソーシャルロボットナビゲーションの有効性を実証する。
論文 参考訳(メタデータ) (2024-01-22T18:58:22Z) - Disentangled Interaction Representation for One-Stage Human-Object
Interaction Detection [70.96299509159981]
ヒューマン・オブジェクト・インタラクション(HOI)検出は、人間中心の画像理解のコアタスクである。
最近のワンステージ手法では、対話予測に有用な画像ワイドキューの収集にトランスフォーマーデコーダを採用している。
従来の2段階の手法は、非絡み合いで説明可能な方法で相互作用特徴を構成する能力から大きな恩恵を受ける。
論文 参考訳(メタデータ) (2023-12-04T08:02:59Z) - Emotion-Oriented Behavior Model Using Deep Learning [0.9176056742068812]
感情に基づく行動予測の精度は2尾のピアソン相関を用いて統計的に検証される。
本研究は,感情指向行動に基づく多面的人工エージェントインタラクションの基盤となる。
論文 参考訳(メタデータ) (2023-10-28T17:27:59Z) - Persistent-Transient Duality: A Multi-mechanism Approach for Modeling
Human-Object Interaction [58.67761673662716]
人間は高度に適応可能で、異なるタスク、状況、状況を扱うために異なるモードを素早く切り替える。
人間と物体の相互作用(HOI)において、これらのモードは、(1)活動全体に対する大規模な一貫した計画、(2)タイムラインに沿って開始・終了する小規模の子どもの対話的行動の2つのメカニズムに起因していると考えられる。
本研究は、人間の動作を協調的に制御する2つの同時メカニズムをモデル化することを提案する。
論文 参考訳(メタデータ) (2023-07-24T12:21:33Z) - Bodily Behaviors in Social Interaction: Novel Annotations and
State-of-the-Art Evaluation [0.0]
本稿では,社会相互作用に埋め込まれた複雑な身体行動の最初のアノテーションであるBBSIについて述べる。
心理学における過去の研究に基づいて,26時間の自発的な行動について手動で注釈を付けた。
我々は、人間の行動検出のための最先端のアプローチであるピラミッド拡張注意ネットワーク(PDAN)を適応する。
論文 参考訳(メタデータ) (2022-07-26T11:24:00Z) - Co-Located Human-Human Interaction Analysis using Nonverbal Cues: A
Survey [71.43956423427397]
本研究の目的は,非言語的キューと計算手法を同定し,効果的な性能を実現することである。
この調査は、最も広い範囲の社会現象と相互作用設定を巻き込むことによって、相手と異なる。
もっともよく使われる非言語キュー、計算方法、相互作用環境、センシングアプローチは、それぞれマイクとカメラを備えた3,4人で構成される会話活動、ベクターマシンのサポート、ミーティングである。
論文 参考訳(メタデータ) (2022-07-20T13:37:57Z) - SocialInteractionGAN: Multi-person Interaction Sequence Generation [0.0]
条件付き相互作用生成のための新しい対比アーキテクチャであるSocialInteractionGANを提示する。
本モデルは,再帰型エンコーダデコーダジェネレータネットワークとデュアルストリームディスクリミネータ上に構築する。
提案されたSocialInteractionGANは、対話する人々の高いリアリズムアクションシーケンスを生成することに成功していることを示す。
論文 参考訳(メタデータ) (2021-03-10T08:11:34Z) - PHASE: PHysically-grounded Abstract Social Events for Machine Social
Perception [50.551003004553806]
私たちは、物理的に根拠のある抽象的なソーシャルイベント、フェーズのデータセットを作成します。
フェーズは人間の実験によって検証され、人間は社会出来事において豊かな相互作用を知覚する。
ベースラインモデルとして,最新のフィードフォワードニューラルネットワークよりも優れたベイズ逆計画手法SIMPLEを導入する。
論文 参考訳(メタデータ) (2021-03-02T18:44:57Z) - Human Trajectory Forecasting in Crowds: A Deep Learning Perspective [89.4600982169]
本稿では,既存の深層学習に基づくソーシャルインタラクションのモデル化手法について詳細に分析する。
本稿では、これらの社会的相互作用を効果的に捉えるための知識に基づく2つのデータ駆動手法を提案する。
我々は,人間の軌道予測分野において,重要かつ欠落したコンポーネントであるTrajNet++を大規模に開発する。
論文 参考訳(メタデータ) (2020-07-07T17:19:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。