論文の概要: InterMoE: Individual-Specific 3D Human Interaction Generation via Dynamic Temporal-Selective MoE
- arxiv url: http://arxiv.org/abs/2511.13488v1
- Date: Mon, 17 Nov 2025 15:26:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:25.330581
- Title: InterMoE: Individual-Specific 3D Human Interaction Generation via Dynamic Temporal-Selective MoE
- Title(参考訳): InterMoE:動的時間選択型MoEによる個人別3次元ヒューマンインタラクション生成
- Authors: Lipeng Wang, Hongxing Fan, Haohua Chen, Zehuan Huang, Lu Sheng,
- Abstract要約: 動的時間選択型エキスパート混合に基づく新しいフレームワークであるInterMoEを紹介する。
InterMoEは、高レベルのテキストセマンティクスと低レベルのモーションコンテキストの両方を使用して、時間的動作の特徴を専門の専門家にディスパッチする。
実験により、InterMoEは個人固有の高忠実度3次元ヒューマンインタラクション生成において最先端の性能を達成することが示された。
- 参考スコア(独自算出の注目度): 18.87298863978037
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generating high-quality human interactions holds significant value for applications like virtual reality and robotics. However, existing methods often fail to preserve unique individual characteristics or fully adhere to textual descriptions. To address these challenges, we introduce InterMoE, a novel framework built on a Dynamic Temporal-Selective Mixture of Experts. The core of InterMoE is a routing mechanism that synergistically uses both high-level text semantics and low-level motion context to dispatch temporal motion features to specialized experts. This allows experts to dynamically determine the selection capacity and focus on critical temporal features, thereby preserving specific individual characteristic identities while ensuring high semantic fidelity. Extensive experiments show that InterMoE achieves state-of-the-art performance in individual-specific high-fidelity 3D human interaction generation, reducing FID scores by 9% on the InterHuman dataset and 22% on InterX.
- Abstract(参考訳): 高品質なヒューマンインタラクションを生成することは、仮想現実やロボティクスといったアプリケーションにとって重要な意味を持つ。
しかし、既存の手法は個々の特徴を保存できなかったり、文章の記述に完全に従わなかったりすることが多い。
これらの課題に対処するために,動的時間選択型エキスパート混在に基づく新しいフレームワークであるInterMoEを紹介した。
InterMoEのコアは、高レベルのテキストセマンティクスと低レベルのモーションコンテキストの両方を相乗的に使用して、時間的動作機能を専門の専門家にディスパッチするルーティングメカニズムである。
これにより、専門家は選択能力を動的に決定し、重要な時間的特徴に集中することができる。
大規模な実験により、InterMoEは個人固有の高忠実な3次元ヒューマンインタラクション生成において最先端のパフォーマンスを実現し、InterHumanデータセットではFIDスコアが9%、InterXでは22%削減された。
関連論文リスト
- HAMoBE: Hierarchical and Adaptive Mixture of Biometric Experts for Video-based Person ReID [14.923830228090246]
バイオメトリックエキスパートの階層的・適応的混合(HAMoBE)フレームワークを提案する。
HamoBEは、キーバイオメトリックの特徴を独立してモデル化することで、人間の知覚機構を模倣する。
私たちのアプローチは、大幅なパフォーマンス向上をもたらします。
論文 参考訳(メタデータ) (2025-08-07T05:34:14Z) - Two-in-One: Unified Multi-Person Interactive Motion Generation by Latent Diffusion Transformer [24.166147954731652]
多人数対話型モーション生成はコンピュータ・キャラクター・アニメーションにおける重要な領域であるが、未探索領域である。
現在の研究では、個々の動作に別々のモジュールブランチを使用することが多いため、インタラクション情報が失われる。
本稿では,複数の人物の動きとその相互作用を1つの潜在空間内でモデル化する,新しい統一的アプローチを提案する。
論文 参考訳(メタデータ) (2024-12-21T15:35:50Z) - DeepInteraction++: Multi-Modality Interaction for Autonomous Driving [80.8837864849534]
我々は,モダリティごとの個別表現を学習し,維持することのできる,新しいモダリティインタラクション戦略を導入する。
DeepInteraction++はマルチモーダルなインタラクション・フレームワークであり、マルチモーダルな表現型インタラクション・エンコーダとマルチモーダルな予測型インタラクション・デコーダを特徴とする。
実験では,3次元物体検出とエンドツーエンドの自律走行の両方において,提案手法の優れた性能を示す。
論文 参考訳(メタデータ) (2024-08-09T14:04:21Z) - HIMO: A New Benchmark for Full-Body Human Interacting with Multiple Objects [86.86284624825356]
HIMOは、複数のオブジェクトと相互作用するフルボディの人間のデータセットである。
HIMOは3.3K 4D HOIシーケンスと4.08M 3D HOIフレームを含む。
論文 参考訳(メタデータ) (2024-07-17T07:47:34Z) - in2IN: Leveraging individual Information to Generate Human INteractions [29.495166514135295]
In2IN(in2IN)は、人間と人間の動作生成を個別に記述した新しい拡散モデルである。
In2INで生成された動きと、HumanML3Dで事前訓練された1人の動きによって生成された動きとを組み合わせたモデル合成手法であるDualMDMを提案する。
論文 参考訳(メタデータ) (2024-04-15T17:59:04Z) - AMuSE: Adaptive Multimodal Analysis for Speaker Emotion Recognition in
Group Conversations [39.79734528362605]
マルチモーダルアテンションネットワークは、空間抽象の様々なレベルにおける相互モーダル相互作用をキャプチャする。
AMuSEモデルは、空間的特徴と時間的特徴の両方を、話者レベルと発話レベルという2つの濃密な記述子に凝縮する。
論文 参考訳(メタデータ) (2024-01-26T19:17:05Z) - Persistent-Transient Duality: A Multi-mechanism Approach for Modeling
Human-Object Interaction [58.67761673662716]
人間は高度に適応可能で、異なるタスク、状況、状況を扱うために異なるモードを素早く切り替える。
人間と物体の相互作用(HOI)において、これらのモードは、(1)活動全体に対する大規模な一貫した計画、(2)タイムラインに沿って開始・終了する小規模の子どもの対話的行動の2つのメカニズムに起因していると考えられる。
本研究は、人間の動作を協調的に制御する2つの同時メカニズムをモデル化することを提案する。
論文 参考訳(メタデータ) (2023-07-24T12:21:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。