論文の概要: PINO: Person-Interaction Noise Optimization for Long-Duration and Customizable Motion Generation of Arbitrary-Sized Groups
- arxiv url: http://arxiv.org/abs/2507.19292v1
- Date: Fri, 25 Jul 2025 14:06:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-28 16:16:48.985649
- Title: PINO: Person-Interaction Noise Optimization for Long-Duration and Customizable Motion Generation of Arbitrary-Sized Groups
- Title(参考訳): PINO:任意集団の長期・カスタマイズ可能な運動生成のための対人ノイズ最適化
- Authors: Sakuya Ota, Qing Yu, Kent Fujiwara, Satoshi Ikehata, Ikuro Sato,
- Abstract要約: Person-Interaction Noise Optimization (PINO) は任意のサイズのグループ間で現実的でカスタマイズ可能なインタラクションを生成するためのトレーニング不要のフレームワークである。
PINOは複雑なグループ相互作用を意味的に関連するペアワイズ相互作用に分解する。
追加のトレーニングなしで文字の向き、速度、空間的関係を正確に制御できる。
- 参考スコア(独自算出の注目度): 21.121275671034187
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generating realistic group interactions involving multiple characters remains challenging due to increasing complexity as group size expands. While existing conditional diffusion models incrementally generate motions by conditioning on previously generated characters, they rely on single shared prompts, limiting nuanced control and leading to overly simplified interactions. In this paper, we introduce Person-Interaction Noise Optimization (PINO), a novel, training-free framework designed for generating realistic and customizable interactions among groups of arbitrary size. PINO decomposes complex group interactions into semantically relevant pairwise interactions, and leverages pretrained two-person interaction diffusion models to incrementally compose group interactions. To ensure physical plausibility and avoid common artifacts such as overlapping or penetration between characters, PINO employs physics-based penalties during noise optimization. This approach allows precise user control over character orientation, speed, and spatial relationships without additional training. Comprehensive evaluations demonstrate that PINO generates visually realistic, physically coherent, and adaptable multi-person interactions suitable for diverse animation, gaming, and robotics applications.
- Abstract(参考訳): 複数の文字を含む現実的なグループインタラクションの生成は、グループサイズが大きくなるにつれて複雑さが増すため、依然として困難である。
既存の条件拡散モデルは、以前に生成された文字を条件付けすることで動きを漸進的に生成するが、それらは単一の共有プロンプトに依存し、ニュアンス制御を制限し、過度に単純化された相互作用をもたらす。
本稿では,任意のサイズのグループ間での現実的でカスタマイズ可能なインタラクションを生成するための,新しい学習自由度フレームワークであるPINOを紹介する。
PINOは、複雑なグループ間相互作用を意味的に関連するペアワイズ相互作用に分解し、事前訓練された2人の相互作用拡散モデルを利用して、グループ間相互作用を漸進的に構成する。
物理的妥当性を確保し、文字間の重なり合いや浸透などの一般的な成果物を避けるため、PINOはノイズ最適化中に物理ベースの罰則を採用する。
このアプローチにより、追加トレーニングなしで文字方向、速度、空間関係を正確に制御できる。
総合的な評価は、PINOが多様なアニメーション、ゲーム、ロボット工学アプリケーションに適した視覚的、現実的で、物理的に一貫性があり、適応可能な多人数インタラクションを生成することを示している。
関連論文リスト
- Efficient Multi-Person Motion Prediction by Lightweight Spatial and Temporal Interactions [45.51160285910023]
空間的・時間的相互作用を単純化し,多人数動作予測のための計算効率の良いモデルを提案する。
CMU-Mocap, MuPoTS-3D, 3DPW の標準データセット上で, マルチメトリックの最先端性能を実現する。
論文 参考訳(メタデータ) (2025-07-13T02:16:37Z) - Multi-Person Interaction Generation from Two-Person Motion Priors [7.253302825595181]
グラフ駆動インタラクションサンプリングは、現実的で多様な多人数インタラクションを生成する方法である。
生成タスクを、互いの動作に条件付けられた同時1対1の動作生成に分解する。
提案手法は,多人数・多人数のインタラクションを広範囲に生成する際の工芸品の削減において,既存の手法よりも一貫して優れる。
論文 参考訳(メタデータ) (2025-05-23T13:13:00Z) - InterControl: Zero-shot Human Interaction Generation by Controlling Every Joint [67.6297384588837]
関節間の所望距離を維持するために,新しい制御可能な運動生成手法であるInterControlを導入する。
そこで本研究では,既成の大規模言語モデルを用いて,ヒューマンインタラクションのための結合ペア間の距離を生成できることを実証した。
論文 参考訳(メタデータ) (2023-11-27T14:32:33Z) - InterGen: Diffusion-based Multi-human Motion Generation under Complex Interactions [49.097973114627344]
動作拡散プロセスに人間と人間の相互作用を組み込んだ効果的な拡散ベースアプローチであるInterGenを提案する。
我々はまず、InterHumanという名前のマルチモーダルデータセットをコントリビュートする。これは、様々な2人インタラクションのための約107Mフレームで構成され、正確な骨格運動と23,337の自然言語記述を持つ。
本稿では,世界規模での2人のパフォーマーのグローバルな関係を明示的に定式化した対話拡散モデルにおける動作入力の表現を提案する。
論文 参考訳(メタデータ) (2023-04-12T08:12:29Z) - Rethinking Trajectory Prediction via "Team Game" [118.59480535826094]
本稿では,対話型グループコンセンサスの概念を明示的に導入した,マルチエージェント軌道予測の新しい定式化について述べる。
チームスポーツと歩行者の2つのマルチエージェント設定において,提案手法は既存手法と比較して常に優れた性能を達成している。
論文 参考訳(メタデータ) (2022-10-17T07:16:44Z) - Interaction Transformer for Human Reaction Generation [61.22481606720487]
本稿では,時間的,空間的両方の注意を持つトランスフォーマーネットワークからなる対話型トランスフォーマー(InterFormer)を提案する。
我々の手法は一般的であり、より複雑で長期的な相互作用を生成するのに利用できる。
論文 参考訳(メタデータ) (2022-07-04T19:30:41Z) - Unlimited Neighborhood Interaction for Heterogeneous Trajectory
Prediction [97.40338982628094]
マルチプライカテゴリにおける異種エージェントの軌跡を予測できる,シンプルで効果的な非境界相互作用ネットワーク (UNIN) を提案する。
具体的には、提案した無制限近傍相互作用モジュールは、相互作用に関与するすべてのエージェントの融合特徴を同時に生成する。
階層型グラフアテンションモジュールを提案し,カテゴリ間相互作用とエージェント間相互作用を求める。
論文 参考訳(メタデータ) (2021-07-31T13:36:04Z) - SPA: Verbal Interactions between Agents and Avatars in Shared Virtual
Environments using Propositional Planning [61.335252950832256]
SPA(Sense-Plan-Ask)は、仮想的な仮想環境において、仮想的な人間のようなエージェントとユーザアバターの間の言語的対話を生成する。
提案アルゴリズムは実行時コストを小さくし,自然言語通信を利用せずにエージェントよりも効率的に目標を達成できることが判明した。
論文 参考訳(メタデータ) (2020-02-08T23:15:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。