論文の概要: Efficient 3D Full-Body Motion Generation from Sparse Tracking Inputs with Temporal Windows
- arxiv url: http://arxiv.org/abs/2505.01802v1
- Date: Sat, 03 May 2025 12:17:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-06 18:49:35.27532
- Title: Efficient 3D Full-Body Motion Generation from Sparse Tracking Inputs with Temporal Windows
- Title(参考訳): 時間窓を用いたスパーストラッキング入力による高能率3次元フルボディー動作生成
- Authors: Georgios Fotios Angelis, Savas Ozkan, Sinan Mutlu, Paul Wisbey, Anastasios Drosou, Mete Ozay,
- Abstract要約: 計算コストとメモリオーバヘッドのバランスを保ちながら全体の性能を向上し,効率的な3次元フルボディ生成を実現する,MLP(Multi-Layer Perceptron)に基づく新しい手法を提案する。
このNN機構による手法の生成精度は, 現状の手法に比べて有意に向上していることを示す。
- 参考スコア(独自算出の注目度): 12.447337863027833
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To have a seamless user experience on immersive AR/VR applications, the importance of efficient and effective Neural Network (NN) models is undeniable, since missing body parts that cannot be captured by limited sensors should be generated using these models for a complete 3D full-body reconstruction in virtual environment. However, the state-of-the-art NN-models are typically computational expensive and they leverage longer sequences of sparse tracking inputs to generate full-body movements by capturing temporal context. Inevitably, longer sequences increase the computation overhead and introduce noise in longer temporal dependencies that adversely affect the generation performance. In this paper, we propose a novel Multi-Layer Perceptron (MLP)-based method that enhances the overall performance while balancing the computational cost and memory overhead for efficient 3D full-body generation. Precisely, we introduce a NN-mechanism that divides the longer sequence of inputs into smaller temporal windows. Later, the current motion is merged with the information from these windows through latent representations to utilize the past context for the generation. Our experiments demonstrate that generation accuracy of our method with this NN-mechanism is significantly improved compared to the state-of-the-art methods while greatly reducing computational costs and memory overhead, making our method suitable for resource-constrained devices.
- Abstract(参考訳): 没入型AR/VRアプリケーションにおいてシームレスなユーザエクスペリエンスを実現するためには、仮想環境における完全な3次元フルボディ再構築のために、限られたセンサーで捕捉できない身体部品をこれらのモデルを用いて生成する必要があるため、効率的で効果的なニューラルネットワーク(NN)モデルの重要性は否定できない。
しかし、最先端のNNモデルは通常計算コストが高く、スパース追跡入力の長いシーケンスを活用して、時間的文脈を捉えて全身の動きを生成する。
必然的に、より長いシーケンスは計算オーバーヘッドを増大させ、生成性能に悪影響を及ぼす長期の時間依存性にノイズをもたらす。
本稿では,計算コストとメモリオーバーヘッドのバランスを保ちながら全体の性能を向上し,高効率な3次元フルボディ生成を実現するMulti-Layer Perceptron (MLP) 方式を提案する。
正確には、より長い入力列を小さな時間窓に分割するNN機構を導入する。
その後、現在の動きをこれらのウィンドウから潜在表現を通して情報とマージして、過去の状況を利用して生成する。
実験により,このNN機構による手法の生成精度は,現状の手法に比べて大幅に向上し,計算コストとメモリオーバーヘッドを大幅に低減し,資源制約のある装置に適した方法であることが確認された。
関連論文リスト
- iFlame: Interleaving Full and Linear Attention for Efficient Mesh Generation [49.8026360054331]
iFlameはメッシュ生成のためのトランスフォーマーベースの新しいネットワークアーキテクチャである。
本稿では,線形アテンションの効率とフルアテンション機構の表現力を組み合わせたインターリービング自己回帰メッシュ生成フレームワークを提案する。
提案するインターリービングフレームワークは,計算効率と生成性能を効果的にバランスさせることが示唆された。
論文 参考訳(メタデータ) (2025-03-20T19:10:37Z) - Activation-wise Propagation: A Universal Strategy to Break Timestep Constraints in Spiking Neural Networks for 3D Data Processing [29.279985043923386]
スパイキングニューロンに対する新しい状態更新機構であるAMP2(Activation-wise membrane potential Propagation)を導入する。
深いネットワークで接続をスキップすることで刺激を受け、AMP2はニューロンの膜電位をネットワークに組み込み、反復的な更新を不要にする。
提案手法は,3次元点雲やイベントストリームなど,様々な3次元モードの大幅な改善を実現する。
論文 参考訳(メタデータ) (2025-02-18T11:52:25Z) - Accelerating Linear Recurrent Neural Networks for the Edge with Unstructured Sparsity [39.483346492111515]
線形リカレントニューラルネットワークは、推論中に一定のメモリ使用量と時間毎の時間を含む強力な長距離シーケンスモデリングを可能にする。
非構造化空間は、互換性のあるハードウェアプラットフォームによって加速されるときに、計算とメモリの要求を大幅に削減できる魅力的なソリューションを提供する。
非常に疎い線形RNNは、高密度ベースラインよりも高い効率と性能のトレードオフを一貫して達成している。
論文 参考訳(メタデータ) (2025-02-03T13:09:21Z) - Magnituder Layers for Implicit Neural Representations in 3D [23.135779936528333]
我々は、"magnituder"と呼ばれる新しいニューラルネットワーク層を導入する。
標準フィードフォワード層にマグニチュードを組み込むことで、推論速度と適応性を向上する。
我々のアプローチは、訓練された暗黙的ニューラル表現モデルにおいてゼロショットのパフォーマンス向上を可能にする。
論文 参考訳(メタデータ) (2024-10-13T08:06:41Z) - Intelligence Processing Units Accelerate Neuromorphic Learning [52.952192990802345]
スパイキングニューラルネットワーク(SNN)は、エネルギー消費と遅延の観点から、桁違いに改善されている。
我々は、カスタムSNN PythonパッケージsnnTorchのIPU最適化リリースを提示する。
論文 参考訳(メタデータ) (2022-11-19T15:44:08Z) - Fluid Batching: Exit-Aware Preemptive Serving of Early-Exit Neural
Networks on Edge NPUs [74.83613252825754]
スマートエコシステム(smart ecosystems)"は、スタンドアロンではなく、センセーションが同時に行われるように形成されています。
これはデバイス上の推論パラダイムを、エッジにニューラル処理ユニット(NPU)をデプロイする方向にシフトしている。
そこで本研究では,実行時のプリエンプションが到着・終了プロセスによってもたらされる動的性を考慮に入れた,新しい早期終了スケジューリングを提案する。
論文 参考訳(メタデータ) (2022-09-27T15:04:01Z) - Gait Recognition in the Wild with Multi-hop Temporal Switch [81.35245014397759]
野生での歩行認識は、より実践的な問題であり、マルチメディアとコンピュータビジョンのコミュニティの注目を集めています。
本稿では,現実のシーンにおける歩行パターンの効果的な時間的モデリングを実現するために,新しいマルチホップ時間スイッチ方式を提案する。
論文 参考訳(メタデータ) (2022-09-01T10:46:09Z) - Real-time Hyper-Dimensional Reconfiguration at the Edge using Hardware
Accelerators [12.599871451119538]
HyDRATEは、ディープニューラルネット(DNN)と超次元(HD)コンピューティングアクセラレータを組み合わせることで、エッジでリアルタイムな再構成を行うことができる。
本稿では,アルゴリズム,訓練された量子化モデル生成,および乗算累積のない特徴抽出器の性能について述べる。
降下勾配のバックプロパゲーションを伴わないフィードフォワードHD分類器のみをリトレーニングすることで、フィールドにおける再構成性を実現する。
論文 参考訳(メタデータ) (2022-06-10T14:08:41Z) - Deep Learning for Reduced Order Modelling and Efficient Temporal
Evolution of Fluid Simulations [0.0]
Reduced Order Modelling (ROM) は、高次力学系の低次で計算コストの低い表現を作成するために広く用いられている。
そこで我々は,非線形投影が可能なニューラルネットワークを構築するために,新しい深層学習フレームワークDL-ROMを開発した。
我々のモデルDL-ROMは、学習したROMから高精度な再構成を生成でき、学習した縮小状態を時間的にトラバースすることで、将来の時間ステップを効率的に予測することができる。
論文 参考訳(メタデータ) (2021-07-09T17:21:53Z) - Multi-Temporal Convolutions for Human Action Recognition in Videos [83.43682368129072]
複数の解像度で抽出できる新しい時間・時間的畳み込みブロックを提案する。
提案するブロックは軽量で,任意の3D-CNNアーキテクチャに統合可能である。
論文 参考訳(メタデータ) (2020-11-08T10:40:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。