論文の概要: How to Sample High Quality 3D Fractals for Action Recognition Pre-Training?
- arxiv url: http://arxiv.org/abs/2602.11810v1
- Date: Thu, 12 Feb 2026 10:48:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-13 21:07:25.776739
- Title: How to Sample High Quality 3D Fractals for Action Recognition Pre-Training?
- Title(参考訳): 行動認識のための高品質な3次元フラクタルのサンプリング法
- Authors: Marko Putak, Thomas B. Moeslund, Joakim Bruslund Haurum,
- Abstract要約: 我々は3次元反復関数システム(IFS)を用いて3次元フラクタルを生成し、行動認識モデルの事前学習を行う。
フラクタル生成の標準的な手法は遅く, 縮退した3次元フラクタルを生成する。
生成速度とフラクタル多様性の両問題に対処する新しい手法であるTargeted Smart Filteringを提案する。
- 参考スコア(独自算出の注目度): 20.749900268336244
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Synthetic datasets are being recognized in the deep learning realm as a valuable alternative to exhaustively labeled real data. One such synthetic data generation method is Formula Driven Supervised Learning (FDSL), which can provide an infinite number of perfectly labeled data through a formula driven approach, such as fractals or contours. FDSL does not have common drawbacks like manual labor, privacy and other ethical concerns. In this work we generate 3D fractals using 3D Iterated Function Systems (IFS) for pre-training an action recognition model. The fractals are temporally transformed to form a video that is used as a pre-training dataset for downstream task of action recognition. We find that standard methods of generating fractals are slow and produce degenerate 3D fractals. Therefore, we systematically explore alternative ways of generating fractals and finds that overly-restrictive approaches, while generating aesthetically pleasing fractals, are detrimental for downstream task performance. We propose a novel method, Targeted Smart Filtering, to address both the generation speed and fractal diversity issue. The method reports roughly 100 times faster sampling speed and achieves superior downstream performance against other 3D fractal filtering methods.
- Abstract(参考訳): 合成データセットは、ディープラーニング領域において、徹底的にラベル付けされた実データに対する価値ある代替物として認識されている。
このような合成データ生成手法の1つはフォーミュラ駆動監視学習(FDSL)であり、フラクタルや輪郭のような公式駆動のアプローチにより、無限数の完全ラベル付きデータを提供できる。
FDSLには、手作業やプライバシ、その他の倫理的懸念など、一般的な欠点はありません。
本研究では,3次元反復関数システム(IFS)を用いて3次元フラクタルを生成し,行動認識モデルの事前学習を行う。
フラクタルは時間的に変換され、アクション認識の下流タスクのためのトレーニング済みデータセットとして使用されるビデオを形成する。
フラクタル生成の標準的な手法は遅く, 縮退した3次元フラクタルを生成する。
そこで我々は, フラクタル生成の代替手法を体系的に検討し, 過度に制限されたアプローチが, 審美的に満足なフラクタルを生成する一方で, 下流タスクのパフォーマンスを損なうことを発見した。
生成速度とフラクタル多様性の両問題に対処する新しい手法であるTargeted Smart Filteringを提案する。
本手法はサンプリング速度の約100倍の速さで, 他の3次元フラクタルフィルタ法と比較して下流性能に優れる。
関連論文リスト
- Extreme Views: 3DGS Filter for Novel View Synthesis from Out-of-Distribution Camera Poses [3.007949058551534]
トレーニングデータ分布の外にカメラ位置から3Dガウススプラッティング(3DGS)モデルを見る場合、かなりの視覚ノイズが発生することが一般的である。
本稿では,この問題に対処する新しいリアルタイムレンダリング対応フィルタリング手法を提案する。
提案手法は,既存のNeRF(Neural Radiance Field)ベースのアプローチと比較して,視覚的品質,リアリズム,一貫性を著しく向上する。
論文 参考訳(メタデータ) (2025-10-22T21:09:16Z) - Reconstructing Humans with a Biomechanically Accurate Skeleton [55.06027148976482]
本研究では,生体力学的に正確な骨格モデルを用いて,単一の画像から3次元人体を再構築する手法を提案する。
3次元メッシュ回復のための最先端の手法と比較して,我々のモデルは標準ベンチマーク上での競合性能を実現している。
論文 参考訳(メタデータ) (2025-03-27T17:56:24Z) - Triplane Meets Gaussian Splatting: Fast and Generalizable Single-View 3D
Reconstruction with Transformers [37.14235383028582]
本稿では,フィードフォワード推論を用いて,単一画像から3次元モデルを効率よく生成する,一視点再構成のための新しい手法を提案する。
提案手法では,2つのトランスフォーマーネットワーク,すなわちポイントデコーダとトリプレーンデコーダを用いて,ハイブリッドトリプレーン・ガウス中間表現を用いて3次元オブジェクトを再構成する。
論文 参考訳(メタデータ) (2023-12-14T17:18:34Z) - Randomized 3D Scene Generation for Generalizable Self-Supervised
Pre-Training [0.0]
球面高調波を用いた3次元シーン生成手法を提案する。
従来の定式化法をクリアマージンで上回り、実世界のスキャンとCADモデルを用いた手法を用いて、中間結果を得る。
論文 参考訳(メタデータ) (2023-06-07T08:28:38Z) - NeRF-GAN Distillation for Efficient 3D-Aware Generation with
Convolutions [97.27105725738016]
GAN(Generative Adversarial Networks)のようなニューラルラジアンスフィールド(NeRF)と生成モデルの統合は、単一ビュー画像から3D認識生成を変換した。
提案手法は,ポーズ条件付き畳み込みネットワークにおいて,事前学習したNeRF-GANの有界遅延空間を再利用し,基礎となる3次元表現に対応する3D一貫性画像を直接生成する手法である。
論文 参考訳(メタデータ) (2023-03-22T18:59:48Z) - Fast Non-Rigid Radiance Fields from Monocularized Data [66.74229489512683]
本稿では,不規則に変形するシーンを360度内向きに合成する新しい手法を提案する。
提案手法のコアとなるのは, 空間情報と時間情報の処理を分離し, 訓練と推論を高速化する効率的な変形モジュール, 2) 高速ハッシュ符号化ニューラルラジオアンスフィールドとしての標準シーンを表す静的モジュールである。
どちらの場合も,本手法は従来の手法よりもはるかに高速で,7分未満で収束し,1K解像度でリアルタイムのフレームレートを実現するとともに,生成した新規なビューに対して高い視覚的精度が得られる。
論文 参考訳(メタデータ) (2022-12-02T18:51:10Z) - Fast-SNARF: A Fast Deformer for Articulated Neural Fields [92.68788512596254]
本稿では,標準空間とポーズ空間の正確な対応性を求める,ニューラルフィールドのための新しい調音モジュールFast-SNARFを提案する。
Fast-SNARFはこれまでの研究であるSNARFの代替であり、計算効率は大幅に向上した。
変形マップの学習は多くの3次元人間のアバター法において重要な要素であるため、この研究は3次元仮想人間の実現に向けた重要なステップであると考えている。
論文 参考訳(メタデータ) (2022-11-28T17:55:34Z) - Semi-Supervised Adversarial Recognition of Refined Window Structures for
Inverse Procedural Fa\c{c}ade Modeling [17.62526990262815]
本稿では,逆手続きモデルに組み込んだ半教師付き対角認識戦略を提案する。
既存の3Dモデリングソフトウェアの内部に、単純なプロシージャエンジンが構築され、きめ細かい窓のジオメトリが生成される。
公開されているファサード画像データセットを用いた実験により、提案したトレーニング戦略により、分類精度が約10%向上できることが判明した。
論文 参考訳(メタデータ) (2022-01-22T06:34:48Z) - Deep Marching Tetrahedra: a Hybrid Representation for High-Resolution 3D
Shape Synthesis [90.26556260531707]
DMTetは粗いボクセルのような単純なユーザーガイドを用いて高解像度の3次元形状を合成できる条件付き生成モデルである。
メッシュなどの明示的な表現を直接生成する深部3次元生成モデルとは異なり、我々のモデルは任意の位相で形状を合成することができる。
論文 参考訳(メタデータ) (2021-11-08T05:29:35Z) - DEF: Deep Estimation of Sharp Geometric Features in 3D Shapes [43.853000396885626]
サンプル3次元形状のシャープな幾何学的特徴を予測するための学習ベースフレームワークを提案する。
個々のパッチの結果を融合させることで、既存のデータ駆動方式では処理できない大きな3Dモデルを処理できる。
論文 参考訳(メタデータ) (2020-11-30T18:21:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。