論文の概要: SK-Adapter: Skeleton-Based Structural Control for Native 3D Generation
- arxiv url: http://arxiv.org/abs/2603.14152v1
- Date: Sat, 14 Mar 2026 23:21:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-17 16:19:35.635964
- Title: SK-Adapter: Skeleton-Based Structural Control for Native 3D Generation
- Title(参考訳): SK-Adapter:ネイティブ3D生成のための骨格構造制御
- Authors: Anbang Wang, Yuzhuo Ao, Shangzhe Wu, Chi-Keung Tang,
- Abstract要約: SK-Adapterは、ネイティブな3D生成のための正確な骨格操作をアンロックするフレームワークである。
本手法は,基礎モデルの形状とテクスチャの質を保ちながら,頑健な構造制御を実現する。
この機能をローカルな3D編集に拡張し、既存の資産を骨格的ガイダンスで地域固有の編集を可能にする。
- 参考スコア(独自算出の注目度): 37.85948688333355
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Native 3D generative models have achieved remarkable fidelity and speed, yet they suffer from a critical limitation: inability to prescribe precise structural articulations, where precise structural control within the native 3D space remains underexplored. This paper proposes SK-Adapter, a simple and yet highly efficient and effective framework that unlocks precise skeletal manipulation for native 3D generation. Moving beyond text or image prompts, which can be ambiguous for precise structure, we treat the 3D skeleton as a first-class control signal. SK-Adapter is a lightweight structural adapter network that encodes joint coordinates and topology into learnable tokens, which are injected into the frozen 3D generation backbone via cross-attention. This smart design allows the model to not only effectively "attend" to specific 3D structural constraints but also preserve its original generative priors. To bridge the data gap, we contribute Objaverse-TMS dataset, a large-scale dataset of 24k text-mesh-skeleton pairs. Extensive experiments confirm that our method achieves robust structural control while preserving the geometry and texture quality of the foundation model, significantly outperforming existing baselines. Furthermore, we extend this capability to local 3D editing, enabling the region specific editing of existing assets with skeletal guidance, which is unattainable by previous methods. Project Page: https://sk-adapter.github.io/
- Abstract(参考訳): ネイティブな3D生成モデルは、顕著な忠実さとスピードを達成したが、それらは重大な限界に悩まされている。
本稿では,SK-Adapterを提案する。SK-Adapterはシンプルで効率的かつ効果的なフレームワークで,ネイティブ3D生成のための正確な骨格操作を実現する。
正確な構造に不明瞭なテキストや画像のプロンプトを超えて、我々は3Dスケルトンを第一級制御信号として扱う。
SK-Adapterは、ジョイント座標とトポロジを学習可能なトークンにエンコードする軽量な構造的アダプタネットワークである。
このスマートデザインにより、モデルは特定の3次元構造的制約に効果的に"適合"するだけでなく、オリジナルの生成前の制約も保持できる。
データギャップを埋めるため、24kのテキスト-メシュ-スケルトンペアからなる大規模データセットであるObjaverse-TMSデータセットをコントリビュートする。
本手法は,基礎モデルの形状やテクスチャの質を保ちながら,頑健な構造制御を実現し,既存のベースラインを著しく上回っていることを確認した。
さらに,この機能を局所的な3D編集に拡張し,既存の資産を骨格誘導で特定の編集を行えるようにした。
Project Page: https://sk-adapter.github.io/
関連論文リスト
- Stroke3D: Lifting 2D strokes into rigged 3D model via latent diffusion models [53.32092058519587]
Stroke3Dは、ユーザ入力から2D描画ストロークと記述テキストプロンプトを直接生成する新しいフレームワークである。
私たちの知識を最大限に活用するために、私たちの研究は、ユーザ引き起こされた2Dストロークに条件付けされたトリグされた3Dメッシュを初めて生成しました。
論文 参考訳(メタデータ) (2026-02-10T12:17:00Z) - Interp3D: Correspondence-aware Interpolation for Generative Textured 3D Morphing [63.141976759536625]
テクスチャ化された3DモーフィングのためのトレーニングフリーフレームワークであるInterp3Dを提案する。
生成的先行性を利用し、幾何学的忠実さとテクスチャコヒーレンスの両方を保証するために、プログレッシブアライメント原理を採用する。
包括的評価のために, 難易度の高い専用データセットInterp3DDataを構築し, 忠実度, 遷移滑らか度, 可視性から生成結果を評価する。
論文 参考訳(メタデータ) (2026-01-20T16:03:22Z) - LATTICE: Democratize High-Fidelity 3D Generation at Scale [27.310104395842075]
LATTICEは高忠実度3Dアセット生成のための新しいフレームワークである。
VoxSetは、3Dの資産を粗いボクセル格子に固定された潜在ベクトルのコンパクトな集合に圧縮する半構造化表現である。
提案手法のコアは単純だが,任意の解像度復号化,低コストトレーニング,フレキシブル推論スキームをサポートする。
論文 参考訳(メタデータ) (2025-11-24T03:22:19Z) - PercHead: Perceptual Head Model for Single-Image 3D Head Reconstruction & Editing [51.56943889042673]
PercHeadは、シングルイメージの3Dヘッド再構成とセマンティック3D編集のための方法である。
単一の入力画像からビュー一貫性を持つ3Dヘッドを再構成するための統一ベースモデルを開発する。
軽量でインタラクティブなGUIを通して、直感的で強力な3D編集機能を強調します。
論文 参考訳(メタデータ) (2025-11-04T17:59:15Z) - WorldGrow: Generating Infinite 3D World [75.81531067447203]
我々は、無限に拡張可能な3D世界、すなわちコヒーレントな幾何学と現実的な外観を持つ大規模で連続的な環境を生み出すという課題に取り組む。
本研究では,非有界な3次元シーン合成のための階層的フレームワークWorldGrowを提案する。
提案手法は,(1)高品質なシーンブロックを抽出し,シーン生成に適した3D構造化潜在表現を作成するデータキュレーションパイプライン,(2)コンテキスト認識シーン拡張を可能にする3Dブロックインペイント機構,(3)グローバルなレイアウトの妥当性と局所幾何学的/音声的忠実性の両立を保証する粗大かつ微細な生成戦略,の3つのコアコンポーネントを特徴とする。
論文 参考訳(メタデータ) (2025-10-24T17:39:52Z) - LucidDreaming: Controllable Object-Centric 3D Generation [10.646855651524387]
本稿では,テキストプロンプトコマンドや3Dバウンディングボックスのみから3次元生成を空間的,数値的に制御できるパイプラインを提案する。
LucidDreamingは、現在のアプローチと比較して、オブジェクトの配置精度と生成精度において優れた結果を得る。
論文 参考訳(メタデータ) (2023-11-30T18:55:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。