Fugu-MT 論文翻訳(概要): Chirpy3D: Continuous Part Latents for Creative 3D Bird Generation

論文の概要: Chirpy3D: Continuous Part Latents for Creative 3D Bird Generation

arxiv url: http://arxiv.org/abs/2501.04144v1
Date: Tue, 07 Jan 2025 21:14:11 GMT
ステータス: 翻訳完了
システム内更新日: 2025-01-09 16:10:19.503474
Title: Chirpy3D: Continuous Part Latents for Creative 3D Bird Generation
Title（参考訳）: Chirpy3D: 創造的な3Dバードジェネレーションのための連続部品潜水装置
Authors: Kam Woh Ng, Jing Yang, Jia Wei Sii, Jiankang Deng, Chee Seng Chan, Yi-Zhe Song, Tao Xiang, Xiatian Zhu,
Abstract要約: 現在のメソッドは複雑な詳細を欠いているか、既存のオブジェクトを単純に模倣している。マルチビュー拡散およびモデリング部を連続分布として使用することで、完全に新しい、かつ可塑性なパーツを生成することができる。その結果、既存の例を超越した種特異的な細部を持つ新しい3Dオブジェクトを作成できる最初のシステムとなった。
参考スコア（独自算出の注目度）: 128.23917788822948
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In this paper, we push the boundaries of fine-grained 3D generation into truly creative territory. Current methods either lack intricate details or simply mimic existing objects -- we enable both. By lifting 2D fine-grained understanding into 3D through multi-view diffusion and modeling part latents as continuous distributions, we unlock the ability to generate entirely new, yet plausible parts through interpolation and sampling. A self-supervised feature consistency loss further ensures stable generation of these unseen parts. The result is the first system capable of creating novel 3D objects with species-specific details that transcend existing examples. While we demonstrate our approach on birds, the underlying framework extends beyond things that can chirp! Code will be released at https://github.com/kamwoh/chirpy3d.
Abstract（参考訳）: 本稿では,細粒度3D世代の境界を真に創造的な領域に推し進める。現在のメソッドには複雑な詳細が欠けているか、既存のオブジェクトを単純に模倣しているのです。多視点拡散・モデリング部を連続分布とする2次元微粒化理解を3次元に引き上げることで、補間とサンプリングによって完全に新しい、しかしもっともらしい部品を生成することができる。自己監督的特徴整合性損失は、これらの見えない部分の安定した生成をさらに保証する。その結果、既存の例を超越した種特異的な細部を持つ新しい3Dオブジェクトを作成できる最初のシステムとなった。鳥に対する私たちのアプローチを実証する一方で、基盤となるフレームワークは、刈り取ることができるものを超えて拡張されています! コードはhttps://github.com/kamwoh/chirpy3d.comでリリースされる。

関連論文リスト

PartCrafter: Structured 3D Mesh Generation via Compositional Latent Diffusion Transformers [29.52313100024294]
1枚のRGB画像から複数の意味論的および幾何学的に異なる3Dメッシュを共同で合成する最初の構造化3D生成モデルであるPartCrafterを紹介する。 PartCrafterは同時に複数の3Dパーツを識別し、個々のオブジェクトと複雑な複数オブジェクトのシーンの両方をエンドツーエンドで生成する。実験によると、PartCrafterは分解可能な3Dメッシュの生成において、既存のアプローチよりも優れています。
論文参考訳（メタデータ） (2025-06-05T20:30:28Z)
PartGen: Part-level 3D Generation and Reconstruction with Multi-View Diffusion Models [63.1432721793683]
テキスト,画像,構造化されていない3Dオブジェクトから意味のある部分からなる3Dオブジェクトを生成する新しいアプローチであるPartGenを紹介する。提案手法は, 生成された実物および実物の3次元資産に対して評価し, セグメンテーションおよび部分抽出ベースラインを大きなマージンで上回っていることを示す。
論文参考訳（メタデータ） (2024-12-24T18:59:43Z)
ComboVerse: Compositional 3D Assets Creation Using Spatially-Aware Diffusion Guidance [76.7746870349809]
複雑な構成で高品質な3Dアセットを生成する3D生成フレームワークであるComboVerseについて,複数のモデルを組み合わせることを学習して紹介する。提案手法は,標準スコア蒸留法と比較して,物体の空間的アライメントを重視している。
論文参考訳（メタデータ） (2024-03-19T03:39:43Z)
Sculpt3D: Multi-View Consistent Text-to-3D Generation with Sparse 3D Prior [57.986512832738704]
本稿では,2次元拡散モデルを再学習することなく,抽出した参照オブジェクトから3次元先行を明示的に注入する,電流パイプラインを備えた新しいフレームワークSculpt3Dを提案する。具体的には、スパース線サンプリングによるキーポイントの監督により、高品質で多様な3次元形状を保証できることを実証する。これら2つの分離された設計は、参照オブジェクトからの3D情報を利用して、2D拡散モデルの生成品質を保ちながら、3Dオブジェクトを生成する。
論文参考訳（メタデータ） (2024-03-14T07:39:59Z)
WildFusion: Learning 3D-Aware Latent Diffusion Models in View Space [77.92350895927922]
潜在拡散モデル(LDM)に基づく3次元画像合成の新しいアプローチであるWildFusionを提案する。我々の3D対応LCMは、マルチビュー画像や3D幾何学を直接監督することなく訓練されている。これにより、スケーラブルな3D認識画像合成と、Wild画像データから3Dコンテンツを作成するための有望な研究道が開かれる。
論文参考訳（メタデータ） (2023-11-22T18:25:51Z)
Iterative Superquadric Recomposition of 3D Objects from Multiple Views [77.53142165205283]
2次元ビューから直接3次元スーパークワッドリックを意味部品として用いたオブジェクトを再構成するフレームワークISCOを提案する。我々のフレームワークは、再構成エラーが高い場合に、反復的に新しいスーパークワッドリックを追加します。これは、野生の画像からでも、より正確な3D再構成を提供する。
論文参考訳（メタデータ） (2023-09-05T10:21:37Z)
Creative Birds: Self-Supervised Single-View 3D Style Transfer [23.64817899864608]
形状とテクスチャを両立させたユニークな3Dオブジェクトを生成する一視点3Dスタイル転送法を提案する。本研究は,3次元再構成において一般的な課題である鳥に焦点をあてるものであり,既存の単視3次元転写法は開発されていない。
論文参考訳（メタデータ） (2023-07-26T11:47:44Z)
Anything-3D: Towards Single-view Anything Reconstruction in the Wild [61.090129285205805]
本稿では,一連の視覚言語モデルとSegment-Anythingオブジェクトセグメンテーションモデルを組み合わせた方法論的フレームワークであるAnything-3Dを紹介する。提案手法では、BLIPモデルを用いてテキスト記述を生成し、Segment-Anythingモデルを用いて関心対象を効果的に抽出し、テキスト・画像拡散モデルを用いて物体を神経放射場へ持ち上げる。
論文参考訳（メタデータ） (2023-04-19T16:39:51Z)
Generative Novel View Synthesis with 3D-Aware Diffusion Models [96.78397108732233]
単一入力画像から3D対応の新規ビュー合成のための拡散モデルを提案する。提案手法は既存の2次元拡散バックボーンを利用するが,重要な点として,幾何学的先行を3次元特徴体積の形で組み込む。新たなビュー生成に加えて,本手法は3次元一貫性シーケンスを自己回帰的に合成する機能を備えている。
論文参考訳（メタデータ） (2023-04-05T17:15:47Z)
DensePose 3D: Lifting Canonical Surface Maps of Articulated Objects to the Third Dimension [71.71234436165255]
DensePose 3Dは2次元画像アノテーションのみから弱い教師付きで再構築を学習できる手法である。 3Dスキャンを必要としないため、DensePose 3Dは異なる動物種などの幅広いカテゴリーの学習に利用できる。我々は,人間と動物のカテゴリーの合成データと実データの両方をベースラインとして,最先端の非剛体構造と比較し,顕著な改善を示した。
論文参考訳（メタデータ） (2021-08-31T18:33:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。