論文の概要: DeepJEB++: Foundation Model-Driven Large-Scale 3D Engineering Dataset via 2D Latent Space Augmentation
- arxiv url: http://arxiv.org/abs/2606.12994v2
- Date: Fri, 12 Jun 2026 03:35:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 13:53:03.683952
- Title: DeepJEB++: Foundation Model-Driven Large-Scale 3D Engineering Dataset via 2D Latent Space Augmentation
- Title(参考訳): DeepJEB++: 2次元遅延空間拡張による基礎モデル駆動型大規模3Dエンジニアリングデータセット
- Authors: Soyoung Yoo, Leekyo Jeong, Jinsu Ra, Dongeon Lee, Sunwoong Yang, Hyogu Jeong, Namwoo Kang,
- Abstract要約: DeepJEB++は基盤モデル駆動のデータ拡張フレームワークである。
ジェットエンジンのブラケットの小さなシードセットを、大規模なシミュレーションラベル付き3Dデータセットに拡張する。
400以下のシードデザインから始まり、DeepJEB++は15,360個のシミュレーションラベル付き3Dブラケットを出力する。
- 参考スコア(独自算出の注目度): 4.353545088427288
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data-driven engineering design is constrained by the lack of large-scale 3D datasets that pair geometry with physics-based performance labels. In particular, existing 3D data augmentation techniques have limitations in preserving subtle and diverse geometric variations, and it remains difficult to automate the subsequent simulation-labeling process, where boundary conditions vary depending on the generated geometry. We present DeepJEB++, a foundation-model-driven data-augmentation framework that expands a small seed set of jet engine brackets into a large, simulation-labeled 3D dataset under constrained resources. Our key idea is to augment in the data-rich 2D latent space, then transfer to 3D. In Stage 1, we fine-tune a pretrained 2D latent diffusion model on multi-view renders and synthesize novel views by latent interpolation, retaining manufacturable designs through a vision-language-model (VLM) quality filter. In Stage 2, the validated images are lifted to 3D meshes by a domain-adapted generative foundation model. In Stage 3, an automated pipeline recognizes the load and bolt interfaces on each mesh and assigns finite-element labels -- mass, stress, and displacement -- without manual intervention. We assess augmentation quality along three intrinsic axes: manufacturability, label fidelity against the SimJEB ground truth, and distributional consistency. Starting from fewer than 400 seed designs, DeepJEB++ yields 15,360 simulation-labeled 3D brackets -- a 40x expansion -- using a single GPU per stage. The dataset will be made publicly available to support reproducible engineering-AI research.
- Abstract(参考訳): データ駆動エンジニアリング設計は、物理ベースのパフォーマンスラベルと幾何学を組み合わせた大規模な3Dデータセットが欠如していることに制約されている。
特に、既存の3Dデータ拡張技術は微妙で多様な幾何学的変動を保存するのに限界があり、生成した幾何によって境界条件が変わるようなシミュレーションラベルプロセスの自動化は依然として困難である。
基礎モデル駆動型データ拡張フレームワークであるDeepJEB++は,ジェットエンジンブラケットの小さなシードセットを,制約されたリソース下でのシミュレーションラベル付き大規模3Dデータセットに拡張する。
私たちのキーとなるアイデアは、データリッチな2Dラテント空間を拡大し、それから3Dに移行することです。
ステージ1では,マルチビューレンダリング上で事前学習した2次元潜伏拡散モデルを微調整し,潜伏補間により新規なビューを合成し,視覚言語モデル(VLM)品質フィルタによる製造可能な設計を維持する。
ステージ2では、検証済み画像をドメイン適応生成基盤モデルにより3Dメッシュにリフトする。
ステージ3では、自動パイプラインが各メッシュ上の負荷とボルトのインターフェースを認識し、手動で介入することなく有限要素ラベル(質量、応力、変位)を割り当てる。
本研究は,製造性,SimJEB基底真理に対するラベル忠実度,分布整合性という3つの本質的軸に沿った拡張品質を評価する。
400以下のシードデザインから始まり、DeepJEB++はステージ毎に1つのGPUを使用して15,360個のシミュレーションラベル付き3Dブラケット(40倍拡張)を得る。
データセットは、再現可能なエンジニアリング-AI研究をサポートするために公開されます。
関連論文リスト
- Generative Texture Diversification of 3D Pedestrians for Robust Autonomous Driving Perception [0.0]
本稿では,合成シーン生成のための3次元歩行者資産における変動性のスケーリング手法を提案する。
我々は、多様な顔のテクスチャとアイデンティティレベルの外観変化を合成することにより、複数の異なる歩行者インスタンスを生成する。
これらの資産を用いて, 合成データセットを構築し, 実データと合成データを混合したRGBオブジェクト検出の影響について検討する。
論文 参考訳(メタデータ) (2026-05-13T16:35:50Z) - Holi-Spatial: Evolving Video Streams into Holistic 3D Spatial Intelligence [78.1406635199656]
Holi-Spatialは、人間の介入なしに生のビデオ入力から構築された、初めて完全に自動化され、大規模で、空間対応のマルチモーダルデータセットである。
Holi-Spatial-4Mは、12K最適化された3DGSシーン、1.3Mの2Dマスク、320Kの3Dバウンディングボックス、320Kのインスタンスキャプション、1.2Mの3Dグラウンドインスタンス、1.2Mの空間QAペアを含む、最初の大規模で高品質な3Dセマンティックデータセットである。
論文 参考訳(メタデータ) (2026-03-08T14:49:20Z) - Step1X-3D: Towards High-Fidelity and Controllable Generation of Textured 3D Assets [90.99212668875971]
Step1X-3Dは、データの不足、アルゴリズムの制限、エコシステムの断片化といった課題に対処するオープンフレームワークである。
拡散型テクスチャ合成モジュールとハイブリッドVAE-DiTジオメトリジェネレータを組み合わせた2段階の3Dネイティブアーキテクチャを提案する。
ベンチマークの結果は、既存のオープンソースメソッドを超える最先端のパフォーマンスを示している。
論文 参考訳(メタデータ) (2025-05-12T16:56:30Z) - Unified Cross-Scale 3D Generation and Understanding via Autoregressive Modeling [32.45851798752336]
クロススケールな3D生成と理解のための統合自己回帰フレームワークUni-3DARを提案する。
コアとなるのはオクツリーデータ構造に基づく粗大なトークンライザで、多様な3D構造をコンパクトな1Dトークンシーケンスに圧縮する。
圧縮によって引き起こされる動的に異なるトークン位置の課題に対処するために,マスク付き次世代予測戦略を導入する。
論文 参考訳(メタデータ) (2025-03-20T16:07:04Z) - DIRECT-3D: Learning Direct Text-to-3D Generation on Massive Noisy 3D Data [50.164670363633704]
テキストプロンプトから高品質な3Dアセットを作成するための拡散型3D生成モデルであるDIRECT-3Dを提案する。
我々のモデルは、広範に騒々しく不整合な3D資産で直接訓練されている。
単一クラス生成とテキスト・ツー・3D生成の両方で最先端の性能を実現する。
論文 参考訳(メタデータ) (2024-06-06T17:58:15Z) - Pushing Auto-regressive Models for 3D Shape Generation at Capacity and Scalability [118.26563926533517]
自己回帰モデルでは,格子空間における関節分布をモデル化することにより,2次元画像生成において顕著な結果が得られた。
自動回帰モデルを3次元領域に拡張し,キャパシティとスケーラビリティを同時に向上することにより,3次元形状生成の強力な能力を求める。
論文 参考訳(メタデータ) (2024-02-19T15:33:09Z) - Retrieval-Augmented Score Distillation for Text-to-3D Generation [30.57225047257049]
テキストから3D生成における検索に基づく品質向上のための新しいフレームワークを提案する。
我々はReDreamが幾何整合性を高めて優れた品質を示すことを示すために広範な実験を行った。
論文 参考訳(メタデータ) (2024-02-05T12:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。