論文の概要: Human-in-the-Loop: Quantitative Evaluation of 3D Models Generation by Large Language Models
- arxiv url: http://arxiv.org/abs/2509.07010v1
- Date: Sat, 06 Sep 2025 11:04:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-10 14:38:27.020526
- Title: Human-in-the-Loop: Quantitative Evaluation of 3D Models Generation by Large Language Models
- Title(参考訳): 人間のループ:大規模言語モデルによる3次元モデル生成の定量的評価
- Authors: Ahmed R. Sadik, Mariusz Bujny,
- Abstract要約: 本稿では,大規模言語モデルの生成した3次元モデルの定量的評価のためのループ・フレームワークの人間について紹介する。
本稿では, 体積精度, 表面アライメント, 次元忠実度, トポロジ的複雑度など, 類似度と複雑性の総合的な指標スイートを提案する。
本研究は,コードレベルが完璧に再構築され,意味的豊かさが向上し,生成精度が向上したことを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models are increasingly capable of interpreting multimodal inputs to generate complex 3D shapes, yet robust methods to evaluate geometric and structural fidelity remain underdeveloped. This paper introduces a human in the loop framework for the quantitative evaluation of LLM generated 3D models, supporting applications such as democratization of CAD design, reverse engineering of legacy designs, and rapid prototyping. We propose a comprehensive suite of similarity and complexity metrics, including volumetric accuracy, surface alignment, dimensional fidelity, and topological intricacy, to benchmark generated models against ground truth CAD references. Using an L bracket component as a case study, we systematically compare LLM performance across four input modalities: 2D orthographic views, isometric sketches, geometric structure trees, and code based correction prompts. Our findings demonstrate improved generation fidelity with increased semantic richness, with code level prompts achieving perfect reconstruction across all metrics. A key contribution of this work is demonstrating that our proposed quantitative evaluation approach enables significantly faster convergence toward the ground truth, especially compared to traditional qualitative methods based solely on visual inspection and human intuition. This work not only advances the understanding of AI assisted shape synthesis but also provides a scalable methodology to validate and refine generative models for diverse CAD applications.
- Abstract(参考訳): 大規模言語モデルは複雑な3次元形状を生成するために多モード入力を解釈する能力がますます高まっているが、幾何的および構造的忠実性を評価する頑健な方法はまだ未発達である。
本稿では,CAD設計の民主化,レガシ設計のリバースエンジニアリング,ラピッドプロトタイピングなどの応用を支援するために,LLM生成した3次元モデルの定量的評価のためのループ・フレームワークの人間を紹介した。
そこで本研究では,地平線CAD参照に対して生成したモデルをベンチマークするために,体積精度,表面アライメント,次元忠実度,トポロジ的複雑度を含む,類似度と複雑性の総合的な尺度スイートを提案する。
ケーススタディとしてLブラケットコンポーネントを用いて,2次元の正書法ビュー,等尺スケッチ,幾何学的構造木,コードに基づく修正プロンプトの4つの入力モードでLLM性能を体系的に比較する。
以上の結果から,意味的豊かさの向上による生成精度の向上が示され,コードレベルが全メトリクスにわたって完全な再構築を実現することが示唆された。
特に視覚検査と人間の直感のみに基づく従来の定性的手法と比較して,本研究の重要な貢献は,提案手法が地上の真理への収束を著しく高速化できることである。
この研究は、AI支援形状合成の理解を深めるだけでなく、多様なCADアプリケーションのための生成モデルを検証・洗練するためのスケーラブルな方法論も提供する。
関連論文リスト
- GIQ: Benchmarking 3D Geometric Reasoning of Vision Foundation Models with Simulated and Real Polyhedra [33.53387523266523]
本稿では,視覚モデルと視覚言語基礎モデルの幾何学的推論能力を評価するためのベンチマークであるGIQを紹介する。
GIQは224種類の多面体からなる合成および実世界の画像からなる。
論文 参考訳(メタデータ) (2025-06-09T20:11:21Z) - PRISM: Probabilistic Representation for Integrated Shape Modeling and Generation [79.46526296655776]
PRISMは、カテゴリー拡散モデルと統計的形状モデル(SSM)とガウス混合モデル(GMM)を統合した3次元形状生成の新しいアプローチである
本手法では,構成SSMを用いて部分レベルの幾何学的変動をキャプチャし,GMMを用いて連続空間における部分意味を表現する。
提案手法は,パートレベルの操作の品質と制御性の両方において,従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2025-04-06T11:48:08Z) - CADDreamer: CAD Object Generation from Single-view Images [43.59340035126575]
既存の3D生成モデルは、しばしば過度に密度が高く非構造的なメッシュを生成する。
本稿では,CADオブジェクトの境界表現(B-rep)を単一画像から生成するための新しいアプローチであるCADDreamerを紹介する。
その結果,本手法は単視点画像から高品質CADオブジェクトを効果的に回収することを示した。
論文 参考訳(メタデータ) (2025-02-28T05:30:29Z) - JADE: Joint-aware Latent Diffusion for 3D Human Generative Modeling [62.77347895550087]
JADEは人体形状の変化を微粒化制御で学習する生成フレームワークである。
私たちの重要な洞察は、人体を骨格構造に分解する共同認識の潜伏表現です。
提案した分解条件下でのコヒーレントで可塑性な人体形状を生成するため,カスケードパイプラインも提案する。
論文 参考訳(メタデータ) (2024-12-29T14:18:35Z) - MultiGO: Towards Multi-level Geometry Learning for Monocular 3D Textured Human Reconstruction [4.457326808146675]
本稿では, 単眼画像から3次元布体を再構築する研究課題について検討する。
既存のアプローチでは、事前訓練されたSMPL(-X)推定モデルや生成モデルを利用して、人間の再構築に補助情報を提供する。
技術的には,骨格レベルの強化,関節レベルの強化,輪郭レベルの改良モジュールの3つの重要なコンポーネントを設計する。
論文 参考訳(メタデータ) (2024-12-04T08:06:06Z) - Human as Points: Explicit Point-based 3D Human Reconstruction from Single-view RGB Images [71.91424164693422]
我々はHaPと呼ばれる明示的なポイントベース人間再構築フレームワークを導入する。
提案手法は,3次元幾何学空間における完全明示的な点雲推定,操作,生成,洗練が特徴である。
我々の結果は、完全に明示的で幾何学中心のアルゴリズム設計へのパラダイムのロールバックを示すかもしれない。
論文 参考訳(メタデータ) (2023-11-06T05:52:29Z) - Geometric Deep Learning for Structure-Based Drug Design: A Survey [83.87489798671155]
構造に基づく薬物設計(SBDD)は、タンパク質の3次元幾何学を利用して、潜在的な薬物候補を特定する。
近年の幾何学的深層学習の進歩は、3次元幾何学的データを効果的に統合・処理し、この分野を前進させてきた。
論文 参考訳(メタデータ) (2023-06-20T14:21:58Z) - Translational Symmetry-Aware Facade Parsing for 3D Building
Reconstruction [11.263458202880038]
本稿では,深部ニューラルネットワーク改善のための新しい翻訳対称性に基づくアプローチを提案する。
本研究では,単一段ネットワークにおけるアンカーフリー検出を融合させる新しい手法を提案する。
我々はBlenderのような市販のレンダリングエンジンを使用して、手続きモデルを用いて現実的な高品質な3Dモデルを再構築する。
論文 参考訳(メタデータ) (2021-06-02T03:10:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。