論文の概要: 3D-CBM: A Framework for Concept-Based Interpretability in Generative 3D Modeling
- arxiv url: http://arxiv.org/abs/2606.11446v1
- Date: Tue, 09 Jun 2026 20:57:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-11 16:42:38.179682
- Title: 3D-CBM: A Framework for Concept-Based Interpretability in Generative 3D Modeling
- Title(参考訳): 3D-CBM:ジェネレーティブ3次元モデリングにおける概念ベースの解釈可能性のためのフレームワーク
- Authors: Ahmad Al-Kabbany,
- Abstract要約: 本研究は,CBM(Concept Bottleneck Models)を3次元生成アーキテクチャに組み込むためのフレームワークを紹介する。
CBMは、人間の定義した概念に合わせるために潜在表現を制約することで、本質的な解釈可能性ソリューションを提供する。
我々は、点雲やメッシュを含む生の幾何学的入力を解釈可能なプリミティブと機能属性の分類にマッピングする形式的な3D-CBMアーキテクチャを設計、実装、検証する。
- 参考スコア(独自算出の注目度): 0.7614628596146601
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This research introduces a framework for incorporating Concept Bottleneck Models (CBMs) into 3D generative architectures to address the inherent 'semantic gap' in deep geometric learning. As deep models become central to 3D content creation, explainability shifts from a peripheral feature to a fundamental requirement for trust and accountability in safety-critical domains such as healthcare and manufacturing. CBMs provide an intrinsic interpretability solution by constraining latent representations to align with human-defined concepts, yet their application to unstructured 3D data remains largely unexplored. We design, implement, and validate a formal 3D-CBM architecture that maps raw geometric inputs, including point clouds and meshes, into a multi-tiered taxonomy of interpretable primitives and functional attributes. The framework further identifies strategic datasets, such as PartNet and ShapeNet, specialized for concept-based supervision. Experimental results from a 3D part-manipulation proof-of-concept experiment demonstrate the framework's efficacy, achieving a concept prediction accuracy of 88.8\% and a Chamfer Distance of 0.0115. Critically, the model enables precise test-time intervention, allowing for the interactive correction of structural errors. This work establishes a foundation for semantically-steerable 3D generation and invites further exploration into collaborative human-in-the-loop design systems.
- Abstract(参考訳): 本研究では,深層幾何学学習における「意味的ギャップ」に対処するため,概念ボトルネックモデル(CBM)を3次元生成アーキテクチャに組み込む枠組みを提案する。
ディープモデルが3Dコンテンツ作成の中心となるにつれ、医療や製造業といった安全クリティカルな領域における信頼と説明責任の基本的な要件が、周辺機能から移行していく。
CBMは、人間の定義した概念に適合するように潜在表現を制約することで、本質的な解釈可能性のソリューションを提供する。
我々は、点雲やメッシュを含む生の幾何学的入力を解釈可能なプリミティブと機能属性の多層分類にマッピングする形式的な3D-CBMアーキテクチャを設計、実装、検証する。
このフレームワークはさらに、概念ベースの監視に特化したPartNetやShapeNetといった戦略的データセットを識別する。
3次元部分操作型概念実証実験による実験結果から, 概念予測精度88.8\%, チャンファー距離0.0115を達成し, フレームワークの有効性を実証した。
重要な点として、このモデルは正確なテスト時間介入を可能にし、構造的エラーの相互修正を可能にする。
この研究はセマンティック・ステアブルな3D生成の基礎を確立し、協調的な人間-イン・ザ・ループの設計システムを探究する。
関連論文リスト
- A Persistent Homology Design Space for 3D Point Cloud Deep Learning [5.810033007426438]
Persistent Homology (PH)は、本質的な形状の安定なマルチスケール記述子を提供する。
強力な理論的保証と経験的採用の増大にもかかわらず、ポイントクラウドのためのディープラーニングへの統合は、概してアドホックであり、アーキテクチャ的にも周辺的である。
本研究では,3次元点群における永続-ホモロジー駆動学習のための統一設計空間を提案する。
論文 参考訳(メタデータ) (2026-04-05T22:38:37Z) - TFusionOcc: Student's t-Distribution Based Object-Centric Multi-Sensor Fusion Framework for 3D Occupancy Prediction [8.44168738898516]
本稿では,TFusionOccについて紹介する。TFusionOccは3次元セマンティック占有率を予測するためのオブジェクト中心型多センサ融合フレームワークである。
マルチステージマルチセンサ融合,学生のt-分布,T-Mixtureモデル(TMM)を活用することにより,提案手法はnuScenesベンチマークで最先端(SOTA)性能を達成した。
論文 参考訳(メタデータ) (2026-02-06T05:43:42Z) - CoRe3D: Collaborative Reasoning as a Foundation for 3D Intelligence [6.2150701899678635]
CoRe3Dは、意味的および空間的抽象化を共同で操作する統合された3D理解および生成推論フレームワークを導入している。
CoRe3Dは、セマンティック・チェーン・オブ・セマンティック・チェーン・推論と構造的空間的推論を密結合することにより、強い局所的な一貫性と言語記述との忠実な整合性を示す3D出力を生成する。
論文 参考訳(メタデータ) (2025-12-14T17:05:11Z) - OPFormer: Object Pose Estimation leveraging foundation model with geometric encoding [2.1987601456703474]
オブジェクト検出とポーズ推定をシームレスに統合する統合されたエンドツーエンドフレームワークを導入する。
当システムではまずCNOS検出器を用いて対象物体のローカライズを行う。
検出毎に、新しいポーズ推定モジュールOPFormerが正確な6Dポーズを推測する。
論文 参考訳(メタデータ) (2025-11-16T14:19:52Z) - Spatial Understanding from Videos: Structured Prompts Meet Simulation Data [89.77871049500546]
本稿では,事前学習された視覚言語モデルにおける3次元空間推論を,アーキテクチャを変更することなく拡張するための統一的なフレームワークを提案する。
このフレームワークは、複雑なシーンと質問を解釈可能な推論ステップに分解する構造化プロンプト戦略であるSpatialMindと、多様な3Dシミュレーションシーンから構築されたスケーラブルな質問応答データセットであるScanForgeQAを組み合わせる。
論文 参考訳(メタデータ) (2025-06-04T07:36:33Z) - Cross-Modal and Uncertainty-Aware Agglomeration for Open-Vocabulary 3D Scene Understanding [58.38294408121273]
CUA-O3Dと呼ばれるオープン語彙3次元シーン理解のためのクロスモーダル・不確実性認識アグリゲーションを提案する。
提案手法は,(1)空間認識型視覚基盤モデルの幾何学的知識とともに,VLMのセマンティックな先入観を取り入れること,(2)モデル固有の不確かさを捉えるために,新しい決定論的不確実性推定を用いること,の2つの課題に対処する。
論文 参考訳(メタデータ) (2025-03-20T20:58:48Z) - JADE: Joint-aware Latent Diffusion for 3D Human Generative Modeling [62.77347895550087]
JADEは人体形状の変化を微粒化制御で学習する生成フレームワークである。
私たちの重要な洞察は、人体を骨格構造に分解する共同認識の潜伏表現です。
提案した分解条件下でのコヒーレントで可塑性な人体形状を生成するため,カスケードパイプラインも提案する。
論文 参考訳(メタデータ) (2024-12-29T14:18:35Z) - Geometric Deep Learning for Structure-Based Drug Design: A Survey [83.87489798671155]
構造に基づく薬物設計(SBDD)は、タンパク質の3次元幾何学を利用して、潜在的な薬物候補を特定する。
近年の幾何学的深層学習の進歩は、3次元幾何学的データを効果的に統合・処理し、この分野を前進させてきた。
論文 参考訳(メタデータ) (2023-06-20T14:21:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。