論文の概要: LLM-Guided Material Inference for 3D Point Clouds
- arxiv url: http://arxiv.org/abs/2512.03237v1
- Date: Tue, 02 Dec 2025 21:14:04 GMT
- ステータス: 情報取得中
- システム内更新日: 2025-12-04 12:10:16.726285
- Title: LLM-Guided Material Inference for 3D Point Clouds
- Title(参考訳): 3次元点雲に対するLCM誘導材料推論
- Authors: Nafiseh Izadyar, Teseo Schneider,
- Abstract要約: 本稿では,3次元点群から直接材料組成を推定する2段階の大規模言語モデル (LLM) を提案する。
Fusion/ABSとShapeNetの1,000の形状に対して,本手法は高い意味と材料的妥当性を実現する。
これらの結果は,3次元データにおける幾何学的推論と物質的理解をブリッジする上で,言語モデルが汎用的な先駆的役割を果たすことを示す。
- 参考スコア(独自算出の注目度): 4.3442696471034985
- License:
- Abstract: Most existing 3D shape datasets and models focus solely on geometry, overlooking the material properties that determine how objects appear. We introduce a two-stage large language model (LLM) based method for inferring material composition directly from 3D point clouds with coarse segmentations. Our key insight is to decouple reasoning about what an object is from what it is made of. In the first stage, an LLM predicts the object's semantic; in the second stage, it assigns plausible materials to each geometric segment, conditioned on the inferred semantics. Both stages operate in a zero-shot manner, without task-specific training. Because existing datasets lack reliable material annotations, we evaluate our method using an LLM-as-a-Judge implemented in DeepEval. Across 1,000 shapes from Fusion/ABS and ShapeNet, our method achieves high semantic and material plausibility. These results demonstrate that language models can serve as general-purpose priors for bridging geometric reasoning and material understanding in 3D data.
- Abstract(参考訳): 既存の3D形状のデータセットやモデルは、オブジェクトがどのように見えるかを決定する材料特性を見渡して、幾何学のみに焦点を絞っている。
粗いセグメンテーションを伴う3次元点雲から直接材料組成を推定する2段階の大規模言語モデル(LLM)を提案する。
私たちのキーとなる洞察は、オブジェクトが何で構成されているかから何があるのかという推論を分離することです。
第1段階では、LLMはオブジェクトの意味を予測し、第2段階では、推論された意味論に基づいて、各幾何学セグメントに可塑性物質を割り当てる。
両方のステージは、タスク固有のトレーニングなしでゼロショットで動作します。
既存のデータセットには信頼性のある資料アノテーションがないため,DeepEvalで実装されたLCM-as-a-Judgeを用いて評価を行う。
Fusion/ABSとShapeNetの1,000の形状に対して,本手法は高い意味と材料的妥当性を実現する。
これらの結果は,3次元データにおける幾何学的推論と物質的理解をブリッジする上で,言語モデルが汎用的な先駆的役割を果たすことを示す。
関連論文リスト
- Point Linguist Model: Segment Any Object via Bridged Large 3D-Language Model [51.02616473941499]
大規模言語モデル(LLM)による3Dオブジェクトのセグメンテーションは、その広範囲なセマンティクス、タスクの柔軟性、強力な一般化により、広く普及しているパラダイムとなっている。
LLMは高レベルなセマンティックトークンを処理し、3次元の点雲は密度の高い幾何学的構造のみを伝達する。
本稿では,LLMと高密度3次元点雲の間の表現ギャップを橋渡しする一般フレームワークであるポイント言語モデル(PLM)を提案する。
論文 参考訳(メタデータ) (2025-09-09T15:01:28Z) - MaterialSeg3D: Segmenting Dense Materials from 2D Priors for 3D Assets [63.284244910964475]
本稿では,2次元のセマンティクスから基礎となる物質を推定する3次元アセット素材生成フレームワークを提案する。
このような先行モデルに基づいて,材料を三次元空間で解析する機構を考案する。
論文 参考訳(メタデータ) (2024-04-22T07:00:17Z) - Unified Scene Representation and Reconstruction for 3D Large Language Models [40.693839066536505]
既存のアプローチは、基底真理(GT)幾何または補助モデルによって再構成された3次元シーンから点雲を抽出する。
凍結した2次元基礎モデルを用いて、Uni3DR2の3次元幾何学的および意味的認識表現特徴を抽出する。
我々の学習した3D表現は、再構築プロセスに貢献するだけでなく、LLMにとって貴重な知識も提供します。
論文 参考訳(メタデータ) (2024-04-19T17:58:04Z) - PointLLM: Empowering Large Language Models to Understand Point Clouds [63.39876878899682]
PointLLMは人間の指示で色のついたオブジェクトポイントクラウドを理解する。
文脈的に適切な応答を生成し、点雲と常識の把握を図示する。
論文 参考訳(メタデータ) (2023-08-31T17:59:46Z) - RandomRooms: Unsupervised Pre-training from Synthetic Shapes and
Randomized Layouts for 3D Object Detection [138.2892824662943]
有望な解決策は、CADオブジェクトモデルで構成される合成データセットをよりよく利用して、実際のデータセットでの学習を促進することである。
最近の3次元事前学習の研究は、合成物体から他の実世界の応用へ学習した伝達特性が失敗することを示している。
本研究では,この目的を達成するためにRandomRoomsという新しい手法を提案する。
論文 参考訳(メタデータ) (2021-08-17T17:56:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。