論文の概要: SRAM: Shape-Realism Alignment Metric for No Reference 3D Shape Evaluation
- arxiv url: http://arxiv.org/abs/2512.01373v1
- Date: Mon, 01 Dec 2025 07:40:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.74861
- Title: SRAM: Shape-Realism Alignment Metric for No Reference 3D Shape Evaluation
- Title(参考訳): SRAM:非参照3次元形状評価のための形状アライメント基準
- Authors: Sheng Liu, Tianyu Luan, Phani Nuney, Xuelu Feng, Junsong Yuan,
- Abstract要約: 本稿では,メッシュ形状情報とリアリズム評価の橋渡しとして,大規模言語モデル(LLM)を利用する形状リアリズムアライメントメトリクスを提案する。
専用リアリズムデコーダは、言語モデルの出力とリアリズムの人間の知覚を一致させるように設計されている。
我々は,人間に注釈を付けたリアリズムスコアを提供する新しいデータセット,RealismGradingを紹介した。
- 参考スコア(独自算出の注目度): 35.38154061503059
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D generation and reconstruction techniques have been widely used in computer games, film, and other content creation areas. As the application grows, there is a growing demand for 3D shapes that look truly realistic. Traditional evaluation methods rely on a ground truth to measure mesh fidelity. However, in many practical cases, a shape's realism does not depend on having a ground truth reference. In this work, we propose a Shape-Realism Alignment Metric that leverages a large language model (LLM) as a bridge between mesh shape information and realism evaluation. To achieve this, we adopt a mesh encoding approach that converts 3D shapes into the language token space. A dedicated realism decoder is designed to align the language model's output with human perception of realism. Additionally, we introduce a new dataset, RealismGrading, which provides human-annotated realism scores without the need for ground truth shapes. Our dataset includes shapes generated by 16 different algorithms on over a dozen objects, making it more representative of practical 3D shape distributions. We validate our metric's performance and generalizability through k-fold cross-validation across different objects. Experimental results show that our metric correlates well with human perceptions and outperforms existing methods, and has good generalizability.
- Abstract(参考訳): 3D生成と再構成技術は、コンピュータゲーム、映画、その他のコンテンツ制作分野で広く使われている。
アプリケーションが成長するにつれて、本当にリアルに見える3D形状への需要が高まっています。
従来の評価手法は、メッシュの忠実度を測定するための基礎的な真理に依存している。
しかし、多くの場合、形状の写実性は根本的真理を参照することに依存しない。
本研究では,メッシュ形状情報とリアリズム評価の橋渡しとして,大規模言語モデル(LLM)を利用する形状リアリズムアライメントメトリックを提案する。
これを実現するために、3次元形状を言語トークン空間に変換するメッシュ符号化アプローチを採用した。
専用リアリズムデコーダは、言語モデルの出力とリアリズムの人間の知覚を一致させるように設計されている。
さらに,人間に注釈を付けたリアリズムスコアを提供するRealismGradingという新しいデータセットを導入する。
私たちのデータセットには、16の異なるアルゴリズムが10以上のオブジェクトに対して生成した形状が含まれており、実用的な3D形状の分布をより表している。
我々は、異なる対象をまたいだ k-fold のクロスバリデーションにより、メトリックのパフォーマンスと一般化性を検証する。
実験結果から,我々の測定基準は人間の知覚とよく相関し,既存の手法よりも優れており,高い一般化性を有することが明らかとなった。
関連論文リスト
- Textured Geometry Evaluation: Perceptual 3D Textured Shape Metric via 3D Latent-Geometry Network [47.25343775786203]
Chamfer Distanceのような既存のメトリクスは、人間が3次元形状の忠実さを評価する方法と一致しないことが多い。
最近の学習ベースのメトリクスは、レンダリングされた画像と2D画像品質メトリクスに依存することによって、これを改善しようとしている。
本研究では,テクスチャを持つ3次元メッシュを直接ベースとした新しい忠実度評価手法を提案する。
論文 参考訳(メタデータ) (2025-12-01T07:53:03Z) - AlignGS: Aligning Geometry and Semantics for Robust Indoor Reconstruction from Sparse Views [18.361136390711415]
屋内シーンのセマンティックにリッチな3Dモデルへの需要は急速に増加しており、拡張現実、仮想現実、ロボット工学の応用によって推進されている。
既存の手法は、しばしば意味論を、既に形成され、潜在的に欠陥のある幾何学に描かれた受動的特徴として扱う。
本稿では、このビジョンを実現する新しいフレームワークであるAlignGSを紹介し、幾何学と意味論の相乗的でエンドツーエンドの最適化を開拓する。
論文 参考訳(メタデータ) (2025-10-09T06:30:20Z) - FMGS: Foundation Model Embedded 3D Gaussian Splatting for Holistic 3D Scene Understanding [11.118857208538039]
基礎モデルの視覚言語埋め込みを3次元ガウススプラッティング(GS)に組み込んだ基礎モデル埋め込みガウススプラッティング(S)を提案する。
結果は、多面的なセマンティック一貫性を示し、様々な下流タスクを容易にし、オープン語彙言語に基づくオブジェクト検出において、最先端のメソッドを10.2%上回った。
本研究では,視覚・言語・3次元シーン表現の交わりについて検討し,制御されていない現実世界環境におけるシーン理解の強化の道を開く。
論文 参考訳(メタデータ) (2024-01-03T20:39:02Z) - Shape, Pose, and Appearance from a Single Image via Bootstrapped
Radiance Field Inversion [54.151979979158085]
提案手法では,自然画像に対する基本的エンドツーエンド再構築フレームワークを導入し,正確な地平のポーズが得られない。
そこで,モデルが解の第一の推算を生成するハイブリッド・インバージョン・スキームを適用する。
当社のフレームワークでは,イメージを10ステップでデレンダリングすることが可能で,現実的なシナリオで使用することが可能です。
論文 参考訳(メタデータ) (2022-11-21T17:42:42Z) - A Shading-Guided Generative Implicit Model for Shape-Accurate 3D-Aware
Image Synthesis [163.96778522283967]
そこで本研究では,シェーディング誘導型生成暗黙モデルを提案する。
正確な3D形状は、異なる照明条件下でリアルなレンダリングをもたらす必要がある。
複数のデータセットに対する実験により,提案手法が光リアルな3次元画像合成を実現することを示す。
論文 参考訳(メタデータ) (2021-10-29T10:53:12Z) - Fully Understanding Generic Objects: Modeling, Segmentation, and
Reconstruction [33.95791350070165]
2D画像からジェネリックオブジェクトの3D構造を推定することは、コンピュータビジョンの長年の目標です。
半教師付き学習による代替アプローチを取る。
つまり、ジェネリックオブジェクトの2Dイメージでは、カテゴリ、形状、およびアルベドの潜在的な表現に分解します。
完全な形状とアルベドモデリングにより、モデリングとモデルフィッティングの両方で実際の2Dイメージを活用できることを示しています。
論文 参考訳(メタデータ) (2021-04-02T02:39:29Z) - SHAD3S: A model to Sketch, Shade and Shadow [20.209172586699175]
スケッチの3次元をアクセント化し、シーンを照らすために、画家がよく使う手法である。
我々のシステムSHAD3Sは、一般的な3次元形状(3D)をハッチする人間と競い合い、フォーム探索運動で彼女を助ける。
論文 参考訳(メタデータ) (2020-11-13T09:25:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。