論文の概要: Mesh Mamba: A Unified State Space Model for Saliency Prediction in Non-Textured and Textured Meshes
- arxiv url: http://arxiv.org/abs/2504.01466v2
- Date: Wed, 09 Apr 2025 08:35:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-10 16:14:22.052092
- Title: Mesh Mamba: A Unified State Space Model for Saliency Prediction in Non-Textured and Textured Meshes
- Title(参考訳): Mesh Mamba: 非テクスチャメッシュとテクスチャメッシュの相性予測のための統一状態空間モデル
- Authors: Kaiwei Zhang, Dandan Zhu, Xiongkuo Min, Guangtao Zhai,
- Abstract要約: メッシュサリエンシは、自然に視覚的注意を引き付ける領域を特定して強調することにより、3D視覚の適応性を高める。
状態空間モデル (SSM) に基づく統合唾液度予測モデルであるメッシュ・マンバを導入する。
Mesh Mambaは、トポロジカルフレームワークにテクスチャ機能をシームレスに組み込んだまま、メッシュの幾何学的構造を効果的に分析する。
- 参考スコア(独自算出の注目度): 50.23625950905638
- License:
- Abstract: Mesh saliency enhances the adaptability of 3D vision by identifying and emphasizing regions that naturally attract visual attention. To investigate the interaction between geometric structure and texture in shaping visual attention, we establish a comprehensive mesh saliency dataset, which is the first to systematically capture the differences in saliency distribution under both textured and non-textured visual conditions. Furthermore, we introduce mesh Mamba, a unified saliency prediction model based on a state space model (SSM), designed to adapt across various mesh types. Mesh Mamba effectively analyzes the geometric structure of the mesh while seamlessly incorporating texture features into the topological framework, ensuring coherence throughout appearance-enhanced modeling. More importantly, by subgraph embedding and a bidirectional SSM, the model enables global context modeling for both local geometry and texture, preserving the topological structure and improving the understanding of visual details and structural complexity. Through extensive theoretical and empirical validation, our model not only improves performance across various mesh types but also demonstrates high scalability and versatility, particularly through cross validations of various visual features.
- Abstract(参考訳): メッシュサリエンシは、自然に視覚的注意を引き付ける領域を特定して強調することにより、3D視覚の適応性を高める。
視覚的注意を形作る際の幾何学的構造とテクスチャの相互作用を調べるため,我々は,テクスチャと非テクスチャの両方の視覚的条件下での塩分分布の違いを系統的に把握した,網羅的なメッシュ・サリエンシ・データセットを構築した。
さらに、状態空間モデル (SSM) に基づく統合唾液度予測モデルであるメッシュMambaを導入し、様々なメッシュタイプに適応するように設計された。
Mesh Mambaは、トポロジカルフレームワークにテクスチャ機能をシームレスに組み込んだまま、メッシュの幾何学的構造を効果的に解析し、外観強化モデリング全体のコヒーレンスを確保する。
さらに重要なことは、グラフ埋め込みと双方向SSMによって、局所幾何学とテクスチャの両方のグローバルなコンテキストモデリングを可能にし、トポロジ構造を保存し、視覚的詳細と構造的複雑さの理解を改善することである。
理論的および実証的な検証を通じて、我々のモデルは様々なメッシュタイプにわたるパフォーマンスを改善するだけでなく、特に様々な視覚的特徴の相互検証を通じて、高いスケーラビリティと汎用性を示す。
関連論文リスト
- MARS: Mesh AutoRegressive Model for 3D Shape Detailization [85.95365919236212]
3次元形状詳細化のための新しいアプローチであるMARSを紹介する。
本稿では,次のLODトークン予測により,そのような潜在表現を生成するメッシュ自己回帰モデルを提案する。
挑戦的な3次元形状Detailizationベンチマークで行った実験により,提案したMARSモデルが最先端の性能を発揮することが示された。
論文 参考訳(メタデータ) (2025-02-17T03:12:16Z) - Textured Mesh Saliency: Bridging Geometry and Texture for Human Perception in 3D Graphics [50.23625950905638]
6自由度(6-DOF)VR環境下での革新的な視線追跡実験により構築したテクスチャメッシュ・サリエンシのための新しいデータセットを提案する。
本モデルでは,各三角形の面を個々の単位として扱い,各局所表面領域の重要性を反映した塩分濃度値を割り当てることで,テクスチャメッシュ表面の塩分濃度マップを推定する。
論文 参考訳(メタデータ) (2024-12-11T08:27:33Z) - HybridMQA: Exploring Geometry-Texture Interactions for Colored Mesh Quality Assessment [7.526258700061012]
メッシュ品質評価(MQA)モデルは、メッシュ運用システムの設計、最適化、評価において重要な役割を果たす。
モデルベースおよびプロジェクションベースのアプローチを統合するハイブリッドフル参照色付きMQAフレームワークであるHybridMQAを紹介する。
提案手法はグラフ学習を用いて詳細な3次元表現を抽出し,新しい特徴レンダリングプロセスを用いて2次元に投影する。
論文 参考訳(メタデータ) (2024-12-02T21:35:33Z) - Geometry Distributions [51.4061133324376]
本稿では,分布として幾何学をモデル化する新しい幾何学的データ表現を提案する。
提案手法では,新しいネットワークアーキテクチャを用いた拡散モデルを用いて表面点分布の学習を行う。
本研究では,多種多様な対象に対して質的かつ定量的に表現を評価し,その有効性を実証した。
論文 参考訳(メタデータ) (2024-11-25T04:06:48Z) - DreamPolish: Domain Score Distillation With Progressive Geometry Generation [66.94803919328815]
本稿では,高精細な幾何学と高品質なテクスチャの創出に優れたテキスト・ツー・3D生成モデルであるDreamPolishを紹介する。
幾何構成フェーズでは, 合成過程の安定性を高めるために, 複数のニューラル表現を利用する。
テクスチャ生成フェーズでは、そのような領域に向けて神経表現を導くために、新しいスコア蒸留、すなわちドメインスコア蒸留(DSD)を導入する。
論文 参考訳(メタデータ) (2024-11-03T15:15:01Z) - A Generative Machine Learning Model for Material Microstructure 3D
Reconstruction and Performance Evaluation [4.169915659794567]
2次元から3次元への次元展開は、現在の技術的観点から非常に難しい逆問題と見なされている。
U-netのマルチスケール特性とGANの生成能力を統合する新しい生成モデルが提案されている。
さらに、画像正規化損失とワッサーシュタイン距離損失を組み合わせることにより、モデルの精度をさらに向上する。
論文 参考訳(メタデータ) (2024-02-24T13:42:34Z) - Single Mesh Diffusion Models with Field Latents for Texture Generation [18.78126579775479]
本稿では,3次元形状の表面に直接作用する固有潜在拡散モデルを提案する。
私たちは、メッシュ上の特定のテクスチャのバリエーションを生成するために、モデルがトレーニングされる、単一テクスチャ・メシュのパラダイムを考えています。
我々のモデルは、インペイントやラベル誘導生成などのユーザ制御編集タスクにも適応できる。
論文 参考訳(メタデータ) (2023-12-14T18:59:36Z) - T1: Scaling Diffusion Probabilistic Fields to High-Resolution on Unified
Visual Modalities [69.16656086708291]
拡散確率場(DPF)は、距離空間上で定義された連続関数の分布をモデル化する。
本稿では,局所構造学習に着目したビューワイズサンプリングアルゴリズムによる新しいモデルを提案する。
モデルは、複数のモダリティを統一しながら、高解像度のデータを生成するためにスケールすることができる。
論文 参考訳(メタデータ) (2023-05-24T03:32:03Z) - Low-Light Image Enhancement via Structure Modeling and Guidance [13.375551436077423]
本稿では、外観と構造モデリングを同時に行うことにより、低照度画像強調のための新しい枠組みを提案する。
低照度画像におけるエッジ検出として,本フレームワークにおける構造モデリングを実装した。
単純なU-Netで実装した外観モデリングを改善するために,構造誘導型拡張モジュールを提案する。
論文 参考訳(メタデータ) (2023-05-10T02:08:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。