論文の概要: DeepMesh: Auto-Regressive Artist-mesh Creation with Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2503.15265v1
- Date: Wed, 19 Mar 2025 14:39:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-20 15:23:18.073537
- Title: DeepMesh: Auto-Regressive Artist-mesh Creation with Reinforcement Learning
- Title(参考訳): DeepMesh: 強化学習による自動回帰アーティスト・ミーシュ創造
- Authors: Ruowen Zhao, Junliang Ye, Zhengyi Wang, Guangce Liu, Yiwen Chen, Yikai Wang, Jun Zhu,
- Abstract要約: DeepMeshは、2つの重要なイノベーションを通じてメッシュ生成を最適化するフレームワークである。
データキュレーションと処理の改善とともに、新しいトークン化アルゴリズムが組み込まれている。
複雑な詳細と正確なトポロジを持つメッシュを生成し、精度と品質の両方で最先端の手法より優れています。
- 参考スコア(独自算出の注目度): 21.77406648840365
- License:
- Abstract: Triangle meshes play a crucial role in 3D applications for efficient manipulation and rendering. While auto-regressive methods generate structured meshes by predicting discrete vertex tokens, they are often constrained by limited face counts and mesh incompleteness. To address these challenges, we propose DeepMesh, a framework that optimizes mesh generation through two key innovations: (1) an efficient pre-training strategy incorporating a novel tokenization algorithm, along with improvements in data curation and processing, and (2) the introduction of Reinforcement Learning (RL) into 3D mesh generation to achieve human preference alignment via Direct Preference Optimization (DPO). We design a scoring standard that combines human evaluation with 3D metrics to collect preference pairs for DPO, ensuring both visual appeal and geometric accuracy. Conditioned on point clouds and images, DeepMesh generates meshes with intricate details and precise topology, outperforming state-of-the-art methods in both precision and quality. Project page: https://zhaorw02.github.io/DeepMesh/
- Abstract(参考訳): トライアングルメッシュは、効率的な操作とレンダリングのための3Dアプリケーションにおいて重要な役割を果たす。
自動回帰法は離散頂点トークンを予測して構造化メッシュを生成するが、顔数やメッシュの不完全性によって制約されることが多い。
これらの課題に対処するために、1)新しいトークン化アルゴリズムを取り入れた効率的な事前学習戦略と、データキュレーションと処理の改善、(2)直接選好最適化(DPO)による人間の選好調整を実現するために、3Dメッシュ生成への強化学習(RL)の導入の2つの主要な革新を通じてメッシュ生成を最適化するフレームワークであるDeepMeshを提案する。
人間の評価と3Dメトリクスを組み合わせることで、DPOの選好ペアを収集し、視覚的魅力と幾何学的精度を両立させるスコアリング標準を設計する。
DeepMeshは、ポイントクラウドとイメージに条件付きで、複雑な詳細と正確なトポロジを持つメッシュを生成し、精度と品質の両方で最先端の手法より優れています。
プロジェクトページ: https://zhaorw02.github.io/DeepMesh/
関連論文リスト
- DMesh++: An Efficient Differentiable Mesh for Complex Shapes [51.75054400014161]
2次元および3次元に新しい微分可能なメッシュ処理法を導入する。
メッシュ分解能を2次元の局所幾何学に適応させて効率よく表現するアルゴリズムを提案する。
本研究では,2次元ポイントクラウドと3次元マルチビュー再構成タスクにおけるアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2024-12-21T21:16:03Z) - ConvMesh: Reimagining Mesh Quality Through Convex Optimization [55.2480439325792]
本研究では、既存のメッシュを強化するために、規律付き凸プログラミングと呼ばれる凸最適化プログラミングを導入する。
元々のメッシュとターゲットのメッシュの両方から分離されたポイントクラウドに注目することにより、この手法は、最小限のデータ要求でメッシュ品質を大幅に改善することを示す。
論文 参考訳(メタデータ) (2024-12-11T15:48:25Z) - MeshAnything V2: Artist-Created Mesh Generation With Adjacent Mesh Tokenization [65.15226276553891]
MeshAnything V2はArtist-Created Meshを作成するために設計された高度なメッシュ生成モデルである。
MeshAnything V2の背後にある重要なイノベーションは、新しいAdjacent Mesh Tokenization(AMT)メソッドです。
論文 参考訳(メタデータ) (2024-08-05T15:33:45Z) - DeCoTR: Enhancing Depth Completion with 2D and 3D Attentions [41.55908366474901]
本研究では,2次元と3次元の両方の注意を生かし,高精度な深度補完を実現する手法を提案する。
提案手法であるDeCoTRを,確立した深度補完ベンチマークで評価した。
論文 参考訳(メタデータ) (2024-03-18T19:22:55Z) - Dynamic 3D Point Cloud Sequences as 2D Videos [81.46246338686478]
3Dポイントクラウドシーケンスは、現実世界の環境における最も一般的で実用的な表現の1つとして機能する。
textitStructured Point Cloud Videos (SPCV) と呼ばれる新しい汎用表現を提案する。
SPCVは点雲列を空間的滑らかさと時間的一貫性を持つ2Dビデオとして再編成し、画素値は点の3D座標に対応する。
論文 参考訳(メタデータ) (2024-03-02T08:18:57Z) - Sampling is Matter: Point-guided 3D Human Mesh Reconstruction [0.0]
本稿では,1枚のRGB画像から3次元メッシュ再構成を行うための簡易かつ強力な手法を提案する。
評価実験の結果,提案手法は3次元メッシュ再構成の性能を効率よく向上することが示された。
論文 参考訳(メタデータ) (2023-04-19T08:45:26Z) - GD-MAE: Generative Decoder for MAE Pre-training on LiDAR Point Clouds [72.60362979456035]
Masked Autoencoders (MAE)は、大規模な3Dポイントクラウドでの探索が難しい。
我々は,周囲のコンテキストを自動的にマージするためのtextbfGenerative textbfDecoder for MAE (GD-MAE)を提案する。
提案手法の有効性を, KITTI と ONCE の2つの大規模ベンチマークで実証した。
論文 参考訳(メタデータ) (2022-12-06T14:32:55Z) - Multi-initialization Optimization Network for Accurate 3D Human Pose and
Shape Estimation [75.44912541912252]
我々はMulti-Initialization Optimization Network(MION)という3段階のフレームワークを提案する。
第1段階では,入力サンプルの2次元キーポイントに適合する粗い3次元再構成候補を戦略的に選択する。
第2段階では, メッシュ改質トランス (MRT) を設計し, 自己保持機構を用いて粗い再構成結果をそれぞれ洗練する。
最後に,RGB画像の視覚的証拠が与えられた3次元再構成と一致するかどうかを評価することで,複数の候補から最高の結果を得るために,一貫性推定ネットワーク(CEN)を提案する。
論文 参考訳(メタデータ) (2021-12-24T02:43:58Z) - Efficient 3D Deep LiDAR Odometry [16.388259779644553]
PWCLO-Netという名前の効率的な3Dポイント・クラウド・ラーニング・アーキテクチャが最初に提案される。
アーキテクチャ全体は、コストボリュームとマスクの適応的な学習を実現するために、徹底的にエンドツーエンドに最適化されています。
論文 参考訳(メタデータ) (2021-11-03T11:09:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。