Fugu-MT 論文翻訳(概要): MeshLAM: Feed-Forward One-Shot Animatable Textured Mesh Avatar Reconstruction

論文の概要: MeshLAM: Feed-Forward One-Shot Animatable Textured Mesh Avatar Reconstruction

arxiv url: http://arxiv.org/abs/2604.22865v1
Date: Thu, 23 Apr 2026 09:01:27 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-28 17:12:07.009259
Title: MeshLAM: Feed-Forward One-Shot Animatable Textured Mesh Avatar Reconstruction
Title（参考訳）: MeshLAM: フィードフォワードワンショットアンマタブルメッシュアバター再構成
Authors: Yisheng He, Steven Hoi,
Abstract要約: MeshLAMは、ワンショットアニマタブルメッシュヘッド再構築のためのフィードフォワードフレームワークである。提案手法は,単一の前方通過画像から固有のアニマタビリティを持つ完全なメッシュ表現を生成する。
参考スコア（独自算出の注目度）: 4.951907187079677
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We introduce MeshLAM, a feed-forward framework for one-shot animatable mesh head reconstruction that generates high-fidelity, animatable 3D head avatars from a single image. Unlike previous work that relies on time-consuming test-time optimization or extensive multi-view data, our method produces complete mesh representations with inherent animatability from a single image in a single forward pass. Our approach employs a dual shape and texture map architecture that simultaneously processes mesh vertices and texture map with extracted image features from a shared transformer backbone, allowing for coherent shape carving and appearance modeling. To prevent mesh collapse and ensure topological integrity during feed-forward deformation, we propose an iterative GRU-based decoding mechanism with progressive geometry deformation and texture refinement, coupled with a novel reprojection-based texture guidance mechanism that anchors appearance learning to the input image. Extensive experiments demonstrate that our method outperforms state-of-the-art approaches in reconstruction quality, animation capability, and computational efficiency. Project page at https://meshlam.github.io.
Abstract（参考訳）: 単一画像から高忠実でアニマタブルな3Dヘッドアバターを生成する,ワンショットアニマタブルなメッシュヘッド再構成のためのフィードフォワードフレームワークであるMeshLAMを紹介する。時間を要するテスト時間最適化や大規模なマルチビューデータに依存する従来の手法とは異なり,本手法では,単一の前方パス内の単一画像から固有のアニマタビリティを持つ完全なメッシュ表現を生成する。提案手法では,メッシュ頂点とテクスチャマップを共通トランスフォーマーバックボーンから抽出した画像特徴と同時に処理し,コヒーレントな形状の彫刻と外観モデリングを可能にする。メッシュ崩壊を防止し,フィードフォワード変形時のトポロジ的整合性を確保するため,プログレッシブな幾何学的変形とテクスチャ改善を備えた反復的なGRUデコーディング機構と,入力画像に外観学習を固定する新たな再投影型テクスチャ誘導機構を提案する。本手法は, 再現性, アニメーション能力, 計算効率において, 最先端の手法よりも優れていることを示す。プロジェクトページはhttps://meshlam.github.io。

関連論文リスト

MoGaFace: Momentum-Guided and Texture-Aware Gaussian Avatars for Consistent Facial Geometry [3.0373043721834163]
MoGaFaceは、顔の形状とテクスチャ特性を継続的に洗練する、3Dヘッドアバターモデリングフレームワークである。 MoGaFaceは高忠実な頭部アバター再構成を実現し、新規な合成品質を著しく向上させる。
論文参考訳（メタデータ） (2025-08-02T06:25:51Z)
Fine-Grained Multi-View Hand Reconstruction Using Inverse Rendering [11.228453237603834]
本稿では,逆レンダリングを利用して手ポーズを復元し,詳細を複雑化する多視点ハンドメッシュ再構成手法を提案する。また、ハンドメッシュとテクスチャの両方を洗練させるために、新しいハンドアルベドとメッシュ(HAM)最適化モジュールも導入した。提案手法は,再現精度とレンダリング品質の両面において,最先端の手法よりも優れている。
論文参考訳（メタデータ） (2024-07-08T07:28:24Z)
GTR: Improving Large 3D Reconstruction Models through Geometry and Texture Refinement [51.97726804507328]
マルチビュー画像から3次元メッシュを再構成する手法を提案する。提案手法は, 変圧器を用いたトリプレーンジェネレータとニューラルレージアンスフィールド(NeRF)モデルを用いた大規模再構成モデルから着想を得たものである。
論文参考訳（メタデータ） (2024-06-09T05:19:24Z)
FlexiDreamer: Single Image-to-3D Generation with FlexiCubes [20.871847154995688]
FlexiDreamerは、マルチビュー生成イメージから高品質なメッシュを直接再構築する新しいフレームワークである。提案手法では,1つの画像から3次元の下流タスクにおいて,約1分で高忠実度3Dメッシュを生成することができる。
論文参考訳（メタデータ） (2024-04-01T08:20:18Z)
InvertAvatar: Incremental GAN Inversion for Generalized Head Avatars [40.10906393484584]
本稿では,複数フレームからの忠実度向上を目的としたアルゴリズムを用いて,アバター復元性能を向上させる新しいフレームワークを提案する。本アーキテクチャでは,画素対応画像-画像変換を重要視し,観測空間と標準空間の対応を学習する必要性を緩和する。提案手法は,1ショットと数ショットのアバターアニメーションタスクにおける最先端の性能を示す。
論文参考訳（メタデータ） (2023-12-03T18:59:15Z)
Delicate Textured Mesh Recovery from NeRF via Adaptive Surface Refinement [78.48648360358193]
画像からテクスチャ化された表面メッシュを生成する新しいフレームワークを提案する。我々のアプローチは、NeRFを用いて幾何学とビュー依存の外観を効率的に初期化することから始まります。ジオメトリと共同で外観を洗練し、テクスチャ画像に変換してリアルタイムレンダリングします。
論文参考訳（メタデータ） (2023-03-03T17:14:44Z)
Pixel2Mesh++: 3D Mesh Generation and Refinement from Multi-View Images [82.32776379815712]
カメラポーズの有無にかかわらず、少数のカラー画像から3次元メッシュ表現における形状生成の問題について検討する。我々は,グラフ畳み込みネットワークを用いたクロスビュー情報を活用することにより,形状品質をさらに向上する。我々のモデルは初期メッシュの品質とカメラポーズの誤差に頑健であり、テスト時間最適化のための微分関数と組み合わせることができる。
論文参考訳（メタデータ） (2022-04-21T03:42:31Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。