論文の概要: InstructHumans: Editing Animated 3D Human Textures with Instructions
- arxiv url: http://arxiv.org/abs/2404.04037v2
- Date: Mon, 15 Sep 2025 13:11:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-16 17:26:22.604856
- Title: InstructHumans: Editing Animated 3D Human Textures with Instructions
- Title(参考訳): InstructHumans: アニメーション化された3Dテクスチャをインストラクションで編集する
- Authors: Jiayin Zhu, Linlin Yang, Angela Yao,
- Abstract要約: InstructHumansは命令駆動型アニマタブルな3次元テクスチャ編集のための新しいフレームワークである。
既存のテキストベースの3D編集手法は、しばしばスコア蒸留サンプリング(SDS)を直接適用する。
本稿では,SDSのサブタームを拡散時間ステップに選択的に組み込む改良SDS for Editing (SDS-E)を提案する。
- 参考スコア(独自算出の注目度): 59.8568078884315
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present InstructHumans, a novel framework for instruction-driven {animatable} 3D human texture editing. Existing text-based 3D editing methods often directly apply Score Distillation Sampling (SDS). SDS, designed for generation tasks, cannot account for the defining requirement of editing -- maintaining consistency with the source avatar. This work shows that naively using SDS harms editing, as it may destroy consistency. We propose a modified SDS for Editing (SDS-E) that selectively incorporates subterms of SDS across diffusion timesteps. We further enhance SDS-E with spatial smoothness regularization and gradient-based viewpoint sampling for edits with sharp and high-fidelity detailing. Incorporating SDS-E into a 3D human texture editing framework allows us to outperform existing 3D editing methods. Our avatars faithfully reflect the textual edits while remaining consistent with the original avatars. Project page: https://jyzhu.top/instruct-humans/.
- Abstract(参考訳): InstructHumansは命令駆動型3次元テクスチャ編集のための新しいフレームワークである。
既存のテキストベースの3D編集方法は、しばしばスコア蒸留サンプリング(SDS)を直接適用する。
生成タスク用に設計されたSDSは、ソースアバターとの一貫性の維持という、編集の定義要件を説明できない。
この研究は、SDSは一貫性を損なう可能性があるため、直感的に使用すると編集に支障が生じることを示している。
本稿では,SDSのサブタームを拡散時間ステップに選択的に組み込む改良SDS for Editing (SDS-E)を提案する。
さらに,SDS-Eの空間的スムーズな正規化と,シャープかつ高忠実度な詳細な編集のための勾配に基づく視点サンプリングを施した。
SDS-Eを3Dヒューマンテクスチャ編集フレームワークに組み込むことで、既存の3D編集方法よりも優れる。
私たちのアバターは、元のアバターと一致しながら、テキストの編集を忠実に反映しています。
プロジェクトページ: https://jyzhu.top/instruct-humans/
関連論文リスト
- Rethinking Score Distilling Sampling for 3D Editing and Generation [50.52808917055502]
Unified Distillation Sampling (UDS)は、3Dアセットの生成と編集をシームレスに統合する手法である。
UDSは、より詳細な3Dアセットの生成において、ベースラインメソッドよりも優れているだけでなく、編集タスクも優れているため、3D生成と編集のギャップを埋める。
論文 参考訳(メタデータ) (2025-05-03T18:40:39Z) - Semantic Score Distillation Sampling for Compositional Text-to-3D Generation [28.88237230872795]
テキスト記述から高品質な3Dアセットを生成することは、コンピュータグラフィックスと視覚研究において重要な課題である。
本稿では,合成テキストから3D生成までの表現性と精度の向上を目的とした新しいSDS手法を提案する。
我々のアプローチは、異なるレンダリングビュー間の一貫性を維持する新しいセマンティック埋め込みを統合する。
明示的な意味指導を活用することで,既存の事前学習拡散モデルの構成能力を解き放つ。
論文 参考訳(メタデータ) (2024-10-11T17:26:00Z) - Revealing Directions for Text-guided 3D Face Editing [52.85632020601518]
3次元顔編集はマルチメディアにおいて重要な課題であり、様々な制御信号間での3次元顔モデルの操作を目的としている。
任意の属性記述に基づく3次元顔の生成と操作のためのテキスト汎用アプローチであるFace Clanを提案する。
本手法は,ユーザがテキスト記述で興味のある領域を直感的にカスタマイズできる,正確に制御可能な操作方法を提供する。
論文 参考訳(メタデータ) (2024-10-07T12:04:39Z) - Preserving Identity with Variational Score for General-purpose 3D Editing [48.314327790451856]
Pivaは拡散モデルに基づいて画像や3Dモデルを編集する新しい最適化手法である。
我々は2Dと3Dの編集の限界を指摘し、細かな損失と過飽和を引き起こす。
恒常保存を強制する追加のスコア蒸留項を提案する。
論文 参考訳(メタデータ) (2024-06-13T09:32:40Z) - GSEdit: Efficient Text-Guided Editing of 3D Objects via Gaussian Splatting [10.527349772993796]
本稿では,Gaussian Splattingモデルに基づくテキスト誘導型3Dオブジェクト編集パイプラインであるGSEditを紹介する。
本手法では, 3Dオブジェクトの形状や外観の編集を, 消費者ハードウェア上で数分で行うことなく行うことができる。
論文 参考訳(メタデータ) (2024-03-08T08:42:23Z) - PaintHuman: Towards High-fidelity Text-to-3D Human Texturing via
Denoised Score Distillation [89.09455618184239]
テキスト・ツー・3D世代における最近の進歩は画期的なものである。
そこで我々はPaintHumanというモデルを提案し,その課題を2つの側面から解決する。
奥行きマップを手引きとして,現実的なセマンティックなテクスチャの整合性を保証する。
論文 参考訳(メタデータ) (2023-10-14T00:37:16Z) - Directional Texture Editing for 3D Models [51.31499400557996]
ITEM3D は textbf3D オブジェクトの自動編集のために設計されている。
拡散モデルと微分可能レンダリングを活用して、ITEM3Dはレンダリングされた画像をテキストと3D表現のブリッジとして取り込む。
論文 参考訳(メタデータ) (2023-09-26T12:01:13Z) - Delta Denoising Score [51.98288453616375]
テキストベースの画像編集のための新しいスコアリング機能であるDelta Denoising Score (DDS)を紹介する。
ターゲットプロンプトに記述された内容に対して、入力画像の最小限の変更を導く。
論文 参考訳(メタデータ) (2023-04-14T12:22:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。