Fugu-MT 論文翻訳(概要): Fine Structure-Aware Sampling: A New Sampling Training Scheme for Pixel-Aligned Implicit Models in Single-View Human Reconstruction

論文の概要: Fine Structure-Aware Sampling: A New Sampling Training Scheme for Pixel-Aligned Implicit Models in Single-View Human Reconstruction

arxiv url: http://arxiv.org/abs/2402.19197v2
Date: Mon, 11 Nov 2024 14:04:57 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:31.133909
Title: Fine Structure-Aware Sampling: A New Sampling Training Scheme for Pixel-Aligned Implicit Models in Single-View Human Reconstruction
Title（参考訳）: 微細構造認識サンプリング: 単視点人体再構成における画素配向インシシデントモデルのための新しいサンプリングトレーニングスキーム
Authors: Kennard Yanting Chan, Fayao Liu, Guosheng Lin, Chuan Sheng Foo, Weisi Lin,
Abstract要約: 本研究では,単一視点の人物再構成のための暗黙的画素アライメントモデルをトレーニングするために,FSS(Final Structured-Aware Sampling)を導入する。 FSSは表面の厚さと複雑さに積極的に適応する。また、画素アライメント型暗黙的モデルのためのメッシュ厚み損失信号を提案する。
参考スコア（独自算出の注目度）: 98.30014795224432
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Pixel-aligned implicit models, such as PIFu, PIFuHD, and ICON, are used for single-view clothed human reconstruction. These models need to be trained using a sampling training scheme. Existing sampling training schemes either fail to capture thin surfaces (e.g. ears, fingers) or cause noisy artefacts in reconstructed meshes. To address these problems, we introduce Fine Structured-Aware Sampling (FSS), a new sampling training scheme to train pixel-aligned implicit models for single-view human reconstruction. FSS resolves the aforementioned problems by proactively adapting to the thickness and complexity of surfaces. In addition, unlike existing sampling training schemes, FSS shows how normals of sample points can be capitalized in the training process to improve results. Lastly, to further improve the training process, FSS proposes a mesh thickness loss signal for pixel-aligned implicit models. It becomes computationally feasible to introduce this loss once a slight reworking of the pixel-aligned implicit function framework is carried out. Our results show that our methods significantly outperform SOTA methods qualitatively and quantitatively. Our code is publicly available at https://github.com/kcyt/FSS.
Abstract（参考訳）: PIFu、PIFuHD、ICONなどの暗黙のピクセル配列モデルは、単視の人間の再構築に使用される。これらのモデルはサンプリングトレーニングスキームを使用してトレーニングする必要がある。既存のサンプリングトレーニングスキームは、薄い表面(例えば耳や指)を捕捉できないか、あるいは再建されたメッシュでノイズの多い人工物を引き起こすかのいずれかである。これらの問題に対処するため,我々は単一視点の人物再構成のための暗黙的画素アライメントモデルをトレーニングするための新しいサンプリングトレーニングスキームであるFine Structured-Aware Smpling (FSS)を導入した。 FSSは前述の問題を表面の厚さと複雑さに積極的に適応することで解決する。さらに,既存のサンプリングトレーニングと異なり,FSSは,サンプル点の正規化をトレーニングプロセスで行うことで,結果を改善する方法を示している。最後に、トレーニングプロセスをさらに改善するため、FSSは画素対応暗黙的モデルのためのメッシュ厚み損失信号を提案する。画素アラインの暗黙関数フレームワークを少し書き換えた後に、この損失を計算的に導入することは可能になった。その結果,本手法はSOTA法よりも質的,定量的に優れていることがわかった。私たちのコードはhttps://github.com/kcyt/FSS.comで公開されています。

関連論文リスト

Coefficients-Preserving Sampling for Reinforcement Learning with Flow Matching [6.238027696245818]
Reinforcement Learning (RL) は拡散およびフローマッチングモデルにおける画像生成と映像生成を改善する強力な手法として登場した。 SDEに基づくサンプリングは、生成された画像に顕著なノイズアーティファクトを導入します。提案手法であるCoefficients-Preserving Sampling (CPS)は,これらのノイズアーティファクトを除去する。
論文参考訳（メタデータ） (2025-09-07T07:25:00Z)
LD-RPS: Zero-Shot Unified Image Restoration via Latent Diffusion Recurrent Posterior Sampling [23.886038479359918]
本稿では,事前学習した潜伏拡散モデルを用いた再帰サンプリングによるデータセットフリーで統一的な手法を提案する。本手法では,マルチモーダル理解モデルを用いて,タスクブレンド条件下で生成モデルにセマンティックな事前情報を提供する。
論文参考訳（メタデータ） (2025-07-01T14:25:09Z)
Representation Alignment for Generation: Training Diffusion Transformers Is Easier Than You Think [72.48325960659822]
生成のための大規模拡散モデルの訓練における主要なボトルネックは、これらの表現を効果的に学習することにある。本稿では,RePresentation Alignment (REPA) と呼ばれる単純な正規化を導入し,ノイズの多い入力隠れ状態の投影を,外部の事前学習された視覚エンコーダから得られるクリーンな画像表現と整合させる手法を提案する。我々の単純な戦略は、一般的な拡散やDiTsやSiTsといったフローベースのトランスフォーマーに適用した場合、トレーニング効率と生成品質の両方に大きな改善をもたらす。
論文参考訳（メタデータ） (2024-10-09T14:34:53Z)
Efficient NeRF Optimization -- Not All Samples Remain Equally Hard [9.404889815088161]
ニューラルレイディアンスフィールド(NeRF)の効率的なトレーニングのためのオンラインハードサンプルマイニングの応用を提案する。 NeRFモデルは、多くの3D再構成およびレンダリングタスクに対して最先端の品質を生み出すが、かなりの計算資源を必要とする。
論文参考訳（メタデータ） (2024-08-06T13:49:01Z)
SGM-PINN: Sampling Graphical Models for Faster Training of Physics-Informed Neural Networks [4.262342157729123]
SGM-PINNは物理情報ニューラルネットワーク(PINN)のトレーニング効率を向上させるグラフベースの重要度サンプリングフレームワークである提案手法の利点を実証し,従来の最先端サンプリング手法と比較して3倍の収束性を実現した。
論文参考訳（メタデータ） (2024-07-10T04:31:50Z)
FSL-Rectifier: Rectify Outliers in Few-Shot Learning via Test-Time Augmentation [7.477118370563593]
FSL(Few-shot-learning)は通常、トレーニング中に目に見えないクラスに属する画像(クエリ)を識別するモデルを必要とする。生成画像コンバインダを用いて、原サンプルと適切な列車クラスサンプルを組み合わせることで、追加のテストクラスサンプルを生成する。我々は、平均化によってより典型的な表現をもたらす拡張子を介して平均化された特徴を得る。
論文参考訳（メタデータ） (2024-02-28T12:37:30Z)
SDWNet: A Straight Dilated Network with Wavelet Transformation for Image Deblurring [23.86692375792203]
画像劣化は、ぼやけた画像から鋭い画像を復元することを目的としたコンピュータビジョンの問題である。我々のモデルは拡張畳み込みを用いて空間分解能の高い大きな受容場を得ることができる。本稿では,ウェーブレット変換を用いた新しいモジュールを提案する。
論文参考訳（メタデータ） (2021-10-12T07:58:10Z)
Toward Real-World Super-Resolution via Adaptive Downsampling Models [58.38683820192415]
本研究では,制約のある事前知識を伴わずに未知のサンプル処理をシミュレートする手法を提案する。対の例を使わずに対象LR画像の分布を模倣する汎用化可能な低周波損失(LFL)を提案する。
論文参考訳（メタデータ） (2021-09-08T06:00:32Z)
Non-Iterative Phase Retrieval With Cascaded Neural Networks [0.966840768820136]
本稿では,非オーバースタンプフーリエ等級と異なる解像度で画像を連続的に再構成するディープニューラルネットワークカスケードを提案する。提案手法を4つの異なるデータセットで評価する。
論文参考訳（メタデータ） (2021-06-18T15:52:12Z)
3D Human Pose and Shape Regression with Pyramidal Mesh Alignment Feedback Loop [128.07841893637337]
回帰に基づく手法は最近、単眼画像からヒトのメッシュを再構成する有望な結果を示した。パラメータの小さな偏差は、推定メッシュと画像のエビデンスの間に顕著な不一致を引き起こす可能性がある。本稿では,特徴ピラミッドを活用し,予測パラメータを補正するために,ピラミッドメッシュアライメントフィードバック(pymaf)ループを提案する。
論文参考訳（メタデータ） (2021-03-30T17:07:49Z)
Scalable Deep Compressive Sensing [43.92187349325869]
既存のディープラーニング手法の多くは、異なるサブサンプリング比率のために異なるモデルをトレーニングする。本研究では,拡張性深部圧縮センシング(SDCS)と呼ばれるフレームワークを開発し,既存のすべてのエンドツーエンド学習モデルの拡張性サンプリングと再構成を行う。実験の結果,SDCSを用いたモデルでは,良好な性能を維持しながら構造を変更せずにSSRを達成でき,SDCSは他のSSR法よりも優れていた。
論文参考訳（メタデータ） (2021-01-20T08:42:50Z)
DeFlow: Learning Complex Image Degradations from Unpaired Data with Conditional Flows [145.83812019515818]
本論文では,不対データから画像劣化を学習するDeFlowを提案する。共有フローデコーダネットワークの潜在空間における劣化過程をモデル化する。共同画像復元と超解像におけるDeFlowの定式化を検証した。
論文参考訳（メタデータ） (2021-01-14T18:58:01Z)
Shape My Face: Registering 3D Face Scans by Surface-to-Surface Translation [75.59415852802958]
Shape-My-Face (SMF) は、改良されたポイントクラウドエンコーダ、新しい視覚的注意機構、スキップ接続付きグラフ畳み込みデコーダ、特殊口モデルに基づく強力なエンコーダデコーダアーキテクチャである。私たちのモデルは、トポロジカルにサウンドメッシュを最小限の監視で提供し、より高速なトレーニング時間を提供し、訓練可能なパラメータを桁違いに減らし、ノイズに強く、以前は見られないデータセットに一般化することができます。
論文参考訳（メタデータ） (2020-12-16T20:02:36Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。