Fugu-MT 論文翻訳(概要): DPHMs: Diffusion Parametric Head Models for Depth-based Tracking

論文の概要: DPHMs: Diffusion Parametric Head Models for Depth-based Tracking

arxiv url: http://arxiv.org/abs/2312.01068v2
Date: Mon, 8 Apr 2024 14:33:12 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-10 02:06:00.413734
Title: DPHMs: Diffusion Parametric Head Models for Depth-based Tracking
Title（参考訳）: DPHM:深度追跡のための拡散パラメトリックヘッドモデル
Authors: Jiapeng Tang, Angela Dai, Yinyu Nie, Lev Markhasin, Justus Thies, Matthias Niessner,
Abstract要約: 拡散パラメトリックヘッドモデル(DPHM)を紹介する。 DPHMは、単分子深度配列からの堅牢な頭部再構成と追跡を可能にする生成モデルである。本稿では,ボリュームヘッドの再構築と追跡を正規化するために,遅延拡散に基づく手法を提案する。
参考スコア（独自算出の注目度）: 42.016598097736626
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: We introduce Diffusion Parametric Head Models (DPHMs), a generative model that enables robust volumetric head reconstruction and tracking from monocular depth sequences. While recent volumetric head models, such as NPHMs, can now excel in representing high-fidelity head geometries, tracking and reconstructing heads from real-world single-view depth sequences remains very challenging, as the fitting to partial and noisy observations is underconstrained. To tackle these challenges, we propose a latent diffusion-based prior to regularize volumetric head reconstruction and tracking. This prior-based regularizer effectively constrains the identity and expression codes to lie on the underlying latent manifold which represents plausible head shapes. To evaluate the effectiveness of the diffusion-based prior, we collect a dataset of monocular Kinect sequences consisting of various complex facial expression motions and rapid transitions. We compare our method to state-of-the-art tracking methods and demonstrate improved head identity reconstruction as well as robust expression tracking.
Abstract（参考訳）: DPHM(Diffusion Parametric Head Models:拡散パラメトリックヘッドモデル)を導入する。 NPHMsのような最近のボリュームヘッドモデルは、高忠実度ヘッドジオメトリを表現し、実世界の単一視野深度シーケンスからのヘッドの追跡と再構成に優れているが、部分的かつノイズの多い観測への適応は過小評価されているため、依然として非常に困難である。これらの課題に対処するために,ボリュームヘッドの再構築と追跡を正規化するための遅延拡散に基づく手法を提案する。この事前ベース正規化器は、同一性および表現符号を、プラウジブルな頭部形状を表す下層の潜在多様体上に配置することを効果的に制限する。拡散に基づく先行処理の有効性を評価するため,複雑な表情運動と素早い遷移からなる単眼Kinectシーケンスのデータセットを収集した。提案手法を最先端の追跡手法と比較し,頭部の自己同一性再構築とロバストな表現追跡を実証した。

関連論文リスト

DM4CT: Benchmarking Diffusion Models for Computed Tomography Reconstruction [0.8921166277011348]
DM4CTは断層画像再構成のための総合的なベンチマークである。我々は、モデルベース、教師なし、教師なしのアプローチを含む7つの強力なベースラインと共に、最近の拡散に基づく10の手法をベンチマークする。本分析はCT再建における拡散モデルの挙動,強度,限界に関する詳細な知見を提供する。
論文参考訳（メタデータ） (2026-02-20T19:54:47Z)
DMS:Diffusion-Based Multi-Baseline Stereo Generation for Improving Self-Supervised Depth Estimation [10.461837853869959]
本稿では,方向指示によって誘導される極上方向に沿った新しいビューを合成するモデルに依存しないアプローチを提案する。提案したDMSは,自己教師型ステレオマッチングと単眼深度推定をシームレスに向上する,コストフリーの'plug-and-play'法である。
論文参考訳（メタデータ） (2025-08-18T17:05:15Z)
SAS: Simulated Attention Score [75.1409882298863]
我々は,多数の注目ヘッドと1頭あたりの隠れ特徴次元をシミュレートしながら,コンパクトなモデルサイズを維持するSAS(Simulated Attention Score)を導入する。各種データセットとタスクに関する総合的な実験により,提案手法の有効性が示された。
論文参考訳（メタデータ） (2025-07-10T12:16:16Z)
Geometry-Constrained Monocular Scale Estimation Using Semantic Segmentation for Dynamic Scenes [3.635236692041662]
本研究では,エゴモーション推定とグラウンドポイントの選択のための革新的な戦略を提案する。本手法では,不安定な特徴を除去するためにダイナミック・オブジェクトマスクを組み込んでおり,立体三角測量に地上面マスクを用いる。このアプローチとORB-SLAM3のモ眼バージョンの統合は,道路モデルの正確なエスティメーションを決定づける。
論文参考訳（メタデータ） (2025-03-06T09:15:13Z)
Dfilled: Repurposing Edge-Enhancing Diffusion for Guided DSM Void Filling [2.3020018305241337]
デジタル表面モデル(DSM)は、地理空間解析において地球の地形を正確に表現するために不可欠である。 DSMは、都市計画、植生研究、そして3D再構築などの応用に欠かせない自然と人工の特徴の詳細な高度を捉えている。これまでの研究は、主にデジタル標高モデル(DEM)とデジタル地形モデル(DTM)の空隙充填に焦点を当ててきた。エッジエンハンス拡散による光リモートセンシング画像を利用する誘導DSM空隙充填法であるDfilledを紹介する。
論文参考訳（メタデータ） (2025-01-26T08:03:02Z)
Steering Masked Discrete Diffusion Models via Discrete Denoising Posterior Prediction [88.65168366064061]
本稿では,確率論的推論の課題として,事前学習したMDMを操る作業を行う新しいフレームワークであるDDPPを紹介する。私たちのフレームワークは、3つの新しい目標のファミリーにつながります。 Wet-lab Validation(ウェット・ラブ・バリデーション)を用いて,報酬最適化タンパク質配列の過渡的発現を観察する。
論文参考訳（メタデータ） (2024-10-10T17:18:30Z)
GroCo: Ground Constraint for Metric Self-Supervised Monocular Depth [2.805351469151152]
本稿では,自己監督パラダイムに特化して設計された地盤領域に関する新しい制約を提案する。このメカニズムはスケールを正確に回復するだけでなく、深度予測と地上とのコヒーレンスを確保する。
論文参考訳（メタデータ） (2024-09-23T09:30:27Z)
Efficient One-Step Diffusion Refinement for Snapshot Compressive Imaging [8.819370643243012]
Coded Aperture Snapshot Spectral Imaging (CASSI)は3次元マルチスペクトル画像(MSI)を撮影するための重要な技術である現在の最先端の手法は、主にエンドツーエンドであり、高周波の詳細を再構築する際の制限に直面している。本稿では,Snapshot Compressive Imagingのための自己教師型適応フレームワークにおいて,新しい1段階拡散確率モデルを提案する。
論文参考訳（メタデータ） (2024-09-11T17:02:10Z)
Stratified Avatar Generation from Sparse Observations [10.291918304187769]
AR/VRデバイスから3Dフルボディアバターを推定することは、没入感のある体験を生み出す上で不可欠である。本稿では,Skinned Multi-Person Linear (SMPL)モデルで定義されたキネマティックツリーの性質に着想を得た。本研究では,従来のフルボディアバター再建パイプラインを2段階に分離する階層化手法を提案する。
論文参考訳（メタデータ） (2024-05-30T06:25:42Z)
Semi-Supervised Unconstrained Head Pose Estimation in the Wild [60.08319512840091]
本研究では,最初の半教師なしヘッドポーズ推定手法であるSemiUHPEを提案する。本手法は,野生頭部のアスペクト比不変収穫が,それまでのランドマークベースのアフィンアライメントよりも優れているという観測に基づいている。実験とアブレーション研究は、SemiUHPEが既存の手法を公開ベンチマークで大きく上回っていることを示している。
論文参考訳（メタデータ） (2024-04-03T08:01:00Z)
HeadRecon: High-Fidelity 3D Head Reconstruction from Monocular Video [37.53752896927615]
任意のモノクラービデオから高忠実度3Dヘッドモデルの再構成について検討する。本稿では,これらの問題に対処するために,事前誘導型動的暗黙的ニューラルネットワークを提案する。
論文参考訳（メタデータ） (2023-12-14T12:38:56Z)
CamoDiffusion: Camouflaged Object Detection via Conditional Diffusion Models [72.93652777646233]
カモフラーゲ型物体検出(COD)は、カモフラーゲ型物体とその周囲の類似性が高いため、コンピュータビジョンにおいて難しい課題である。本研究では,CODを拡散モデルを利用した条件付きマスク生成タスクとして扱う新しいパラダイムを提案する。カモ拡散(CamoDiffusion)と呼ばれる本手法では,拡散モデルのデノナイズプロセスを用いてマスクの雑音を反復的に低減する。
論文参考訳（メタデータ） (2023-05-29T07:49:44Z)
Hierarchical Integration Diffusion Model for Realistic Image Deblurring [71.76410266003917]
拡散モデル (DM) は画像劣化に導入され, 有望な性能を示した。本稿では,階層型統合拡散モデル(HI-Diff)を提案する。人工的および実世界のぼかしデータセットの実験は、HI-Diffが最先端の手法より優れていることを示した。
論文参考訳（メタデータ） (2023-05-22T12:18:20Z)
MonoSDF: Exploring Monocular Geometric Cues for Neural Implicit Surface Reconstruction [72.05649682685197]
最先端のニューラル暗黙法は、多くの入力ビューから単純なシーンの高品質な再構築を可能にする。これは主に、十分な制約を提供していないRGB再構築損失の固有の曖昧さによって引き起こされる。近年の単分子形状予測の分野での進歩に触発され, ニューラルな暗黙的表面再構成の改善にこれらの方法が役立つかを探究する。
論文参考訳（メタデータ） (2022-06-01T17:58:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。