論文の概要: ADHMR: Aligning Diffusion-based Human Mesh Recovery via Direct Preference Optimization
- arxiv url: http://arxiv.org/abs/2505.10250v2
- Date: Thu, 22 May 2025 01:53:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-23 12:25:14.974518
- Title: ADHMR: Aligning Diffusion-based Human Mesh Recovery via Direct Preference Optimization
- Title(参考訳): ADHMR:直接選好最適化による拡散に基づくヒューマンメッシュ回復の調整
- Authors: Wenhao Shen, Wanqi Yin, Xiaofeng Yang, Cheng Chen, Chaoyue Song, Zhongang Cai, Lei Yang, Hao Wang, Guosheng Lin,
- Abstract要約: 本稿では、拡散に基づくHMRモデルを好みの最適化方法でアライメントするADHMRを提案する。
まず、人間のメッシュ予測モデルであるHMR-Scorerを訓練し、3Dアノテーションを使わずに、Wild画像であっても予測を評価する。
次に、HMR-Scorerを使用して好みのデータセットを作成し、各入力画像は勝者と敗者メッシュ予測のペアを持つ。
- 参考スコア(独自算出の注目度): 51.904899019761594
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human mesh recovery (HMR) from a single image is inherently ill-posed due to depth ambiguity and occlusions. Probabilistic methods have tried to solve this by generating numerous plausible 3D human mesh predictions, but they often exhibit misalignment with 2D image observations and weak robustness to in-the-wild images. To address these issues, we propose ADHMR, a framework that Aligns a Diffusion-based HMR model in a preference optimization manner. First, we train a human mesh prediction assessment model, HMR-Scorer, capable of evaluating predictions even for in-the-wild images without 3D annotations. We then use HMR-Scorer to create a preference dataset, where each input image has a pair of winner and loser mesh predictions. This dataset is used to finetune the base model using direct preference optimization. Moreover, HMR-Scorer also helps improve existing HMR models by data cleaning, even with fewer training samples. Extensive experiments show that ADHMR outperforms current state-of-the-art methods. Code is available at: https://github.com/shenwenhao01/ADHMR.
- Abstract(参考訳): 単一の画像からのヒューマンメッシュリカバリ(HMR)は、深さのあいまいさと閉塞性により本質的に不適切である。
確率論的手法は、多数の可算な3次元メッシュ予測を生成することでこれを解決しようとするが、2次元画像の観察と、ワイヤ内の画像に対する弱い堅牢性との相違がしばしば現れる。
これらの問題に対処するため,DiffusionベースのHMRモデルを好みの最適化方法でアライメントするADHMRを提案する。
まず、人間のメッシュ予測モデルであるHMR-Scorerを訓練し、3Dアノテーションを使わずに、Wild画像であっても予測を評価する。
次に、HMR-Scorerを使用して好みのデータセットを作成し、各入力画像は勝者と敗者メッシュ予測のペアを持つ。
このデータセットは、直接優先度最適化を使用してベースモデルを微調整するために使用される。
さらに、HMR-Scorerは、トレーニングサンプルが少ない場合でも、データのクリーニングによって既存のHMRモデルを改善するのにも役立ちます。
大規模な実験により、ADHMRは現在の最先端の手法よりも優れていることが示された。
コードは、https://github.com/shenwenhao01/ADHMR.comで入手できる。
関連論文リスト
- MEGA: Masked Generative Autoencoder for Human Mesh Recovery [33.26995842920877]
単一のRGB画像からのヒューマンメッシュの回復は、非常にあいまいな問題である。
ほとんどのHMR手法はこの問題を見逃し、曖昧さを考慮せずに単一の予測を行う。
本研究は,マスク生成モデルに基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2024-05-29T07:40:31Z) - Score-Guided Diffusion for 3D Human Recovery [10.562998991986102]
Score-Guided Human Mesh Recovery (ScoreHMR)を提案する。
ScoreHMRはモデルフィッティングアプローチを模倣するが、拡散モデルの潜在空間におけるスコアガイダンスによって画像観察との整合が達成される。
提案手法は, (i) 単フレームモデルフィッティング, (ii) 複数視点からの再構成, (iii) ビデオシーケンスで人間を再構成することである。
論文 参考訳(メタデータ) (2024-03-14T17:56:14Z) - Ambient Diffusion Posterior Sampling: Solving Inverse Problems with Diffusion Models Trained on Corrupted Data [54.09959775518994]
線形に破損したデータから学習した拡散モデルを用いて逆問題を解決するためのフレームワークを提供する。
加速度係数R=2,4,6,8のサブサンプルによるマルチコイル測定にのみアクセス可能なMRI拡散モデルを訓練する。
高加速度環境下でのMRI再構成において、サブサンプルデータでトレーニングされたA-DPSモデルは、完全サンプルデータでトレーニングされたモデルよりも逆問題の解決に適している。
論文 参考訳(メタデータ) (2024-03-13T17:28:20Z) - Generative Approach for Probabilistic Human Mesh Recovery using
Diffusion Models [33.2565018922113]
本研究は、与えられた2次元画像から3次元人体メッシュを再構築する問題に焦点を当てる。
拡散に基づくヒューマンメッシュ回復(Diff-HMR)と呼ばれる生成的アプローチフレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-05T22:23:04Z) - Probabilistic Modeling for Human Mesh Recovery [73.11532990173441]
本稿では,2次元の証拠から3次元の人体復元の問題に焦点を当てた。
我々は,この問題を,入力から3Dポーズの分布へのマッピング学習として再考した。
論文 参考訳(メタデータ) (2021-08-26T17:55:11Z) - Probabilistic 3D surface reconstruction from sparse MRI information [58.14653650521129]
スパース2次元MR画像データとアレータティック不確実性予測から3次元表面再構成を同時に行うための新しい確率論的深層学習手法を提案する。
本手法は,3つの準直交MR画像スライスから,限られたトレーニングセットから大きな表面メッシュを再構成することができる。
論文 参考訳(メタデータ) (2020-10-05T14:18:52Z) - I2L-MeshNet: Image-to-Lixel Prediction Network for Accurate 3D Human
Pose and Mesh Estimation from a Single RGB Image [79.040930290399]
I2L-MeshNetを提案する。
提案したI2L-MeshNetは、パラメータを直接回帰するのではなく、各メッシュ座標の1Dヒートマップ上のリセル当たりの確率を予測する。
我々のリセルベースの1Dヒートマップは入力画像の空間的関係を保存し、予測の不確かさをモデル化する。
論文 参考訳(メタデータ) (2020-08-09T12:13:31Z) - RAIN: A Simple Approach for Robust and Accurate Image Classification
Networks [156.09526491791772]
既存の敵防衛手法の大部分は、予測精度を犠牲にして堅牢性を実現することが示されている。
本稿では,ロバストおよび高精度画像分類N(RAIN)と呼ぶ新しい前処理フレームワークを提案する。
RAINは入力に対してランダム化を適用して、モデルフォワード予測パスと後方勾配パスの関係を壊し、モデルロバスト性を改善する。
STL10 と ImageNet のデータセットを用いて、様々な種類の敵攻撃に対する RAIN の有効性を検証する。
論文 参考訳(メタデータ) (2020-04-24T02:03:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。