論文の概要: ReGenHuman: Re-Generating Human Appearances for Realistic Full-Body Video Anonymization
- arxiv url: http://arxiv.org/abs/2606.14972v1
- Date: Fri, 12 Jun 2026 21:47:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:32.550379
- Title: ReGenHuman: Re-Generating Human Appearances for Realistic Full-Body Video Anonymization
- Title(参考訳): ReGenHuman: リアルなフルボディビデオ匿名化のための人間の出現を再現する
- Authors: Adam Sun, Eshaan Barkataki, Arnold Milstein, Gordon Wetzstein, Ehsan Adeli,
- Abstract要約: 最初のフルボディビデオ匿名化パイプラインであるReGenHumanを紹介する。
提案手法は, 2次元ポーズ, セグメンテーション, 単分子深度を2つの相補的条件流に分解する。
匿名化されたビデオは、ビデオ質問応答を含む下流作業に有効であることを示す。
- 参考スコア(独自算出の注目度): 37.96795816823917
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Anonymizing human-centric video data is an understudied problem. Prior anonymization techniques either blur or redact pixels at the cost of realism and downstream utility, or generate frame-by-frame at the cost of temporal coherence. We introduce ReGenHuman, the first full-body video anonymization pipeline that is simultaneously realistic, temporally consistent, and anonymous by construction. Contrary to past approaches which redact or edit the inputs directly, we propose a regenerate, don't edit paradigm. Our approach composites 2D pose, segmentation, and monocular depth into two complementary conditioning streams - StructAll and StructHuman, which are used to fine-tune a video-to-video diffusion backbone on in-the-wild human videos, synthesizing the human regions entirely from identity-free structural cues. We evaluate our model on privacy, quality, and utility, and show that our ReGenHuman achieves the best tradeoff across all three axes against current baselines. We further show that our anonymized videos remain effective for downstream tasks, including video question answering.
- Abstract(参考訳): 人間中心のビデオデータの匿名化は、未調査の問題である。
以前の匿名化技術は、リアリズムと下流ユーティリティのコストでピクセルをぼやけたり、あるいは時間的コヒーレンスのコストでフレーム単位のフレームを生成する。
我々はReGenHumanを紹介した。ReGenHumanは、最初のフルボディビデオ匿名化パイプラインであり、同時に現実的で、時間的に一貫性があり、建設によって匿名である。
入力を直接再実行または編集する過去のアプローチとは対照的に、我々は再生成を提案し、パラダイムを編集しない。
提案手法は2次元合成, セグメンテーション, 単眼深度を2つの相補的条件付きストリーム – StructAll と StructHuman に合成する。
プライバシ、品質、ユーティリティに関する私たちのモデルを評価し、ReGenHumanが現在のベースラインに対して3つの軸で最高のトレードオフを達成していることを示す。
さらに、我々の匿名化されたビデオは、ビデオ質問応答を含む下流タスクに有効であることを示す。
関連論文リスト
- Multi-identity Human Image Animation with Structural Video Diffusion [73.38728096088732]
emph Structure Video Diffusionは、現実的なマルチヒューマンビデオを生成するための新しいフレームワークである。
当社のアプローチでは、個人間で一貫した外観を維持するために、アイデンティティ固有の埋め込みを導入している。
さまざまなマルチヒューマンとオブジェクトのインタラクションシナリオを特徴とする25Kの新しいビデオで、既存のヒューマンビデオデータセットを拡張します。
論文 参考訳(メタデータ) (2025-04-05T10:03:49Z) - MultiPly: Reconstruction of Multiple People from Monocular Video in the Wild [32.6521941706907]
モノクラーインザワイルドビデオから3Dで複数の人物を再構成する新しいフレームワークであるMultiPlyを提案する。
まず、シーン全体の階層化されたニューラル表現を定義し、個々の人間と背景モデルで合成する。
階層化可能なボリュームレンダリングを通じて,ビデオから階層化ニューラル表現を学習する。
論文 参考訳(メタデータ) (2024-06-03T17:59:57Z) - Humans in 4D: Reconstructing and Tracking Humans with Transformers [72.50856500760352]
我々は、人間を再構築し、時間とともに追跡するアプローチを提案する。
このアプローチの中核として、人間のメッシュリカバリのためのネットワークの完全な"トランスフォーマライズ"バージョンを提案する。
このネットワークであるHMR 2.0は、芸術の状態を前進させ、過去に1枚の画像から再構成することが困難であった異常なポーズを分析する能力を示す。
論文 参考訳(メタデータ) (2023-05-31T17:59:52Z) - Vid2Avatar: 3D Avatar Reconstruction from Videos in the Wild via
Self-supervised Scene Decomposition [40.46674919612935]
Vid2Avatarは、モノクラー・イン・ザ・ワイルドビデオから人間のアバターを学習する手法である。
提案手法は,大規模な人間のスキャンデータから抽出した基礎的監督や先行データを必要としない。
シーンの人間と背景の両方を共同でモデル化することで、シーンの分解と表面の再構築を3Dで直接行う。
論文 参考訳(メタデータ) (2023-02-22T18:59:17Z) - Image Comes Dancing with Collaborative Parsing-Flow Video Synthesis [124.48519390371636]
人の動きをソースから対象人物に転送することは、コンピュータビジョンやグラフィックアプリケーションにおいて大きな可能性を秘めている。
これまでは、人工的な3Dモデルに頼っていたり、ターゲットごとに個別のモデルを訓練していた。
本研究は,ソース映像から対象人物への動きを同期的に伝達する単一モデルを学習することを目的とした,より一般的な設定について研究する。
論文 参考訳(メタデータ) (2021-10-27T03:42:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。