Fugu-MT 論文翻訳(概要): Avatar Fingerprinting for Authorized Use of Synthetic Talking-Head Videos

論文の概要: Avatar Fingerprinting for Authorized Use of Synthetic Talking-Head Videos

arxiv url: http://arxiv.org/abs/2305.03713v3
Date: Mon, 5 Aug 2024 02:38:33 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-07 00:45:00.851792
Title: Avatar Fingerprinting for Authorized Use of Synthetic Talking-Head Videos
Title（参考訳）: Avatar Fingerprinting for Authorized use of Synthetic Talking-Head Videos
Authors: Ekta Prashnani, Koki Nagano, Shalini De Mello, David Luebke, Orazio Gallo,
Abstract要約: これをアバターフィンガープリントと呼ぶ。まず、ビデオ通話で対話する人々の実・合成ビデオの大規模なデータセットを紹介する。顔の表情に依存しない動きのシグネチャを学習することにより、合成ビデオで表現を駆動するアイデンティティを検証する。
参考スコア（独自算出の注目度）: 16.717930760451996
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Modern avatar generators allow anyone to synthesize photorealistic real-time talking avatars, ushering in a new era of avatar-based human communication, such as with immersive AR/VR interactions or videoconferencing with limited bandwidths. Their safe adoption, however, requires a mechanism to verify if the rendered avatar is trustworthy: does it use the appearance of an individual without their consent? We term this task avatar fingerprinting. To tackle it, we first introduce a large-scale dataset of real and synthetic videos of people interacting on a video call, where the synthetic videos are generated using the facial appearance of one person and the expressions of another. We verify the identity driving the expressions in a synthetic video, by learning motion signatures that are independent of the facial appearance shown. Our solution, the first in this space, achieves an average AUC of 0.85. Critical to its practical use, it also generalizes to new generators never seen in training (average AUC of 0.83). The proposed dataset and other resources can be found at: https://research.nvidia.com/labs/nxp/avatar-fingerprinting/.
Abstract（参考訳）: 現代のアバタージェネレータは、誰でもフォトリアリスティックなリアルタイムなアバターを合成でき、没入型AR/VRインタラクションや限られた帯域幅でのビデオ会議など、新しい時代のアバターベースの人間コミュニケーションを支えている。しかし、彼らの安全な採用には、レンダリングされたアバターが信頼できるかどうかを検証するメカニズムが必要である。これをアバターフィンガープリントと呼ぶ。そこで我々はまず,ビデオ通話で対話する人々の実・合成ビデオの大規模データセットを導入し,ある人物の顔の外観と他の人物の表情を用いて合成ビデオを生成する。顔の表情に依存しない動きのシグネチャを学習することにより、合成ビデオで表現を駆動するアイデンティティを検証する。我々の解は、この空間で最初に、平均的な AUC が 0.85 に達する。実用上は非常に重要であり、訓練で見たことのない新しい発電機(平均AUC 0.83)にも一般化されている。提案されたデータセットとその他のリソースは、https://research.nvidia.com/labs/nxp/avatar-fingerprinting/で見ることができる。

関連論文リスト

JoyAvatar: Unlocking Highly Expressive Avatars via Harmonized Text-Audio Conditioning [18.72712280434528]
JoyAvatarは長時間のアバタービデオを生成することができるフレームワークである。そこで本研究では,モデルに固有のテキスト制御性を持たせるための,ツイン教師強化トレーニングアルゴリズムを提案する。トレーニング中、マルチモーダル条件の強度を動的に調整する。
論文参考訳（メタデータ） (2026-01-31T13:00:57Z)
AGORA: Adversarial Generation Of Real-time Animatable 3D Gaussian Head Avatars [54.854597811704316]
AGORAは、3DGSを生成的敵ネットワーク内で拡張し、アニマタブルなアバターを生成する新しいフレームワークである。表現の忠実度は、二重識別器の訓練スキームによって強制される。 AGORAは視覚的にリアルなだけでなく、正確に制御可能なアバターを生成する。
論文参考訳（メタデータ） (2025-12-06T14:05:20Z)
Is It Really You? Exploring Biometric Verification Scenarios in Photorealistic Talking-Head Avatar Videos [12.12643642515884]
攻撃者はユーザーのアバターを盗み、外見や声を保ち、視覚や音だけでその使用を検知することはほぼ不可能である。我々の主な疑問は、個人の顔の動きパターンが、アバターの視覚的外観が所有者のファクシミリであるときに、自分の身元を確認するための信頼性のある行動バイオメトリックスとして機能するかどうかである。実験の結果,顔の動きのランドマークは,80%に近づいたAUC値による有意義な識別を可能にすることが示された。
論文参考訳（メタデータ） (2025-08-01T16:23:27Z)
Zero-1-to-A: Zero-Shot One Image to Animatable Head Avatars Using Video Diffusion [61.938480115119596]
我々は、4次元アバター再構成のための空間的・時間的整合性データセットを合成する頑健なZero-1-to-Aを提案する。実験により、Zero-1-to-Aは既存の拡散法と比較して忠実さ、アニメーション品質、レンダリング速度を改善することが示された。
論文参考訳（メタデータ） (2025-03-20T05:07:46Z)
Vid2Avatar-Pro: Authentic Avatar from Videos in the Wild via Universal Prior [31.780579293685797]
Vid2Avatar-Proは、モノクラーインザミルドビデオから、フォトリアリスティックでアニマタブルな3Dアバターを作成する方法である。
論文参考訳（メタデータ） (2025-03-03T14:45:35Z)
EgoAvatar: Egocentric View-Driven and Photorealistic Full-body Avatars [56.56236652774294]
本研究では,光合成デジタルアバターを共同でモデル化し,同時に1つの自我中心映像から駆動する人物中心型テレプレゼンス手法を提案する。提案手法は,エゴセントリック・フォトリアル・テレプレゼンスへの明確な一歩として,ベースラインと競合する手法に優れることを示す。
論文参考訳（メタデータ） (2024-09-22T22:50:27Z)
DEGAS: Detailed Expressions on Full-Body Gaussian Avatars [13.683836322899953]
顔表情の豊かなフルボディアバターに対する3次元ガウススティング(3DGS)に基づくモデリング手法であるDEGASを提案する。本稿では,2次元の顔と3次元のアバターのギャップを埋めて,2次元の肖像画にのみ訓練された潜在空間を採用することを提案する。
論文参考訳（メタデータ） (2024-08-20T06:52:03Z)
HumanVid: Demystifying Training Data for Camera-controllable Human Image Animation [64.37874983401221]
人間の画像アニメーションに適した,最初の大規模高品質データセットであるHumanVidを紹介する。実世界のデータについては、インターネットから大量の実世界のビデオをコンパイルします。合成データとして,10K3Dアバターを収集し,体形,肌のテクスチャ,衣服などの既存の資産を利用した。
論文参考訳（メタデータ） (2024-07-24T17:15:58Z)
Physics-based Motion Retargeting from Sparse Inputs [73.94570049637717]
商用AR/VR製品はヘッドセットとコントローラーのみで構成されており、ユーザーのポーズのセンサーデータは非常に限られている。本研究では, 多様な形態のキャラクタに対して, 粗い人間のセンサデータからリアルタイムに動きをターゲットする手法を提案する。アバターのポーズは、下半身のセンサー情報がないにもかかわらず、驚くほどよくユーザと一致していることを示す。
論文参考訳（メタデータ） (2023-07-04T21:57:05Z)
READ Avatars: Realistic Emotion-controllable Audio Driven Avatars [11.98034899127065]
本稿では、感情を直接制御したオーディオ入力によって駆動される2次元アバターを生成するための3次元アプローチであるREAD Avatarsを提案する。従来の手法では、音声から表現マッピングへの多対多の性質のため、現実的なアニメーションを達成できない。これは回帰モデルによる滑らかな効果を排除し、生成されたアバターの現実性と表現性を改善するのに役立つ。
論文参考訳（メタデータ） (2023-03-01T18:56:43Z)
High-fidelity Face Tracking for AR/VR via Deep Lighting Adaptation [117.32310997522394]
3Dビデオアバターは、圧縮、プライバシー、エンターテイメント、AR/VRにおける存在感を提供することで、仮想コミュニケーションを強化することができる。既存の人物固有の3dモデルは照明に頑健ではないため、その結果は通常微妙な顔の振る舞いを見逃し、アバターにアーティファクトを引き起こす。本論文では,高品質の3D顔追跡アルゴリズムを組み合わせたディープラーニング照明モデルを用いて,通常の映像から3Dフォトリアリズムアバターへの微妙かつ堅牢な顔の動き伝達手法を提案する。
論文参考訳（メタデータ） (2021-03-29T18:33:49Z)
Expressive Telepresence via Modular Codec Avatars [148.212743312768]
VRテレプレゼンス(VR Telepresence)とは、アバターで表される仮想空間において、他の人間と対話することである。本稿では,VRヘッドセットのカメラによって駆動される超現実的な顔を生成する手法である,Modular Codec Avatars (MCA)を提案する。 MCAは、全体的なモデルを学習されたモジュラー表現に置き換えることで、伝統的なコーデックアバター(CA)を拡張している。
論文参考訳（メタデータ） (2020-08-26T20:16:43Z)
Audio- and Gaze-driven Facial Animation of Codec Avatars [149.0094713268313]
音声および/またはアイトラッキングを用いて,コーデックアバターをリアルタイムにアニメーション化するための最初のアプローチについて述べる。私たちのゴールは、重要な社会的シグナルを示す個人間の表現力のある会話を表示することです。
論文参考訳（メタデータ） (2020-08-11T22:28:48Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。