論文の概要: Noise-Coded Illumination for Forensic and Photometric Video Analysis
- arxiv url: http://arxiv.org/abs/2507.23002v1
- Date: Wed, 30 Jul 2025 18:08:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-01 17:19:08.516947
- Title: Noise-Coded Illumination for Forensic and Photometric Video Analysis
- Title(参考訳): 法医学・測光ビデオ解析のためのノイズコードイルミネーション
- Authors: Peter F. Michael, Zekun Hao, Serge Belongie, Abe Davis,
- Abstract要約: シーンの照明に非常に微妙なノイズのような変調を組み込むことによって、この利点に対処できることを示す。
提案手法は,符号化照明下で記録されたビデオに時間的透かしを効果的に追加する。
敵が我々の技術が使われていることを知っていても、解読可能なコード化されたフェイクビデオを作ることで、元の敵対的コンテンツ生成問題の第二の、より難しいバージョンを解決できることが示される。
- 参考スコア(独自算出の注目度): 11.507609566604664
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The proliferation of advanced tools for manipulating video has led to an arms race, pitting those who wish to sow disinformation against those who want to detect and expose it. Unfortunately, time favors the ill-intentioned in this race, with fake videos growing increasingly difficult to distinguish from real ones. At the root of this trend is a fundamental advantage held by those manipulating media: equal access to a distribution of what we consider authentic (i.e., "natural") video. In this paper, we show how coding very subtle, noise-like modulations into the illumination of a scene can help combat this advantage by creating an information asymmetry that favors verification. Our approach effectively adds a temporal watermark to any video recorded under coded illumination. However, rather than encoding a specific message, this watermark encodes an image of the unmanipulated scene as it would appear lit only by the coded illumination. We show that even when an adversary knows that our technique is being used, creating a plausible coded fake video amounts to solving a second, more difficult version of the original adversarial content creation problem at an information disadvantage. This is a promising avenue for protecting high-stakes settings like public events and interviews, where the content on display is a likely target for manipulation, and while the illumination can be controlled, the cameras capturing video cannot.
- Abstract(参考訳): 動画を操作するための高度なツールの急増は、武器競争に繋がった。
残念なことに、タイムはこのレースで意図しないビデオを好んでおり、フェイクビデオは現実と区別するのがますます難しくなっている。
この傾向の根底にあるのは、メディアを操作する人々が持つ基本的な利点である。
本稿では,シーンの照明に非常に微妙なノイズ様変調を組み込むことによって,検証に有利な情報非対称性を作り出すことで,この利点に対処できることを示す。
提案手法は,符号化照明下で記録されたビデオに時間的透かしを効果的に追加する。
しかし、特定のメッセージを符号化する代わりに、この透かしは、未操作シーンの画像が符号化された照明によってのみ照らされるようにエンコードする。
敵が我々の技術が使われていることを知っていても、解読可能なコード化されたフェイクビデオを作ることは、元の敵コンテンツ生成問題のより難しい第2版を情報不備で解決することにつながることを示す。
これは、公開イベントやインタビューのような高精細な設定を保護するための有望な道であり、ディスプレイ上のコンテンツは操作のターゲットになり得る。
関連論文リスト
- Active Light Modulation to Counter Manipulation of Speech Visual Content [1.471374083774109]
Spotlightは、ライブ音声ビデオを偽造から守るための、低オーバーヘッドで控えめなシステムだ。
Spotlightはイベントサイトでダイナミックな物理的シグネチャを生成し、受信不能な光によってすべてのビデオ記録に埋め込む。
プロトタイプ実験では、SpotlightはAUCs$geq$0.99を達成し、全体的な正の確率はファルシファイドビデオの検出において100%である。
論文 参考訳(メタデータ) (2025-04-30T17:55:24Z) - VideoMark: A Distortion-Free Robust Watermarking Framework for Video Diffusion Models [18.427936201177122]
VideoMarkは、ビデオ拡散モデルのための歪みのない堅牢な透かしフレームワークである。
固定された透かしシーケンスを用いて擬似乱数誤り訂正(PRC)符号を用いたフレームワイド透かし方式を用いる。
透かし抽出のために,編集距離を利用して復号されたメッセージと元の透かしシーケンスを整列する時間マッチングモジュール(TMM)を提案する。
論文 参考訳(メタデータ) (2025-04-23T02:21:12Z) - FramePainter: Endowing Interactive Image Editing with Video Diffusion Priors [64.54220123913154]
本稿では,画像から映像への効率のよい生成問題としてFramePainterを紹介した。
軽量のスパース制御エンコーダのみを使用して編集信号を注入する。
従来の最先端の手法をはるかに少ないトレーニングデータで上回ります。
論文 参考訳(メタデータ) (2025-01-14T16:09:16Z) - Video Seal: Open and Efficient Video Watermarking [47.40833588157406]
ビデオ透かしは、認識不能な信号をビデオに埋め込むことによって、課題に対処する。
Video Sealは、ニューラルビデオ透かしのための包括的なフレームワークであり、競合するオープンソースモデルである。
提案手法の有効性を, 速度, 不受容性, 頑健性の観点から実験的に検証した。
論文 参考訳(メタデータ) (2024-12-12T17:41:49Z) - Divot: Diffusion Powers Video Tokenizer for Comprehension and Generation [54.21476271127356]
Divotは拡散駆動型ビデオトケナイザである。
我々は、ビデオからテキストへの自己回帰とテキストからビデオへの生成を通じてDivot-unaVicを提示する。
論文 参考訳(メタデータ) (2024-12-05T18:53:04Z) - FateZero: Fusing Attentions for Zero-shot Text-based Video Editing [104.27329655124299]
本研究では,FateZeroを提案する。FateZeroは,実世界のビデオに対して,プロンプトごとのトレーニングや使用専用のマスクを使わずに,ゼロショットのテキストベースの編集手法である。
本手法は、ゼロショットテキスト駆動型ビデオスタイルと、訓練されたテキスト・ツー・イメージモデルからローカル属性を編集する機能を示す最初の方法である。
論文 参考訳(メタデータ) (2023-03-16T17:51:13Z) - Digital Image Forensics using Deep Learning [0.0]
本プロジェクトの目的は、画像に内在的に残されている情報のトレースを用いて、どのカメラが画像をキャプチャしたかを特定するアルゴリズムを構築することである。
この問題を解決することは、刑事裁判や民事裁判、さらにはニュース報道で使われた証拠の検証に大きな影響を与えるだろう。
論文 参考訳(メタデータ) (2022-10-14T02:27:34Z) - Robust Watermarking for Video Forgery Detection with Improved
Imperceptibility and Robustness [30.611167333725408]
本稿では,ローカライゼーションを改ざんするためのビデオ透かしネットワークを提案する。
我々は3D-UNetベースの透かし埋め込みネットワークと、改ざんマスクを予測するデコーダを共同で訓練する。
実験結果から, 透かしの精度が良好で, 改ざん箇所の精度も高い透かし付き映像が生成できることが示唆された。
論文 参考訳(メタデータ) (2022-07-07T16:27:10Z) - Relighting Images in the Wild with a Self-Supervised Siamese
Auto-Encoder [62.580345486483886]
本研究では,野生の単一ビュー画像の自己教師付きリライティング手法を提案する。
この方法は、イメージを2つの別々のエンコーディングに分解するオートエンコーダに基づいている。
Youtube 8MやCelebAなどの大規模データセットでモデルをトレーニングします。
論文 参考訳(メタデータ) (2020-12-11T16:08:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。