論文の概要: Addressing Image Authenticity When Cameras Use Generative AI
- arxiv url: http://arxiv.org/abs/2604.21879v1
- Date: Thu, 23 Apr 2026 17:22:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-24 14:40:06.785658
- Title: Addressing Image Authenticity When Cameras Use Generative AI
- Title(参考訳): カメラが生成AIを使用する際の画像の正当性に対処する
- Authors: Umar Masud, Abhijith Punnappurath, Luxi Zhao, David B. Lindell, Michael S. Brown,
- Abstract要約: 強調されたキャプチャタイムの画像内容は、通常、エッジやテクスチャの強化など、良質である。
ユーザーは、自分のカメラ画像のコンテンツが本物でないことに気づかないかもしれない。
本稿では,カメラ画像の「アンハロシン化」バージョンをユーザが復元できるようにすることで,この問題に対処する。
- 参考スコア(独自算出の注目度): 29.76740674812466
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The ability of generative AI (GenAI) methods to photorealistically alter camera images has raised awareness about the authenticity of images shared online. Interestingly, images captured directly by our cameras are considered authentic and faithful. However, with the increasing integration of deep-learning modules into cameras' capture-time hardware -- namely, the image signal processor (ISP) -- there is now a potential for hallucinated content in images directly output by our cameras. Hallucinated capture-time image content is typically benign, such as enhanced edges or texture, but in certain operations, such as AI-based digital zoom or low-light image enhancement, hallucinations can potentially alter the semantics and interpretation of the image content. As a result, users may not realize that the content in their camera images is not authentic. This paper addresses this issue by enabling users to recover the 'unhallucinated' version of the camera image to avoid misinterpretation of the image content. Our approach works by optimizing an image-specific multi-layer perceptron (MLP) decoder together with a modality-specific encoder so that, given the camera image, we can recover the image before hallucinated content was added. The encoder and MLP are self-contained and can be applied post-capture to the image without requiring access to the camera ISP. Moreover, the encoder and MLP decoder require only 180 KB of storage and can be readily saved as metadata within standard image formats such as JPEG and HEIC.
- Abstract(参考訳): 生成AI(GenAI)手法がカメライメージをフォトリアリスティックに修正する能力は、オンラインで共有される画像の真正性に対する認識を高めた。
興味深いことに、我々のカメラから直接撮影した画像は本物で忠実だと考えられている。
しかし、ディープラーニングモジュールをカメラのキャプチャタイムハードウェア(つまり、画像信号プロセッサ(ISP))に統合することで、カメラから直接出力される画像のコンテンツを幻覚させる可能性がある。
しかしAIベースのデジタルズームや低照度画像強調のような特定の操作では、幻覚は画像の内容の意味や解釈を変える可能性がある。
その結果、ユーザーは自分のカメラ画像のコンテンツが本物でないことに気づかないかもしれない。
本稿では,画像内容の誤解釈を避けるために,ユーザーがカメラ画像の「アンハロシン化」バージョンを復元できるようにすることにより,この問題に対処する。
本手法は,画像固有の多層パーセプトロン(MLP)デコーダをモダリティ固有のエンコーダとともに最適化することにより,カメラ画像から幻覚コンテンツを追加する前に画像の復元を行う。
エンコーダとMLPは自己完結しており、カメラISPへのアクセスを必要とせず、画像に後処理を施すことができる。
さらに、エンコーダとMPPデコーダは180KBのストレージしか必要とせず、JPEGやHEICなどの標準画像フォーマットでメタデータとして簡単に保存できる。
関連論文リスト
- Rawformer: Unpaired Raw-to-Raw Translation for Learnable Camera ISPs [53.68932498994655]
本稿では,多種多様なカメラを用いた生と生の翻訳の未ペアリング学習手法を提案する。
特定のカメラが捉えた生画像をターゲットカメラに正確にマッピングし、学習可能なISPを新しい目に見えないカメラに一般化する。
提案手法は,従来の最先端技術と比較して精度が高く,実際のカメラデータセットに優れた性能を示す。
論文 参考訳(メタデータ) (2024-04-16T16:17:48Z) - Human-imperceptible, Machine-recognizable Images [76.01951148048603]
より良い開発AIシステムと、センシティブなトレーニングデータから距離を置くことの間の、ソフトウェアエンジニアに関する大きな対立が露呈している。
画像が暗号化され、人間に認識され、機械に認識される」という、効率的なプライバシー保護学習パラダイムを提案する。
提案手法は,機械が認識可能な情報を保存しながら,暗号化された画像が人間に認識されなくなることを保証できることを示す。
論文 参考訳(メタデータ) (2023-06-06T13:41:37Z) - Real-Time Neural Character Rendering with Pose-Guided Multiplane Images [75.62730144924566]
リアルなシーンでアニマタブルなキャラクタをフォトリアリスティックな画質でレンダリングできるポーズ誘導多面体画像(MPI)合成を提案する。
我々は、移動物体の駆動信号とともに多視点画像をキャプチャするために、ポータブルカメラリグを使用します。
論文 参考訳(メタデータ) (2022-04-25T17:51:38Z) - Video Reconstruction by Spatio-Temporal Fusion of Blurred-Coded Image
Pair [16.295479896947853]
1つのモーションブルーの画像からビデオを取り出すのは、非常に不適切な問題だ。
従来のコード付き露光フレームワークはより適しているが、時空ボリュームのごく一部しかサンプリングできない。
完全露光画像に含まれる補完情報と符号化された露光画像を用いて高忠実度映像を復元する。
論文 参考訳(メタデータ) (2020-10-20T06:08:42Z) - Modeling Lost Information in Lossy Image Compression [72.69327382643549]
ロスシー画像圧縮は、デジタル画像の最もよく使われる演算子の1つである。
Invertible Lossy Compression (ILC) と呼ばれる新しい非可逆的フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T04:04:56Z) - What's in the Image? Explorable Decoding of Compressed Images [45.22726784749359]
ユビキタスJPEG標準のための新しいデコーダアーキテクチャを開発し、圧縮された画像の集合をトラバースする。
我々は、グラフィカル、医学的、法医学的なユースケースに関する我々のフレームワークを例示し、その幅広い潜在的な応用を実証する。
論文 参考訳(メタデータ) (2020-06-16T17:15:44Z) - Discernible Image Compression [124.08063151879173]
本稿では、外観と知覚の整合性の両方を追求し、圧縮画像を作成することを目的とする。
エンコーダ・デコーダ・フレームワークに基づいて,事前学習したCNNを用いて,オリジナル画像と圧縮画像の特徴を抽出する。
ベンチマーク実験により,提案手法を用いて圧縮した画像は,その後の視覚認識・検出モデルでもよく認識できることが示された。
論文 参考訳(メタデータ) (2020-02-17T07:35:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。