論文の概要: Enhancing Image Authenticity Detection: Swin Transformers and Color Frame Analysis for CGI vs. Real Images
- arxiv url: http://arxiv.org/abs/2409.04742v1
- Date: Sat, 7 Sep 2024 07:14:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-10 21:01:36.863845
- Title: Enhancing Image Authenticity Detection: Swin Transformers and Color Frame Analysis for CGI vs. Real Images
- Title(参考訳): 画像認証検出の強化:CGIと実画像のスイニングトランスフォーマーとカラーフレーム解析
- Authors: Preeti Mehta, Aman Sagar, Suchi Kumari,
- Abstract要約: 本研究では,Swin Transformerを用いたCGIとADIの分類手法と,RGBおよびCbCrYカラーフレーム解析を含む前処理手法を提案する。
本研究は,スイニングトランスフォーマーと高度なカラーフレーム解析を組み合わせることで,画像の精度を効果的かつ効率的に検出できる可能性を明らかにするものである。
- 参考スコア(独自算出の注目度): 1.024113475677323
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid advancements in computer graphics have greatly enhanced the quality of computer-generated images (CGI), making them increasingly indistinguishable from authentic images captured by digital cameras (ADI). This indistinguishability poses significant challenges, especially in an era of widespread misinformation and digitally fabricated content. This research proposes a novel approach to classify CGI and ADI using Swin Transformers and preprocessing techniques involving RGB and CbCrY color frame analysis. By harnessing the capabilities of Swin Transformers, our method foregoes handcrafted features instead of relying on raw pixel data for model training. This approach achieves state-of-the-art accuracy while offering substantial improvements in processing speed and robustness against joint image manipulations such as noise addition, blurring, and JPEG compression. Our findings highlight the potential of Swin Transformers combined with advanced color frame analysis for effective and efficient image authenticity detection.
- Abstract(参考訳): コンピュータグラフィックスの急速な進歩は、コンピュータ生成画像(CGI)の品質を大幅に向上させ、デジタルカメラ(ADI)が捉えた真の画像と区別しにくくなった。
この不明瞭さは、特に広汎な誤報とデジタル化されたコンテンツの時代において、重大な課題を引き起こす。
本研究では,Swin Transformerを用いたCGIとADIの分類手法と,RGBおよびCbCrYカラーフレーム解析を含む前処理手法を提案する。
Swin Transformerの能力を生かして,モデルのトレーニングに生のピクセルデータに頼るのではなく,手作りの特徴を予見する。
このアプローチは,ノイズ付加,ぼやけ,JPEG圧縮などのジョイントイメージ操作に対して,処理速度と堅牢性を大幅に向上させながら,最先端の精度を実現する。
本研究は,スイニングトランスフォーマーと高度なカラーフレーム解析を組み合わせることで,画像の精度を効果的かつ効率的に検出できる可能性を明らかにするものである。
関連論文リスト
- Deep chroma compression of tone-mapped images [46.07829363710451]
本稿では,HDRトーンマップ画像の高速かつ信頼性の高いクロマ圧縮のための生成逆ネットワークを提案する。
提案手法は,色精度において,最先端の画像生成および拡張ネットワークよりも優れることを示す。
このモデルはリアルタイムのパフォーマンスを実現し,計算資源が限られているデバイスに展開する上で有望な結果を示す。
論文 参考訳(メタデータ) (2024-09-24T12:31:55Z) - The JPEG Pleno Learning-based Point Cloud Coding Standard: Serving Man and Machine [49.16996486119006]
ディープラーニングは、ポイントクラウドコーディングの強力なツールとして登場した。
JPEGは先日、JPEG Pleno LearningベースのPoint Cloud Coding標準を確定した。
本稿ではJPEG PCC標準の完全な技術的記述を提供する。
論文 参考訳(メタデータ) (2024-09-12T15:20:23Z) - Swin Transformer for Robust Differentiation of Real and Synthetic Images: Intra- and Inter-Dataset Analysis [0.0]
本研究では,自然画像と合成画像の正確な識別のためのSwin Transformerモデルを提案する。
モデルの性能は、3つの異なるデータセットにわたるデータセット内およびデータセット間テストによって評価された。
論文 参考訳(メタデータ) (2024-09-07T06:43:17Z) - TextureCrop: Enhancing Synthetic Image Detection through Texture-based Cropping [12.315110846944906]
合成画像検出(SID)は、AIが生成する有害なコンテンツを防御するための重要なツールである。
現在のSID法は、通常、入力画像を一定の解像度にリサイズするか、計算上の問題によりセンタークロッピングを行う。
本稿では,新しい画像前処理技術であるTextureCropを提案する。
論文 参考訳(メタデータ) (2024-07-22T09:31:30Z) - Solutions to Deepfakes: Can Camera Hardware, Cryptography, and Deep Learning Verify Real Images? [51.3344199560726]
信頼性の高い合成データから実際のデータを分離する手法を確立することが不可欠である。
この文書は、どの画像が本物かを検証するために使用できる検出と暗号に関する既知の戦略を提示することを目的としている。
論文 参考訳(メタデータ) (2024-07-04T22:01:21Z) - A Robust Image Forensic Framework Utilizing Multi-Colorspace Enriched Vision Transformer for Distinguishing Natural and Computer-Generated Images [0.0]
本稿では、リッチな視覚変換器を利用して、自然画像と生成画像の区別を行う頑健な法科学分類手法を提案する。
提案手法は,各クラスの評価において,94.25%の検定精度と有意な性能向上を示す。
この研究は、自然な画像と生成された画像を区別する汎用的でレジリエントなソリューションを提供することにより、画像鑑定の最先端を推し進める。
論文 参考訳(メタデータ) (2023-08-14T17:11:17Z) - Subjective and Objective Quality Assessment for in-the-Wild Computer
Graphics Images [57.02760260360728]
我々は6000のCGI(CGIQA-6k)からなる大規模CGIQAデータベースを構築した。
本稿では, 歪みと美的品質表現を両立させて, 効果的な深層学習に基づくno-reference (NR) IQAモデルを提案する。
実験の結果,提案手法は構築したCGIQA-6kデータベース上で,最先端のNR IQA法よりも優れていた。
論文 参考訳(メタデータ) (2023-03-14T16:32:24Z) - Swin2SR: SwinV2 Transformer for Compressed Image Super-Resolution and
Restoration [71.6879432974126]
本稿では,画像超解像のためのSwinIRの改良を目的とした小説Swin Transformer V2について検討する。
JPEG圧縮アーティファクトの除去,画像超解像(古典的および軽量),圧縮画像超解像の3つの代表的な課題について実験を行った。
実験の結果,Swin2SRはSwinIRのトレーニング収束と性能を向上させることができることがわかった。
論文 参考訳(メタデータ) (2022-09-22T23:25:08Z) - Joint Learning of Deep Texture and High-Frequency Features for
Computer-Generated Image Detection [24.098604827919203]
本稿では,CG画像検出のための深いテクスチャと高周波特徴を有する共同学習戦略を提案する。
セマンティックセグメンテーションマップを生成して、アフィン変換操作を誘導する。
原画像と原画像の高周波成分の組み合わせを、注意機構を備えたマルチブランチニューラルネットワークに供給する。
論文 参考訳(メタデータ) (2022-09-07T17:30:40Z) - Controllable Image Enhancement [66.18525728881711]
いくつかのパラメータを制御して、複数のスタイルで高品質な画像を生成できる半自動画像強調アルゴリズムを提案する。
エンコーダ・デコーダフレームワークは、リタッチスキルを潜在コードにエンコードし、イメージ信号処理機能のパラメータにデコードする。
論文 参考訳(メタデータ) (2022-06-16T23:54:53Z) - CNNs for JPEGs: A Study in Computational Cost [49.97673761305336]
畳み込みニューラルネットワーク(CNN)は過去10年間で驚くべき進歩を遂げてきた。
CNNはRGBピクセルから直接データの堅牢な表現を学習することができる。
近年,圧縮領域から直接学習できる深層学習手法が注目されている。
論文 参考訳(メタデータ) (2020-12-26T15:00:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。