Fugu-MT 論文翻訳(概要): A Robust Approach Towards Distinguishing Natural and Computer Generated Images using Multi-Colorspace fused and Enriched Vision Transformer

論文の概要: A Robust Approach Towards Distinguishing Natural and Computer Generated Images using Multi-Colorspace fused and Enriched Vision Transformer

arxiv url: http://arxiv.org/abs/2308.07279v1
Date: Mon, 14 Aug 2023 17:11:17 GMT
ステータス: 翻訳完了
システム内更新日: 2023-08-15 12:17:47.670433
Title: A Robust Approach Towards Distinguishing Natural and Computer Generated Images using Multi-Colorspace fused and Enriched Vision Transformer
Title（参考訳）: マルチカラー・フューズド・エンリッチ・ビジョン・トランスを用いた自然画像とコンピュータ画像の識別に向けたロバストなアプローチ
Authors: Manjary P Gangan, Anoop Kadan, and Lajish V L
Abstract要約: 本研究は,自然画像とコンピュータ画像の区別に頑健なアプローチを提案する。提案手法は,一組のベースラインと比較して高い性能向上を実現する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The works in literature classifying natural and computer generated images are mostly designed as binary tasks either considering natural images versus computer graphics images only or natural images versus GAN generated images only, but not natural images versus both classes of the generated images. Also, even though this forensic classification task of distinguishing natural and computer generated images gets the support of the new convolutional neural networks and transformer based architectures that can give remarkable classification accuracies, they are seen to fail over the images that have undergone some post-processing operations usually performed to deceive the forensic algorithms, such as JPEG compression, gaussian noise, etc. This work proposes a robust approach towards distinguishing natural and computer generated images including both, computer graphics and GAN generated images using a fusion of two vision transformers where each of the transformer networks operates in different color spaces, one in RGB and the other in YCbCr color space. The proposed approach achieves high performance gain when compared to a set of baselines, and also achieves higher robustness and generalizability than the baselines. The features of the proposed model when visualized are seen to obtain higher separability for the classes than the input image features and the baseline features. This work also studies the attention map visualizations of the networks of the fused model and observes that the proposed methodology can capture more image information relevant to the forensic task of classifying natural and generated images.
Abstract（参考訳）: 自然画像とコンピュータ生成画像の分類における研究は、自然画像とコンピュータグラフィックス画像のみを考慮し、自然画像とGAN生成画像のみを考慮し、自然画像と生成された画像の両クラスを比較検討した。また、自然画像とコンピュータ画像とを区別するこの法医学的分類タスクは、顕著な分類精度を与える新しい畳み込みニューラルネットワークとトランスフォーマーベースのアーキテクチャのサポートを受けるが、JPEG圧縮やガウス雑音などの法医学的アルゴリズムを騙すために通常実行される後処理操作のいくつかの画像に対して失敗する。本研究は,コンピュータグラフィックスとGAN生成画像を含む自然画像とコンピュータ画像の区別に,各トランスフォーマーネットワークがそれぞれ異なる色空間で動作し,一方がRGBで,他方がYCbCr色空間で動作している2つの視覚トランスフォーマーを融合した手法を提案する。提案手法は,ベースラインの集合と比較して高い性能向上を実現するとともに,ベースラインよりも高い堅牢性と一般化性を実現する。提案モデルの特徴を可視化すると,入力画像特徴やベースライン特徴よりもクラス間の分離性が高いことが分かる。本研究は,融合モデルのネットワークのアテンションマップの可視化も研究し,本手法が自然画像と生成画像の分類を行う法医学的タスクに関連するより多くの画像情報を収集できることを観察する。

関連論文リスト

Novel computational workflows for natural and biomedical image processing based on hypercomplex algebras [49.81327385913137]
ハイパーコンプレックス画像処理は、代数的および幾何学的原理を含む統一パラダイムで従来の手法を拡張している。このワークル平均は、自然・生体画像解析のための四元数と2次元平面(四元数 - ピクセルを表す - を2次元平面に分割する)を分割する。提案手法は、画像の自動処理パイプラインの一部として、カラー外観(例えば、代替リフレクションやグレースケール変換)と画像コントラストを規制することができる。
論文参考訳（メタデータ） (2025-02-11T18:38:02Z)
Is JPEG AI going to change image forensics? [50.92778618091496]
ニューラル画像圧縮に基づく新しいJPEGAI標準の反法医学的効果について検討する。その結果,JPEG AIで処理したコンテンツの解析において,先行する法医学的検知器の性能が低下していることが示唆された。
論文参考訳（メタデータ） (2024-12-04T12:07:20Z)
Image-GS: Content-Adaptive Image Representation via 2D Gaussians [55.15950594752051]
本稿では,コンテンツ適応型画像表現であるImage-GSを提案する。異方性2Dガウスアンをベースとして、Image-GSは高いメモリ効率を示し、高速なランダムアクセスをサポートし、自然なレベルのディテールスタックを提供する。画像-GSの一般的な効率性と忠実性は、最近のニューラルイメージ表現と業界標準テクスチャ圧縮機に対して検証される。この研究は、機械認識、アセットストリーミング、コンテンツ生成など、適応的な品質とリソース制御を必要とする新しいアプリケーションを開発するための洞察を与えてくれることを願っている。
論文参考訳（メタデータ） (2024-07-02T00:45:21Z)
Transferable Learned Image Compression-Resistant Adversarial Perturbations [66.46470251521947]
敵対的攻撃は容易に画像分類システムを破壊し、DNNベースの認識タスクの脆弱性を明らかにする。我々は、学習した画像圧縮機を前処理モジュールとして利用する画像分類モデルをターゲットにした新しいパイプラインを提案する。
論文参考訳（メタデータ） (2024-01-06T03:03:28Z)
Towards Exploring Fairness in Visual Transformer based Natural and GAN Image Detection Systems [0.0]
本研究では、自然画像とGAN画像を分類する視覚変換器に基づく画像法科学アルゴリズムのバイアスについて検討する。提案研究は, 性別, 人種, 感情, 交叉領域の偏見を解析するために, 偏見評価コーパスを取得する。また、画像圧縮がモデルバイアスに与える影響を分析する。
論文参考訳（メタデータ） (2023-10-18T16:13:22Z)
Joint Learning of Deep Texture and High-Frequency Features for Computer-Generated Image Detection [24.098604827919203]
本稿では,CG画像検出のための深いテクスチャと高周波特徴を有する共同学習戦略を提案する。セマンティックセグメンテーションマップを生成して、アフィン変換操作を誘導する。原画像と原画像の高周波成分の組み合わせを、注意機構を備えたマルチブランチニューラルネットワークに供給する。
論文参考訳（メタデータ） (2022-09-07T17:30:40Z)
Distinguishing Natural and Computer-Generated Images using Multi-Colorspace fused EfficientNet [0.0]
実世界の画像鑑定のシナリオでは、画像生成のあらゆるカテゴリを考えることが不可欠である。 3つの効率ネットワークを並列に融合させることにより、マルチカラー融合効率ネットモデルを提案する。我々のモデルは、精度、後処理に対する堅牢性、および他のデータセットに対する一般化性の観点から、ベースラインよりも優れています。
論文参考訳（メタデータ） (2021-10-18T15:55:45Z)
Ensembling with Deep Generative Views [72.70801582346344]
生成モデルは、色やポーズの変化などの現実世界の変動を模倣する人工画像の「ビュー」を合成することができる。そこで本研究では, 画像分類などの下流解析作業において, 実画像に適用できるかどうかを検討する。 StyleGAN2を再生増強の源として使用し、顔の属性、猫の顔、車を含む分類タスクについてこの設定を調査します。
論文参考訳（メタデータ） (2021-04-29T17:58:35Z)
CNN Detection of GAN-Generated Face Images based on Cross-Band Co-occurrences Analysis [34.41021278275805]
最終世代のGANモデルでは、自然と視覚的に区別できない合成画像を生成することができる。本稿では、スペクトル帯域間の不整合を利用して、自然画像とGAN生成物を区別する手法を提案する。
論文参考訳（メタデータ） (2020-07-25T10:55:04Z)
Generative Hierarchical Features from Synthesizing Images [65.66756821069124]
画像合成の学習は、広範囲のアプリケーションにまたがって一般化可能な顕著な階層的な視覚的特徴をもたらす可能性があることを示す。生成的階層的特徴(Generative Hierarchical Feature, GH-Feat)と呼ばれるエンコーダが生成する視覚的特徴は、生成的タスクと識別的タスクの両方に強い伝達性を有する。
論文参考訳（メタデータ） (2020-07-20T18:04:14Z)
Pathological Retinal Region Segmentation From OCT Images Using Geometric Relation Based Augmentation [84.7571086566595]
本稿では,幾何学と形状の内在的関係を共同で符号化することで,従来のGANベースの医用画像合成法よりも優れた手法を提案する。提案手法は,取得手順の異なる画像を有する公開RETOUCHデータセット上で,最先端のセグメンテーション手法より優れている。
論文参考訳（メタデータ） (2020-03-31T11:50:43Z)
Discernible Image Compression [124.08063151879173]
本稿では、外観と知覚の整合性の両方を追求し、圧縮画像を作成することを目的とする。エンコーダ・デコーダ・フレームワークに基づいて,事前学習したCNNを用いて,オリジナル画像と圧縮画像の特徴を抽出する。ベンチマーク実験により,提案手法を用いて圧縮した画像は,その後の視覚認識・検出モデルでもよく認識できることが示された。
論文参考訳（メタデータ） (2020-02-17T07:35:08Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。