論文の概要: Dual Stream Computer-Generated Image Detection Network Based On Channel
Joint And Softpool
- arxiv url: http://arxiv.org/abs/2207.03205v1
- Date: Thu, 7 Jul 2022 10:19:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-08 14:05:47.185985
- Title: Dual Stream Computer-Generated Image Detection Network Based On Channel
Joint And Softpool
- Title(参考訳): チャネルジョイントとソフトプールを用いたデュアルストリームコンピュータ生成画像検出ネットワーク
- Authors: Ziyi Xi, Hao Lin, Weiqi Luo
- Abstract要約: 画像とコンピュータ生成グラフィックス(CG)を区別する方法は、デジタル画像法医学の分野において重要なトピックとなっている。
本稿では,チャネル継手とソフトプールに基づく二重ストリーム畳み込みニューラルネットワークを提案する。
SPL2018 と DsTok の実験により,提案手法が既存手法より優れていることが示された。
- 参考スコア(独自算出の注目度): 10.743766528498943
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the development of computer graphics technology, the images synthesized
by computer software become more and more closer to the photographs. While
computer graphics technology brings us a grand visual feast in the field of
games and movies, it may also be utilized by someone with bad intentions to
guide public opinions and cause political crisis or social unrest. Therefore,
how to distinguish the computer-generated graphics (CG) from the photographs
(PG) has become an important topic in the field of digital image forensics.
This paper proposes a dual stream convolutional neural network based on channel
joint and softpool. The proposed network architecture includes a residual
module for extracting image noise information and a joint channel information
extraction module for capturing the shallow semantic information of image. In
addition, we also design a residual structure to enhance feature extraction and
reduce the loss of information in residual flow. The joint channel information
extraction module can obtain the shallow semantic information of the input
image which can be used as the information supplement block of the residual
module. The whole network uses SoftPool to reduce the information loss of
down-sampling for image. Finally, we fuse the two flows to get the
classification results. Experiments on SPL2018 and DsTok show that the proposed
method outperforms existing methods, especially on the DsTok dataset. For
example, the performance of our model surpasses the state-of-the-art by a large
margin of 3%.
- Abstract(参考訳): コンピュータグラフィックス技術の発展に伴い、コンピュータソフトウェアによって合成された画像はますます写真に近づきつつある。
コンピュータグラフィックス技術は、ゲームや映画の分野では壮大な視覚的祝宴をもたらすが、大衆の意見を導き、政治的危機や社会不安を引き起こすために悪意を持つ人が利用することもある。
そのため,デジタル画像鑑識の分野では,cgとpgを区別する方法が重要な話題となっている。
本稿では,チャネル継手とソフトプールに基づく二重ストリーム畳み込みニューラルネットワークを提案する。
提案するネットワークアーキテクチャは、画像ノイズ情報を抽出する残留モジュールと、画像の浅い意味情報をキャプチャする結合チャネル情報抽出モジュールとを含む。
また,特徴抽出性を高めるために残差構造を設計し,残差フローにおける情報損失を低減する。
ジョイントチャネル情報抽出モジュールは、残余モジュールの情報補完ブロックとして使用できる入力画像の浅い意味情報を得ることができる。
ネットワーク全体がSoftPoolを使って、画像のダウンサンプリングによる情報損失を減らす。
最後に、2つのフローを融合して分類結果を得る。
SPL2018とDsTokの実験は、提案手法が既存の手法、特にDsTokデータセットよりも優れていることを示している。
例えば、私たちのモデルのパフォーマンスは最先端を3%という大きなマージンで上回っています。
関連論文リスト
- A Modular System for Enhanced Robustness of Multimedia Understanding
Networks via Deep Parametric Estimation [30.904034138920057]
マルチメディア理解タスクでは、破損したサンプルは、機械学習モデルにフィードされるとパフォーマンスが低下するので、重要な課題となる。
我々はSyMPIEを提案し、最小の計算コストで下流マルチメディア理解のための入力データを強化する。
私たちの重要な洞察は、ほとんどの入力汚職は、画像の色チャネルや小さなカーネルを持つ空間フィルタのグローバルな操作によってモデル化できるということです。
論文 参考訳(メタデータ) (2024-02-28T15:24:58Z) - A cross Transformer for image denoising [83.68175077524111]
直列ブロック(SB)、並列ブロック(PB)、残留ブロック(RB)を備えたクロストランスフォーマー(CTNet)を提案する。
CTNetは、実画像や合成画像のデノナイジングにおいて、一般的なデノナイジング法よりも優れている。
論文 参考訳(メタデータ) (2023-10-16T13:53:19Z) - Exploring Effective Mask Sampling Modeling for Neural Image Compression [171.35596121939238]
既存のニューラルイメージ圧縮手法の多くは、空間的冗長性を排除するために、ハイパープライアモデルやコンテキストモデルからのサイド情報に依存している。
近年の自然言語処理と高次視覚のための自己教師付き学習手法におけるマスクサンプリングモデルに着想を得て,ニューラル画像圧縮のための新しい事前学習戦略を提案する。
提案手法は,最先端画像圧縮法と比較して計算複雑性の低い競合性能を実現する。
論文 参考訳(メタデータ) (2023-06-09T06:50:20Z) - Learning Enriched Features for Fast Image Restoration and Enhancement [166.17296369600774]
本稿では,ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とする。
我々は、高解像度の空間的詳細を同時に保存しながら、複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
提案手法は,デフォーカス・デブロアリング,画像デノイング,超解像,画像強調など,さまざまな画像処理タスクに対して,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-04-19T17:59:45Z) - Reducing Redundancy in the Bottleneck Representation of the Autoencoders [98.78384185493624]
オートエンコーダは教師なしニューラルネットワークの一種であり、様々なタスクを解くのに使用できる。
本稿では,ボトルネック表現における特徴冗長性を明示的に罰する手法を提案する。
我々は,3つの異なるデータセットを用いた次元削減,MNISTデータセットを用いた画像圧縮,ファッションMNISTを用いた画像デノナイズという,さまざまなタスクにまたがってアプローチを検証した。
論文 参考訳(メタデータ) (2022-02-09T18:48:02Z) - A Compact Neural Network-based Algorithm for Robust Image Watermarking [30.727227627295548]
Invertible Watermarking Network (IWN) という,コンパクトニューラルネットワークを用いた新しいデジタル画像透かしソリューションを提案する。
我々のIWNアーキテクチャは、単一の可逆ニューラルネットワーク(INN)に基づいている。
電子透かし方式の堅牢性を高めるため,我々は単純だが効果的なビットメッセージ正規化モジュールを導入する。
論文 参考訳(メタデータ) (2021-12-27T03:20:45Z) - Image deblurring based on lightweight multi-information fusion network [6.848061582669787]
画像デブロアリングのための軽量多情報融合ネットワーク(LMFN)を提案する。
符号化段階では、画像特徴は、マルチスケール情報抽出および融合のための様々な小規模空間に還元される。
その後、デコード段階で蒸留ネットワークが使用され、ネットワークは残留学習から最も利益を得ます。
私たちのネットワークは、少ないパラメータで最新の画像破壊結果を達成し、モデルの複雑さで既存の方法を上回ることができます。
論文 参考訳(メタデータ) (2021-01-14T00:37:37Z) - Designing and Training of A Dual CNN for Image Denoising [117.54244339673316]
クリーンなイメージを復元するためのDual denoising Network(DudeNet)を提案する。
DudeNetは4つのモジュールで構成されている。機能抽出ブロック、拡張ブロック、圧縮ブロック、再構築ブロックである。
論文 参考訳(メタデータ) (2020-07-08T08:16:24Z) - Modeling Lost Information in Lossy Image Compression [72.69327382643549]
ロスシー画像圧縮は、デジタル画像の最もよく使われる演算子の1つである。
Invertible Lossy Compression (ILC) と呼ばれる新しい非可逆的フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T04:04:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。